Elementos Cuantitativos de Investigación en las Ciencias ...

97
1 Elementos Cuantitativos de Investigación en las Ciencias Sociales. Héctor Ormeño Campos 22 de diciembre, 2016

Transcript of Elementos Cuantitativos de Investigación en las Ciencias ...

Page 1: Elementos Cuantitativos de Investigación en las Ciencias ...

1

Elementos Cuantitativos de

Investigación en las Ciencias Sociales.

Héctor Ormeño Campos

22 de diciembre, 2016

Page 2: Elementos Cuantitativos de Investigación en las Ciencias ...

2

Registro de Propiedad Intelectual N° A-273337 Héctor Ormeño Campos Diciembre 2016, Santiago de Chile.

Page 3: Elementos Cuantitativos de Investigación en las Ciencias ...

3

Contenido 1. Dimensión cuantitativa de los fenómenos sociales. .................................................................................... 5 2. Dimensión cuantitativa en los órganos del sector público. ........................................................................ 5 3. Las matemáticas necesarias. ...................................................................................................................... 5

3.1. Fracciones. .............................................................................................................................................. 5 3.2. Exponentes. .............................................................................................................................................. 7 3.3. Exponentes Fraccionarios. ...................................................................................................................... 7 3.4. Operaciones algebraicas. ........................................................................................................................ 8 3.5. Factorización. ........................................................................................................................................ 10 3.6. Ecuaciones. ............................................................................................................................................ 11 3.7. Funciones. ............................................................................................................................................. 14 3.8. Derivadas. ............................................................................................................................................. 20

4. Estadística Descriptiva ............................................................................................................................. 29 4.1. Introducción .......................................................................................................................................... 29

4.1.1. Tipos de Variables ...................................................................................................................... 29 4.1.2. Algunas herramientas de medición............................................................................................. 29 4.1.3. Distribuciones en la organización de datos............................................................................... 31 4.1.4. Rango Percentil. ......................................................................................................................... 32

4.2. Medidas de tendencia central: ........................................................................................................ 33 4.2.1. Medidas de Tendencia Central en Frecuencias de Distribución Simple .................................... 35 4.2.2. Medidas de Tendencia Central en Datos Agrupados. ................................................................ 36

4.3. Medidas de dispersión: ................................................................................................................... 37 4.3.1. Medidas de Dispersión Frecuencias de Distribución Simple. .................................................... 39 4.3.2. Medidas de Dispersión en Datos Agrupados.............................................................................. 41

4.4. Distribución normal. ....................................................................................................................... 41 4.4.1. Probabilidades en la curva normal. ........................................................................................... 43

4.5. Otros conceptos de relevancia en la Estadística Descriptiva. ........................................................ 44 5. Medidas de Asociación. ............................................................................................................................ 49

5.1. Intuición de las medidas de asociación. ......................................................................................... 49 5.2. Estadísticos de asociación (Covarianza, Coef. de Correlación). ................................................... 49

5.2.1. Covarianza ................................................................................................................................. 50 5.2.2. Coeficiente de Correlación ......................................................................................................... 52

5.3. Otros estadísticos de asociación. .................................................................................................... 57 5.3.1. Coeficiente de correlación de Spearman ........................................................................................ 57 5.3.2. Aplicaciones con medidas de asociación. ....................................................................................... 59

6. Elementos de Inferencia Estadística ......................................................................................................... 62 6.1. El porqué del uso de muestras. ....................................................................................................... 62 6.2. Métodos de Muestreo. ..................................................................................................................... 62 6.3. Error de muestreo. .......................................................................................................................... 63 6.4. Distribución normal en la inferencia. ............................................................................................. 63

Page 4: Elementos Cuantitativos de Investigación en las Ciencias ...

4

6.5. Error estándar de la media. ............................................................................................................ 64 6.6. Estimación de proporciones............................................................................................................ 64

7. Test de Hipótesis. ..................................................................................................................................... 67 7.1. Test estadísticos relevantes ............................................................................................................. 67 7.2. Test de Diferencia de Medias .......................................................................................................... 67

7.2.1. Test de Diferencia de Medias: muestras pequeñas ..................................................................... 69 7.2.2. Test de Diferencia de Medias: tamaños muestrales distintos. .................................................... 69

7.3. Test Chi cuadrado ........................................................................................................................... 70 8. La Programación Lineal. ......................................................................................................................... 73

8.1. Problema de Programación Lineal. ...................................................................................................... 73 8.2. Solución con Método Gráfico. ............................................................................................................... 73

9. Introducción al Modelo de Regresión Lineal. .......................................................................................... 79 9.1. Modelo de Mínimos Cuadrados Ordinarios (MCO) ............................................................................. 79 9.2. Supuestos del MCO. .............................................................................................................................. 80 9.3. Estimación por MCO. ............................................................................................................................ 80

10. Modelo de Regresión Lineal: Ajuste e Inferencia. ................................................................................... 84 10.1. Bondad de Ajuste (R2).......................................................................................................................... 84 10.2. Test estadísticos. .................................................................................................................................. 85

10.2.1. Test de hipótesis: Coeficientes individuales. ................................................................................ 85 10.2.2. P-value. ......................................................................................................................................... 86

11. Modelo de Regresión Multivariado. ......................................................................................................... 89 11.1. Test de hipótesis: Significancia Global. .............................................................................................. 89 11.2. Test de Significancia Global: fórmula alternativa. ............................................................................. 90 11.4. Otras formas funcionales. .................................................................................................................... 92

Page 5: Elementos Cuantitativos de Investigación en las Ciencias ...

5

1. Dimensión cuantitativa de los fenómenos sociales. ¿Por qué dimensión? En este curso llamaremos dimensión cuantitativa de los fenómenos sociales a todo aquello que podemos medir respecto a un fenómeno de interés que sucede entre las personas, en los grupos, y en la sociedad, y que se estudia debido a la relevancia que tiene en los últimos. Aún cuando no se puedan medir directamente dichos fenómenos, es posible encontrar una forma de cuantificar su evolución (Proxy). ¿Por qué medir? Es importante medir si el fenómeno es de relevancia, por sus consecuencias sobre la vida de las personas, grupos, y/o sociedad. A su vez, al medir, podemos comprender el comportamiento de dicho fenómeno, sus particularidades, y ver cómo cambia a partir de la interacción con otros fenómenos. Un estado superior del medir es la conformación del modelo, como una interrelación cuantitativa entre diferentes variables. El modelo proviene de la teoría y su testeo empírico. Este modelo es una propuesta para comprender el fenómeno, por lo que no quiere decir que corresponde a la verdad absoluta.

2. Dimensión cuantitativa en los órganos del sector público. La disciplina de la administración pública se nutre de distintas vertientes entre las que se tiene el derecho, la economía, las finanzas, la ciencia política, entre otras, algunas de las cuales tiene una fuerte vertiente de carácter cuantitativo. A su vez, esta dimensión se observa tanto al interior como en el exterior de los órganos de la administración del estado. En el interior es necesario llevar el control de las finanzas, efectuar control de gestión, analizar los insumos y elegir la mejor combinación para llevar a cabo proyectos. En el exterior existe información de suma relevancia, pues consiste en información que permite dilucidar la demanda por recursos públicos, bienes públicos y regulaciones, entre otros.

3. Las matemáticas necesarias. Esta sección considera a grandes rasgos algunos elementos matemáticos necesarios para comprender la estadística. Entre estos se encuentran las fracciones, exponentes, ecuaciones, funciones y derivadas, entre otros, elementos importantes en la estadística y las herramientas cuantitativas en general. Gran parte de este capítulo se basa en Arya et al (2009). Los ejercicios y ejemplos son citados cuando corresponden a Arya et al, u a otra obra. El objetivo es invitar al lector a profundizar el conocimiento específico en dichos libros.

3.1. Fracciones. Una fracción se define como el producto de a y el inverso de b (Arya et al, 2009), esto es: 𝑎𝑎

𝑏𝑏= 𝑎𝑎𝑏𝑏−1 donde 𝑏𝑏 ≠ 0 (3.1)

Se pueden realizar una serie de operaciones con las fracciones, las que se definen a continuación. Multiplicación de fracciones. 𝑎𝑎

𝑏𝑏× 𝑐𝑐

𝑑𝑑= 𝑎𝑎𝑐𝑐

𝑏𝑏𝑑𝑑

Page 6: Elementos Cuantitativos de Investigación en las Ciencias ...

6

División de fracciones. 𝑎𝑎

𝑏𝑏÷ 𝑐𝑐

𝑑𝑑= 𝑎𝑎

𝑏𝑏× 𝑑𝑑

𝑐𝑐= 𝑎𝑎𝑑𝑑

𝑏𝑏𝑐𝑐

Cancelación de factores comunes.

𝑎𝑎𝑐𝑐𝑏𝑏𝑐𝑐

= 𝑎𝑎𝑏𝑏

Adición y sustracción.

𝑎𝑎𝑐𝑐

+ 𝑏𝑏𝑐𝑐

= 𝑎𝑎+𝑏𝑏𝑐𝑐

𝑎𝑎

𝑐𝑐− 𝑏𝑏

𝑐𝑐= 𝑎𝑎−𝑏𝑏

𝑐𝑐

𝑎𝑎

𝑐𝑐+ 𝑏𝑏

𝑑𝑑= 𝑎𝑎𝑑𝑑+𝑏𝑏𝑐𝑐

𝑐𝑐𝑑𝑑

𝑎𝑎

𝑐𝑐− 𝑏𝑏

𝑑𝑑= 𝑎𝑎𝑑𝑑−𝑏𝑏𝑐𝑐

𝑐𝑐𝑑𝑑

Ejemplos: A continuación se revisan algunos ejemplos de operaciones con fracciones (Budnick, 2007: A-16), donde la expresión a la izquierda del signo igual corresponde al ejercicio propuesto.

a) 58

+ 320

= 100+24160

= 124160

= 4𝑥𝑥314𝑥𝑥40

= 3140

b) 34𝑥𝑥− 5

6𝑥𝑥2= 18𝑥𝑥2−20𝑥𝑥

24𝑥𝑥3= 9𝑥𝑥−10

12𝑥𝑥2

Sin embargo la última expresión también se puede resolver acudiendo al mínimo común denominador, el que corresponde en este caso a 12𝑥𝑥2. De esta forma:

34𝑥𝑥− 5

6𝑥𝑥2= 9𝑥𝑥−10

12𝑥𝑥2

c) 3

𝑥𝑥−1− 5𝑥𝑥

𝑥𝑥+1+ 𝑥𝑥2

𝑥𝑥2−1= 3

𝑥𝑥−1− 5𝑥𝑥

𝑥𝑥+1+ 𝑥𝑥2

(𝑥𝑥+1)(𝑥𝑥−1)

= 3(𝑥𝑥+1)−5𝑥𝑥(𝑥𝑥−1)

(𝑥𝑥−1)(𝑥𝑥+1) + 𝑥𝑥2

(𝑥𝑥+1)(𝑥𝑥−1) = 3(𝑥𝑥+1)−5𝑥𝑥(𝑥𝑥−1)+𝑥𝑥2

(𝑥𝑥−1)(𝑥𝑥+1) = 3𝑥𝑥+3−5𝑥𝑥2+5𝑥𝑥+𝑥𝑥2

(𝑥𝑥+1)(𝑥𝑥−1) = −4𝑥𝑥2+8𝑥𝑥+3

(𝑥𝑥+1)(𝑥𝑥−1) = −4𝑥𝑥2+8𝑥𝑥+3𝑥𝑥2−1

d) 𝑥𝑥−110

15𝑥𝑥2−1

= (𝑥𝑥−1)15(𝑥𝑥2−1)10

= (𝑥𝑥−1)3(𝑥𝑥−1)(𝑥𝑥+1)2

= 32(𝑥𝑥+1)

e) −51234

= − 512

43

= −2036

= −59

Page 7: Elementos Cuantitativos de Investigación en las Ciencias ...

7

f) (3𝑥𝑥2/4)

(9𝑥𝑥/2)= 3𝑥𝑥2

429𝑥𝑥

= 𝑥𝑥312

= 𝑥𝑥6

g) 1− 2𝑥𝑥4𝑥𝑥

= (𝑥𝑥−2)𝑥𝑥

𝑥𝑥4

= 𝑥𝑥−24

3.2. Exponentes. De acuerdo a Arya et al (2009), “si m es un entero positivo, entonces 𝑎𝑎𝑚𝑚 se define como el producto de m factores a multiplicados a la vez”, esto es: 𝑎𝑎𝑚𝑚 = 𝑎𝑎 × 𝑎𝑎 × 𝑎𝑎 × … × 𝑎𝑎 (3.2) Donde a corresponde a la base y m al exponente, esto es, en 23, 2 es la base, 3 el exponente, y el resultado es 23=2x2x2=8. Las propiedades de los exponentes se detallan a continuación. Propiedad 1. 𝑎𝑎𝑚𝑚𝑎𝑎𝑛𝑛 = 𝑎𝑎𝑚𝑚+𝑛𝑛 Propiedad 2. 𝑎𝑎𝑚𝑚

𝑎𝑎𝑛𝑛= 𝑎𝑎𝑚𝑚−𝑛𝑛 siempre que 𝑎𝑎 ≠ 0

Propiedad 3. (𝑎𝑎𝑚𝑚)𝑛𝑛 = 𝑎𝑎𝑚𝑚𝑛𝑛 Propiedad 4. (𝑎𝑎𝑏𝑏)𝑚𝑚 = 𝑎𝑎𝑚𝑚𝑏𝑏𝑚𝑚 Propiedad 5. �𝑎𝑎

𝑏𝑏�𝑚𝑚

= 𝑎𝑎𝑚𝑚

𝑏𝑏𝑚𝑚

3.3. Exponentes Fraccionarios. De acuerdo a Arya et al (2009), se tiene un exponente fraccionario cuando la base está elevada a una fracción, esto es:

𝑎𝑎𝑚𝑚𝑛𝑛 = �𝑎𝑎

1𝑛𝑛�

𝑚𝑚

Donde n es un entero positivo, m un entero distinto de cero y a un número real.

Page 8: Elementos Cuantitativos de Investigación en las Ciencias ...

8

Teorema. Si existe 𝑎𝑎

𝑚𝑚𝑛𝑛 , entonces 𝑎𝑎

𝑚𝑚𝑛𝑛 = (𝑎𝑎𝑚𝑚)1/𝑛𝑛 (3.3)

Ejemplos de exponentes: A continuación se presentan algunos ejemplos de exponentes y exponentes fraccionarios, incluyendo operaciones con radicales (Budnick, 2007: A-19).

a) √42

= 4 b) √9 = 3 c) √−273 = �(−1)3𝑥𝑥3𝑥𝑥33 = �(−1)333 = −3 d) √−2435 = −3

e) �𝑥𝑥12�4

= 𝑥𝑥2

f) 𝑥𝑥58

𝑥𝑥34

= 𝑥𝑥58 − 34 = 𝑥𝑥

20−2432 = 𝑥𝑥− 18 = 1

𝑥𝑥18

g) �𝑥𝑥23�−3

= 𝑥𝑥−63 = 𝑥𝑥−2 = 1

𝑥𝑥2

h) �√−83 �3

= −8

i) �(−1)125

3= −1

5

j) 49− 12 = 1√49

= 1√72

= 17

3.4. Operaciones algebraicas. Las expresiones algebraicas están compuestas por términos, los cuales a su vez están compuestos por coeficientes y partes literales. Por ejemplo, la expresión 2x3+ 4x4, está compuesta por dos términos, el primero de los cuales tiene como coeficiente 2, y parte literal x3. Una expresión algebraica puede compuesta por un término (monomio), dos términos (binomio), o tres términos (trinomio). Generalizando, una expresión con más de un término es un multinomio (Arya et al, 2009). Adición y sustracción. 𝑎𝑎𝑥𝑥 + 𝑏𝑏𝑥𝑥 = 𝑥𝑥(𝑎𝑎 + 𝑏𝑏) 𝑎𝑎𝑎𝑎 − 𝑏𝑏𝑎𝑎 = 𝑎𝑎(𝑎𝑎 − 𝑏𝑏) Multiplicación de expresiones 𝑎𝑎(𝑥𝑥 + 𝑦𝑦) = 𝑎𝑎𝑥𝑥 + 𝑎𝑎𝑦𝑦 (𝑎𝑎 + 𝑏𝑏)(𝑥𝑥 + 𝑦𝑦) = 𝑎𝑎𝑥𝑥 + 𝑎𝑎𝑦𝑦 + 𝑏𝑏𝑥𝑥 + 𝑏𝑏𝑦𝑦 La multiplicación de expresiones nos permite considerar ciertos productos frecuentes, denominados “productos notables”, tales como:

Page 9: Elementos Cuantitativos de Investigación en las Ciencias ...

9

(𝑥𝑥 + 𝑎𝑎)(𝑥𝑥 + 𝑏𝑏) = 𝑥𝑥2 + (𝑎𝑎 + 𝑏𝑏)𝑥𝑥 + 𝑎𝑎𝑏𝑏 (𝑥𝑥 + 𝑎𝑎)(𝑥𝑥 + 𝑎𝑎) = (𝑥𝑥 + 𝑎𝑎)2 = 𝑥𝑥2 + 2𝑎𝑎𝑥𝑥 + 𝑎𝑎2 (Binomio suma al cuadrado) (𝑥𝑥 − 𝑎𝑎)(𝑥𝑥 − 𝑎𝑎) = 𝑥𝑥2 − 2𝑎𝑎𝑥𝑥 + 𝑎𝑎2 (Binomio diferencia al cuadrado) (𝑥𝑥 + 𝑎𝑎)(𝑥𝑥 − 𝑎𝑎) = 𝑥𝑥2 − 𝑎𝑎2 (Suma por la diferencia) (𝑥𝑥 + 𝑎𝑎)3 = 𝑥𝑥3 + 3𝑥𝑥2𝑎𝑎 + 3𝑥𝑥𝑎𝑎2 + 𝑎𝑎3 (Binomio suma al cubo) = 𝑥𝑥3 + 𝑎𝑎3 + 3𝑥𝑥𝑎𝑎(𝑥𝑥 + 𝑎𝑎) (𝑎𝑎 − 𝑏𝑏)3 = 𝑎𝑎3 − 3𝑎𝑎2𝑏𝑏 + 3𝑎𝑎𝑏𝑏2 − 𝑏𝑏3 (Binomio diferencia al cubo) 𝑎𝑎3 + 𝑏𝑏3 = (𝑎𝑎 + 𝑏𝑏)(𝑎𝑎2 − 𝑎𝑎𝑏𝑏 + 𝑏𝑏2) (Suma de cubos) 𝑎𝑎3 − 𝑏𝑏3 = (𝑎𝑎 − 𝑏𝑏)(𝑎𝑎2 + 𝑎𝑎𝑏𝑏 + 𝑏𝑏2) (Diferencia de cubos) La factorización nos lleva a formular productos más complejos, como los siguientes: 𝑎𝑎4 − 𝑏𝑏4 = (𝑎𝑎2 − 𝑏𝑏2)(𝑎𝑎2 + 𝑏𝑏2) = (𝑎𝑎 − 𝑏𝑏)(𝑎𝑎 + 𝑏𝑏)(𝑎𝑎2 + 𝑏𝑏2) 𝑎𝑎5 + 𝑏𝑏5 = (𝑎𝑎 + 𝑏𝑏)(𝑎𝑎4 − 𝑎𝑎3𝑏𝑏 + 𝑎𝑎2𝑏𝑏2 − 𝑎𝑎𝑏𝑏3 + 𝑏𝑏4 ) 𝑎𝑎4 + 𝑏𝑏4 = (𝑎𝑎2 + √2𝑎𝑎𝑏𝑏 + 𝑏𝑏2 )(𝑎𝑎2 − √2𝑎𝑎𝑏𝑏 + 𝑏𝑏2 ) División de expresiones La división de expresiones se puede ejemplificar a través del siguiente ejercicio, donde 𝑐𝑐 ≠ 0. 𝑎𝑎+𝑏𝑏

𝑐𝑐 = 𝑎𝑎

𝑐𝑐+ 𝑏𝑏

𝑐𝑐

𝑎𝑎−𝑏𝑏

𝑤𝑤 = 𝑎𝑎

𝑤𝑤− 𝑏𝑏

𝑤𝑤

Sin embargo, en la realidad pueden existir divisiones de mayor complejidad. Supongamos, de acuerdo a Arya et al (2009), que pretendo dividir 23 − 11𝑥𝑥2 + 2𝑥𝑥3 en 2𝑥𝑥 − 3. La metodología a seguir es la siguiente. En primer lugar, se debe ordenar el dividendo de forma descendente, al igual que el divisor, de la forma: (2𝑥𝑥3 − 11𝑥𝑥2 + 0𝑥𝑥 + 23) ÷ (2𝑥𝑥 − 3) Para solucionar dicha división hay que seguir una serie de pasos, que se detallan a continuación.

a. Primero se debe dividir el primer término del dividendo por el primer término del divisor, lo que da como resultado 2𝑥𝑥

3

2𝑥𝑥= 𝑥𝑥2, y que corresponde al primero término de la línea (1).

b. En segundo lugar, se debe multiplicar el 𝑥𝑥2 por el primer termino del divisor, 𝑥𝑥2 × 2𝑥𝑥 =2𝑥𝑥3, que es el primer término de la línea (3), y luego 𝑥𝑥2 por el segundo término del divisor, 𝑥𝑥2 × (−3) = −3𝑥𝑥2, que es el segundo termino de la línea (3).

Page 10: Elementos Cuantitativos de Investigación en las Ciencias ...

10

c. A continuación se le resta a la línea (2) la línea (3), dando como resultado la línea (4): 0 − 8𝑥𝑥2 + 0𝑥𝑥 + 23.

d. A continuación, se debe dividir el primer término de la línea (4) por el primer término del divisor, dando como resultado −8𝑥𝑥

2

2𝑥𝑥= −4𝑥𝑥, y que corresponde al segundo término de la

línea (1). e. A continuación, se debe multiplicar -4x por el primer término del divisor, −4𝑥𝑥 × 2𝑥𝑥 =

−8𝑥𝑥2, que es el primer termino de la línea (5), y luego −4𝑥𝑥 por el segundo término del divisor, −4𝑥𝑥 × (−3) = 12𝑥𝑥, que es el segundo término de la línea (5), y el proceso de la misma forma hacia adelante.

𝑥𝑥2 − 4𝑥𝑥 − 6 U (1) (2𝑥𝑥 − 3)|2𝑥𝑥3 − 11𝑥𝑥2 + 0𝑥𝑥 + 23 (2) 2𝑥𝑥3 − 3𝑥𝑥2 (3) 0 − 8𝑥𝑥2 + 0𝑥𝑥 + 23 U (4) −8𝑥𝑥2 + 12𝑥𝑥 U (5) 0 − 12𝑥𝑥 + 23 (6) −12𝑥𝑥 + 18 U (7) 0 + 5 (8) Una vez realizado el proceso, la solución es igual a la siguiente expresión, donde el coeficiente se divide por uno, y el residuo (que es 5 en este caso) se divide por el divisor.

𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝑑𝑑𝐷𝐷𝑛𝑛𝑑𝑑𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷

= 𝐶𝐶𝐶𝐶𝑐𝑐𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶 + 𝑅𝑅𝐷𝐷𝐷𝐷𝐷𝐷𝑑𝑑𝑅𝑅𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷

(3.4)

�2𝑥𝑥3−11𝑥𝑥2+0𝑥𝑥+23�(2𝑥𝑥−3) = 𝑥𝑥2 − 4𝑥𝑥 − 6 + 5

(2𝑥𝑥−3)

3.5. Factorización. A continuación revisaremos algunas estrategias útiles de factorización, las que por su carácter general, pueden ser de gran utilidad. Ejemplo 1: Suponga la siguiente expresión, 𝑥𝑥2 − 2. Una forma de factorizar dicha expresión es la siguiente, donde como se verá, se plante la diferencia como una suma por diferencias. 𝑥𝑥2 − 2 = 𝑥𝑥2 − √22 = �𝑥𝑥 − √2�(𝑥𝑥 + √2) Ejemplo 2: Es usual encontrarse con expresiones como la siguiente, en la cual la factorización es directa. 𝑥𝑥2 + 3𝑥𝑥 + 2 = (𝑥𝑥 + 1)(𝑥𝑥 + 2) 𝑥𝑥2 − 3𝑥𝑥 + 2 = (𝑥𝑥 − 1)(𝑥𝑥 − 2) 𝑥𝑥2 + 2𝑥𝑥 − 3 = (𝑥𝑥 + 3)(𝑥𝑥 − 1) Como se puede observar, la resolución de estas factorizaciones es una consecuencia directa del producto notable (𝑥𝑥 + 𝑎𝑎)(𝑥𝑥 + 𝑏𝑏) = 𝑥𝑥2 + (𝑎𝑎 + 𝑏𝑏)𝑥𝑥 + 𝑎𝑎𝑏𝑏. En el primer caso (a + b) es igual a 1+2=3, mientras que ab es igual a 2.

Page 11: Elementos Cuantitativos de Investigación en las Ciencias ...

11

Ejemplo 3: Sin embargo, a veces nos podemos encontrar con factorizaciones más complejas, como es el caso de: 3𝑥𝑥2 + 11𝑥𝑥 + 6 Como se puede observar, en este caso la ecuación surge de la forma más general: 𝑚𝑚𝑥𝑥2 + 𝑝𝑝𝑥𝑥 + 𝑞𝑞

Donde m, p y q son constantes distintas de cero y 𝑚𝑚 ≠ 1 o −1. Para solucionar este problema, la clave es encontrar dos factores del producto mq que sumen p. En este caso mq=3x6=18, y dos factores de mq que sumen p pueden ser 9x2=18. Ahora, se procede de la siguiente forma: 3𝑥𝑥2 + (9 + 2)𝑥𝑥 + 6 3𝑥𝑥2 + 9𝑥𝑥 + 2𝑥𝑥 + 6 3𝑥𝑥(𝑥𝑥 + 3) + 2(𝑥𝑥 + 3) (3𝑥𝑥 + 2)(𝑥𝑥 + 3)

3.6. Ecuaciones. Una ecuación “es una proposición que expresa la igualdad de dos expresiones algebraicas” (Arya et al, 2009). Ejemplos de ecuaciones son: 2𝑥𝑥 − 3 = 9 − 𝑥𝑥 𝑦𝑦2 − 5𝑦𝑦 = 6 − 4𝑦𝑦 𝑎𝑎

1−𝐷𝐷= 𝑠𝑠

En general, “un valor de la variable que haga que la ecuación sea una proposición cierta, se denomina raíz o solución de la ecuación”. Para encontrar dichas raíces es menester resolver la ecuación. En esta resolución se puede llevar a cabo a través de principios (Arya et al, 2009):

a. Principio de adición: se puede sumar o restar cualquier constante o expresión algebraica que incluya la variable a ambos lados de la ecuación.

b. Principio de multiplicación: se puede multiplicar o dividir ambos lados de la ecuación por cualquier constante distinta de cero o cualquier expresión distinta de cero que incluya la variable.

Ejemplo: 5𝑥𝑥 − 3 = 2𝑥𝑥 + 9 3𝑥𝑥 = 12 Solución: x=4. 3.6.1. Ecuaciones lineales. La forma estándar de una ecuación lineal corresponde a (Arya et al, 2009): 𝑎𝑎𝑥𝑥 + 𝑏𝑏 = 0 (3.5)

Page 12: Elementos Cuantitativos de Investigación en las Ciencias ...

12

Con 𝑎𝑎 ≠ 0, y a, b constantes. La solución de la ecuación es 𝑥𝑥 = −𝑏𝑏/𝑎𝑎. Un ejemplo de ecuación lineal puede ser: 2𝑥𝑥 + 3 = 0 Donde 𝑎𝑎 = 2 y 𝑏𝑏 = 3, por lo que la solución de la ecuación es 𝑥𝑥 = −3/2 . Más adelante se analizaran formas más complejas de ecuaciones lineales. 3.6.2. Ecuaciones Cuadráticas. La forma estándar de una ecuación cuadrática corresponde a (Arya et al, 2009): 𝑎𝑎𝑥𝑥2 + 𝑏𝑏𝑥𝑥 + 𝑐𝑐 = 0 (3.6) Done a, b, y c son constantes. La solución de una ecuación cuadrática se puede realizar a través de dos formas. Por ejemplo, se tiene la siguiente expresión, cuya factorización nos conduce a las raíces de dicha ecuación. 3𝑥𝑥2 + 5𝑥𝑥 − 2 = 0 3𝑥𝑥2 + (6 − 1)𝑥𝑥 − 2 = 0 3𝑥𝑥2 + 6𝑥𝑥 − 𝑥𝑥 − 2 = 0 3𝑥𝑥(𝑥𝑥 + 2) − (𝑥𝑥 + 2) = 0 (3𝑥𝑥 − 1)(𝑥𝑥 + 2) = 0 Por lo que las raíces de la ecuación son 𝑥𝑥 = 1/3, y 𝑥𝑥 = −2. Sin embargo, también podemos usar la formula cuadrática. Si se tiene: 𝑎𝑎𝑥𝑥2 + 𝑏𝑏𝑥𝑥 + 𝑐𝑐 = 0 con 𝑎𝑎 ≠ 0 Entonces, las raíces se obtienen de la ecuación (3.7).

𝑥𝑥 = −𝑏𝑏±√𝑏𝑏2−4𝑎𝑎𝑐𝑐2𝑎𝑎

(3.7) Por ejemplo, para la ecuación anterior, la solución se obtiene:

𝑥𝑥 = −5±�52−4(3(−2))2(3)

𝑥𝑥 = −5±√25+246

𝑥𝑥1 = 13 ^ 𝑥𝑥2 = −2

3.6.3. Sistemas de Ecuaciones. Las ecuaciones permiten resolver una serie de problemas matemáticos. Sin embargo, al analizar algunos fenómenos podemos ver que existen una serie de problemas en los cuales existe más de un ecuación. A continuación se revisan algunos ejemplos de sistemas de ecuaciones.

Page 13: Elementos Cuantitativos de Investigación en las Ciencias ...

13

Ejemplo 1. Un sistema de ecuaciones puede ser el siguiente (Arya et al, 2009): 𝑥𝑥 + 𝑦𝑦 = 3 3𝑥𝑥 − 𝑦𝑦 = 1 La primera ecuación implica que x=3-y, por lo que reemplazando en la segunda: 3(3 − 𝑦𝑦) − 𝑦𝑦 = 1 9 − 3𝑦𝑦 − 𝑦𝑦 = 1 9 − 4𝑦𝑦 = 1 4𝑦𝑦 = 8 Lo que implica que y=2 y x=1. Ejemplo 2. Usted puede tener el siguiente sistema de ecuaciones con dos variables, y y P.

PyPy

θγβα

+=+=

A continuación se muestra la resolución del sistema.

αγθβθγβα−=−+=+

PPPP

αγθβ −=− )(P

)( θβαγ

−−

=P

Dado que se tiene el valor de P expresado en parámetros, se puede obtener el valor de y reemplazando en cualquiera de las dos ecuaciones.

Py βα +=

)()(

θβαγβα−−

+=y

)()()(

θβαγβθβα

−−+−

=y

)( θββαβγαθαβ

−−+−

=y

)( θββγαθ

−+−

=y

)( θβαθβγ

−−

=y

De hecho, podemos comprobar si el par (y, P) corresponde a los valores correctos. Para esto podemos reemplazar directamente en la primera ecuación del sistema:

Py βα +=

)()(

)( θβαγβα

θβαθβγ

−−

+=−−

Page 14: Elementos Cuantitativos de Investigación en las Ciencias ...

14

)()()(

)( θβαγβθβα

θβαθβγ

−−+−

=−−

)()( θββαβγαθαβ

θβαθβγ

−−+−

=−−

)()( θββγαθ

θβαθβγ

−+−

=−−

)()( θβαθβγ

θβαθβγ

−−

=−−

Ejemplo 3. De lo anterior se puede ver que un sistema de ecuaciones se puede resolver de diferentes formas, sin embargo, es importante dejar el sistema de una forma en la cual se puede resolver de forma simple. Analice el siguiente ejercicio.

11

111

2201

1200

12

−−

−−−

+=

−=

xy

yx

En este caso, primero debemos expresar en forma más simple el sistema, esto es:

xyyx

2202002+=−=

Ahora se procede a resolver el sistema. Una forma simple de hacerlo es reemplazar la primera ecuación (2x=200-y) directamente en la segunda, pues esta última tiene textualmente, como segundo miembro del lado derecho, a 2x.

1102202

220)200(20

220

===+

−+=+=

yy

yyyy

xy

Dado que y=110, entonces x es igual a 45.

3.7. Funciones. Una función “es una regla matemática que asigna a cada valor de entrada uno y solo un valor de salida” (Budnick, 2007: 143). En forma adicional, la función considera dominio y rango. El dominio corresponde al conjunto de todos los valores de entrada, mientras que el rango, a todos los valores de salida. De la definición anterior se deriva que si dos valores del dominio, tienen cada uno, un valor independiente en el rango, existe una función. Si dos valores del dominio tienen el mismo valor en el rango, también estamos en presencia de una función. Pero si un valor del dominio, tienen dos valores asociados en el rango, la relación expuesta no corresponde a una función.

Page 15: Elementos Cuantitativos de Investigación en las Ciencias ...

15

Si se tiene una función, la expresamos mediante la forma y=f(x), donde y es función de x. En otras palabras, y depende de los valores que tome la variable x. Esta definición es interesante desde el punto de las ciencias sociales, toda vez que en esta es importante analizar la relación de dependencia que existe entre dos variables, tales como los efectos de la pobreza sobre el grado de desnutrición en las personas. En este punto, es importante destacar que las funciones pueden tomar distintas formas. De las ecuaciones, sabemos que pueden existir ecuaciones lineales y cuadráticas, entre otras. Con las funciones sucede lo mismo, pues la relación entre la variable x e y puede ser lineal, o no lineal. 3.7.1. Funciones Lineales. Ejemplo 1: Si tomamos el ejemplo 3 de la sección anterior, segunda ecuación, sabemos que esta corresponde a y = 20 + 2x. Si suponemos que dicha ecuación es una expresión concreta de y=f(x), estamos reconociendo que la variable y depende de x, o que en otras palabras, la variable dependiente es y, mientras que la independiente es x. Es más, de la forma estándar de la ecuación lineal, sabemos que esta expresión efectivamente corresponde a una ecuación lineal, donde b=20 y a=2. En el lenguaje de las funciones b corresponde al intercepto, o el valor que toma y cuando x=0, y a es la pendiente. En este caso se sabe que la relación entre las variables es lineal, pues su forma corresponde a una función lineal, y por otro lado que la relación entre las variables es positiva, pues a medida que aumenta x aumenta y. El grafico de dicha función se observa en la figura 3.1, en la cual el eje de las abscisas corresponde al eje x, mientras que el eje de las ordenadas ordenadas corresponde al eje y.

Figura 3.1: Función lineal.

y 20 0 x Ejemplo 2: Suponga que un investigador ha encontrado que a mayor escolaridad de las personas existe un mayor interés de ellas por la política. Dicho investigador a determinado empíricamente que la relación entre el grado de rendición de cuentas (RC) de los organismos públicos y la escolaridad de los ciudadanos (Esc) responde a la siguiente función, donde RC corresponde a un índice que el investigador a elaborado. 𝑅𝑅𝐶𝐶 = 1 + 0.3𝐸𝐸𝑠𝑠𝑐𝑐 (3.8) Lo que nos dice la ecuación 3.8 es que la relación entre las variables es de carácter lineal, y la escolaridad impacta positivamente en el grado de rendición de cuentas de los individuos. Es más, por cada aumento de una unidad en la escolaridad, el grado índice de rendición de cuentas aumenta en 0.3.

Page 16: Elementos Cuantitativos de Investigación en las Ciencias ...

16

Suponga que de pronto se publica la Ley de Transparencia, lo que significa que los organismos públicos, sin importar las demandas de la ciudadanía, deben aumentar su nivel de rendición de cuentas, y que se estima que el aumento autónomo en la rendición de cuentas es de un 27%. Si esto ocurre, debemos preguntarnos respecto de cuál es el componente autónomo de la RC, que no tiene que ver con las características de la ciudadanía. Dicho componente es el intercepto, el que aumenta en 27%, y que deja a la ecuación como: 𝑅𝑅𝐶𝐶 = 1.27 + 0.3𝐸𝐸𝑠𝑠𝑐𝑐 (3.9) Gráficamente, lo que se produce es que aumenta el intercepto, desplazándose la función de forma paralela.

Figura 3.2: Función lineal de RC.

RC 1.27 1 0 Esc Ejemplo 3: Al igual que el caso de las ecuaciones, también pueden existir sistemas de ecuaciones. Este es caso de la economía, en particular, de las funciones de oferta y demanda. De acuerdo a las leyes de la oferta y la demanda, se tiene que la “ley de la demanda” es la observación empírica según la cual, cuando baja el precio de un producto, los consumidores demandan una mayor cantidad. Por otro lado, la “ley de la oferta” es la observación empírica según la cual, cuando sube el precio de un producto, las empresas ofrecen una cantidad mayor (Frank, 2005). Con esto, y suponiendo que 𝛽𝛽 < 0 y 𝜃𝜃 > 0, podríamos pensar que las ecuaciones siguientes corresponde a expresiones de demanda y oferta, respectivamente. 𝑦𝑦 = 𝛼𝛼 + 𝛽𝛽𝛽𝛽 𝑦𝑦 = 𝛾𝛾 + 𝜃𝜃𝛽𝛽 Si en forma adicional, consideramos las siguientes pares (P,y) para el consumidor: (2.5,1), (2,2), (1.5,3) y (1,4); y los siguientes pares (P,y) para el productor: (1,0), (2,2) y (2.5,3), podemos obtener el valor de los parámetros de las ecuaciones de demanda y oferta. Al graficar los pares de consumidor y productor se puede ver que efectivamente corresponden a funciones lineales. Entonces para obtener la pendiente de la curva de demanda podemos tomar dos puntos cualesquiera, por ejemplo, los dos primeros. 𝛽𝛽 = 𝑦𝑦2−𝑦𝑦1

𝑃𝑃2−𝑃𝑃1= 2−1

2−2.5= 1

−0.5= −2

A continuación, se reemplaza la pendiente y un punto cualquiera en la función de demanda, con el objeto de obtener el intercepto. En este caso reemplazaremos el segundo punto (2,2): 𝑦𝑦 = 𝛼𝛼 + 𝛽𝛽𝛽𝛽 2 = 𝛼𝛼 + (−2)2 𝛼𝛼 = 6

Page 17: Elementos Cuantitativos de Investigación en las Ciencias ...

17

Entonces, la ecuación de la demanda queda definida por 𝑦𝑦𝑑𝑑 = 6 − 2𝛽𝛽 Procediendo de la misma forma para la ecuación de oferta, esta queda determinada por la ecuación. 𝑦𝑦𝐷𝐷 = −2 + 2𝛽𝛽 Ejemplo 4: Una vez conocidas las funciones lineales de oferta y demanda, se pueden usar dichas funciones para obtener el equilibrio de mercado. Suponga las siguientes funciones: 𝑄𝑄𝐷𝐷 = 10 + 5

2𝛽𝛽

𝑄𝑄𝑑𝑑 = 50− 5

2𝛽𝛽

Para obtener el equilibrio se deben igualar ambas ecuaciones. En un equilibrio se asume que existe un único precio que equilibra el mercado (pe), y que a este precio, lo que los vendedores venden es igual a lo que los compradores quieren comprar. Se puede tomar este último supuesto (𝑄𝑄𝐷𝐷 = 𝑄𝑄𝑑𝑑) e igualar las ecuaciones. 𝑄𝑄𝐷𝐷 = 𝑄𝑄𝑑𝑑 10 + 5

2𝛽𝛽 = 50 − 5

2𝛽𝛽

102𝛽𝛽 = 40

𝛽𝛽 = 8

Por lo que reemplazando el precio en cualquiera de las dos ecuaciones, se tiene que 𝑄𝑄 = 30. Por último, el equilibrio de mercado se puede graficar en la figura 3.3.

Figura 3.3: Oferta y Demanda.

P 8 0 30 Q Ejemplo 5: otro ejemplo de sistema de ecuaciones se tiene en el modelo ISLM de macroeconomía. En dicho modelo, la curva IS (Inversión-Ahorro) representa el equilibrio en el mercado de bienes, mientras que la LM (Demanda de Dinero-Oferta de Dinero) representa el equilibrio en el mercado del dinero. Sean la curva IS y LM las siguientes (Dornbusch et al, 2004: 243), respectivamente: 𝑌𝑌 = 𝛼𝛼𝐺𝐺(��𝐴 − 𝑏𝑏𝐶𝐶) (IS) 𝐶𝐶 = 1

ℎ�𝑘𝑘𝑌𝑌 − 𝑀𝑀�

𝑃𝑃�� (LM)

Page 18: Elementos Cuantitativos de Investigación en las Ciencias ...

18

Donde Y es el ingreso, 𝛼𝛼𝐺𝐺 el multiplicador de la política fiscal, ��𝐴 es el gasto autónomo, 𝑏𝑏 es la sensibilidad de la inversión a la tasa de interés, e 𝐶𝐶 es la tasa de interés. En la curva LM, ℎ es la sensibilidad de la demanda de saldos reales a la tasa de interés, mientras que k es la sensibilidad de esta al ingreso, y 𝑀𝑀� 𝛽𝛽�⁄ es la oferta de dinero real. Al solucionar este sistema, se tiene que el nivel de ingreso es igual a: 𝑌𝑌 = ℎ𝛼𝛼𝐺𝐺

ℎ+𝑘𝑘𝑏𝑏𝛼𝛼𝐺𝐺��𝐴 + 𝑏𝑏𝛼𝛼𝐺𝐺

ℎ+𝑘𝑘𝑏𝑏𝛼𝛼𝐺𝐺

𝑀𝑀�𝑃𝑃�

(3.10) 3.7.2. Funciones Cuadráticas. Como se estableció más arriba, las funciones también pueden tomar formas no lineales. En particular, una función cuadrática está definida por la forma (Arya et al, 2009: 187): 𝑓𝑓(𝑥𝑥) = 𝑎𝑎𝑥𝑥2 + 𝑏𝑏𝑥𝑥 + 𝑐𝑐 con 𝑎𝑎 ≠ 0 (3.11) Donde a, b y c son constantes. Es posible calcular la posición de dicha función, lo que se lleva a cabo a través del siguiente teorema. Teorema: el vértice de la función cuadrática se puede obtener mediante las siguientes fórmulas (Arya et al, 2009: 188): 𝑥𝑥 = − 𝑏𝑏

2𝑎𝑎 ^ 𝑦𝑦 = 4𝑎𝑎𝑐𝑐−𝑏𝑏2

4𝑎𝑎 (3.12)

Ejemplo 1: A continuación se presentan ejemplos de diferentes funciones cuadráticas. Como se observa, todas tienen la estructura de 3.11 pero bajo diferentes parámetros para a, b y c. 𝑦𝑦 = 𝑥𝑥2 (3.13) 𝑦𝑦 = 𝑥𝑥2 + 10 (3.14) 𝑦𝑦 = 𝑥𝑥2 − 𝑥𝑥 + 10 (3.15) 𝑦𝑦 = 𝑥𝑥2 − 2𝑥𝑥 + 10 (3.16) Usando las fórmulas de 3.12 se puede obtener el vértice para cada una de las funciones, las que corresponden respectivamente a:

𝑥𝑥 = 0 ^ 𝑦𝑦 = 0 (3.13’) 𝑥𝑥 = 0 ^ 𝑦𝑦 = 10 (3.14’) 𝑥𝑥 = 1

2 ^ 𝑦𝑦 = 9.75 (3.15’)

𝑥𝑥 = 1 ^ 𝑦𝑦 = 9 (3.16’)

Tal como se observa en la figura 3.4, el vértice de 3.13 es (0,0), el de 3.14 es (0, 10), para 3.15 es (½, 9.75), mientras que para 3.16 es (1, 9). En otras palabras, dependiendo de los diferentes parámetros de la función cuadrática, esta presentará diferentes posiciones.

Page 19: Elementos Cuantitativos de Investigación en las Ciencias ...

19

Figura 3.4: Diferentes Funciones Cuadráticas, Ejemplo 1.

Fuente: Elaboración propia usando el Software MAXIMA.

Ejemplo 2: Dado que es posible obtener diferentes funciones cuadráticas alterando los parámetros de la fórmula 3.11, también es posible obtener funciones con formas inversas en el plano x,y. Para esto es posible alterar el parámetro a de la ecuación 3.17, que pasa de 𝑎𝑎 = 1 en 3.17 a 𝑎𝑎 = −1 en la ecuación 3.18, y cuya gráfica se observa en la Figura 3.5.

𝑦𝑦 = 𝑥𝑥2 + 10 (3.17) 𝑦𝑦 = −𝑥𝑥2 + 5 (3.18)

Figura 3.5: Diferentes Funciones Cuadráticas, Ejemplo 2.

Fuente: Elaboración propia usando el Software MAXIMA.

Ejemplo 3: En la realidad se pueden encontrar una serie de relaciones de carácter no lineal. Un caso interesante es la curva de Kuznets, la que establece que la desigualdad del ingreso aumenta a medida que el Producto Interno Bruto crece (PIB), sin embargo, dado un punto, la desigualdad comienza a bajar. Este caso se observa en la figura 3.6. No obstante la importancia de su valor teórico, esta relación ha sido ampliamente cuestionada desde el punto vista empírico (Ver Palma (2011)).

Page 20: Elementos Cuantitativos de Investigación en las Ciencias ...

20

Figura 3.6: Curva de Kuznets.

Desigualdad PIB Ejemplo 4: Otro ejemplo importante, que no representa una función cuadrática, pero si no lineal, corresponde a la curva de demanda agregada. Dicha curva se puede derivar a partir del modelo ISLM. Al tomar ecuación del producto, en el ejemplo 5 de la sección anterior, y reemplazar los multiplicadores por expresiones más sencillas queda: 𝑌𝑌 = ℎ𝛼𝛼𝐺𝐺

ℎ+𝑘𝑘𝑏𝑏𝛼𝛼𝐺𝐺��𝐴 + 𝑏𝑏𝛼𝛼𝐺𝐺

ℎ+𝑘𝑘𝑏𝑏𝛼𝛼𝐺𝐺

𝑀𝑀�𝑃𝑃�

𝑌𝑌 = 𝛾𝛾��𝐴 + 𝛽𝛽 𝑀𝑀�

𝑃𝑃 con 𝛾𝛾 = ℎ𝛼𝛼𝐺𝐺

ℎ+𝑘𝑘𝑏𝑏𝛼𝛼𝐺𝐺 y 𝛽𝛽 = 𝛾𝛾 𝑏𝑏

ℎ.

De la última ecuación, y si dejamos libre el nivel de precios, se tiene que la curva de demanda agregada depende negativamente del nivel de precios, pero de una forma no lineal, tal como se puede apreciar a continuación. 𝑌𝑌 = 𝛾𝛾��𝐴 + 𝛽𝛽𝑀𝑀�𝛽𝛽−1 (3.19)

3.8. Derivadas. La derivada es un concepto muy utilizado en las ciencias exactas y sociales. Existen muchas aplicaciones en el área de la economía, la administración, la sociología, y la ciencia política, por solo mencionar algunas disciplinas, que utilizan dicho concepto (sin saberlo incluso). En palabras simples, la derivada corresponde a la pendiente de la tangente a un punto de la función. Formalmente, dada la función 𝑦𝑦 = 𝑓𝑓(𝑥𝑥), la derivada de la función es (Budnick, 2007: 732) la siguiente: 𝑑𝑑𝑦𝑦

𝑑𝑑𝑥𝑥= 𝑙𝑙𝐶𝐶𝑚𝑚∆𝑥𝑥→0

𝑓𝑓(𝑥𝑥+∆𝑥𝑥)−𝑓𝑓(𝑥𝑥)∆𝑥𝑥

(3.20) Asumiendo que existe el límite. En este sentido, se puede encontrar la derivada de la siguiente función (Ayres, 1971: 22): 𝑦𝑦 = 𝑓𝑓(𝑥𝑥) = 𝑥𝑥2 + 3𝑥𝑥 Aplicando la definición, se tiene: 𝑑𝑑𝑦𝑦

𝑑𝑑𝑥𝑥= 𝑙𝑙𝐶𝐶𝑚𝑚∆𝑥𝑥→0

(𝑥𝑥+∆𝑥𝑥)2+3(𝑥𝑥+∆𝑥𝑥)−(𝑥𝑥2+3𝑥𝑥)∆𝑥𝑥

Page 21: Elementos Cuantitativos de Investigación en las Ciencias ...

21

𝑑𝑑𝑦𝑦

𝑑𝑑𝑥𝑥= 𝑙𝑙𝐶𝐶𝑚𝑚∆𝑥𝑥→0

𝑥𝑥2+2𝑥𝑥∆𝑥𝑥+(∆𝑥𝑥)2+3𝑥𝑥+3∆𝑥𝑥−𝑥𝑥2−3𝑥𝑥∆𝑥𝑥

𝑑𝑑𝑦𝑦

𝑑𝑑𝑥𝑥= 𝑙𝑙𝐶𝐶𝑚𝑚∆𝑥𝑥→0

2𝑥𝑥∆𝑥𝑥+(∆𝑥𝑥)2+3∆𝑥𝑥∆𝑥𝑥

𝑑𝑑𝑦𝑦

𝑑𝑑𝑥𝑥= 𝑙𝑙𝐶𝐶𝑚𝑚∆𝑥𝑥→0

∆𝑥𝑥(2𝑥𝑥+∆𝑥𝑥+3)∆𝑥𝑥

𝑑𝑑𝑦𝑦

𝑑𝑑𝑥𝑥= 𝑙𝑙𝐶𝐶𝑚𝑚∆𝑥𝑥→0(2𝑥𝑥 + ∆𝑥𝑥 + 3)

𝑑𝑑𝑦𝑦

𝑑𝑑𝑥𝑥= 2𝑥𝑥 + 3

Asimismo, es posible obtener la derivada de la siguiente función (Budnick, 2007: 733): 𝑦𝑦 = 𝑓𝑓(𝑥𝑥) = −5𝑥𝑥 + 9 𝑑𝑑𝑦𝑦

𝑑𝑑𝑥𝑥= 𝑙𝑙𝐶𝐶𝑚𝑚∆𝑥𝑥→0

−5(𝑥𝑥+∆𝑥𝑥)+9−(−5𝑥𝑥+9)∆𝑥𝑥

𝑑𝑑𝑦𝑦

𝑑𝑑𝑥𝑥= 𝑙𝑙𝐶𝐶𝑚𝑚∆𝑥𝑥→0

−5𝑥𝑥−5∆𝑥𝑥+9+5𝑥𝑥−9∆𝑥𝑥

𝑑𝑑𝑦𝑦

𝑑𝑑𝑥𝑥= 𝑙𝑙𝐶𝐶𝑚𝑚∆𝑥𝑥→0

−5∆𝑥𝑥∆𝑥𝑥

𝑑𝑑𝑦𝑦

𝑑𝑑𝑥𝑥= 𝑙𝑙𝐶𝐶𝑚𝑚∆𝑥𝑥→0(−5)

𝑑𝑑𝑦𝑦

𝑑𝑑𝑥𝑥= −5

Sin embargo, en la práctica es complejo aplicar la definición de derivada a cada una de las funciones, razón por la que existen reglas de derivación. En la siguiente tabla aparecen las reglas más usadas en la derivación (Budnick, 2007). Cabe destacar que 𝑓𝑓(𝑥𝑥) corresponde a la función, mientras que 𝑓𝑓′(𝑥𝑥) = 𝑑𝑑𝑦𝑦

𝑑𝑑𝑥𝑥.

Page 22: Elementos Cuantitativos de Investigación en las Ciencias ...

22

Tabla 3.1: Reglas de derivación.

)(xf )(' xf nxxf =)( 1)(' −= nnxxf

cxf =)( 0)(' =xf

)()()( xgxfxh += )(')(')(' xgxfxh +=

)()()( xgxfxh −= )(')(')(' xgxfxh −=

)(*)( xgkxh = )('*)(' xgkxh =

)(*)()( xhxgxf = )(')()()(')( xhxgxhxgxf +=

)(/)()( xhxgxf = 2)]([

)(')()()(')(xh

xhxgxhxgxf −=

nxgxf )]([)( = )('*)]([)(' 1 xgxgnxf n−=

)]([)( xhgxf = )('*)]([')(' xhxhgxf =

)()( xgexf = )('*)(' )( xgexf xg=

)(ln)( xgxf = )('

)(1)(' xgxg

xf =

xxf =)( x

xf2

1)(' =

Fuente: elaboración propia en base a Budnick (2007).

Page 23: Elementos Cuantitativos de Investigación en las Ciencias ...

23

La mejor forma de aprender y comprender las reglas de derivación es a través de la aplicación, por lo que a continuación se plantean algunos ejercicios. Ejemplos:

a) 𝑦𝑦(𝑥𝑥) = 11 𝑑𝑑𝑦𝑦

𝑑𝑑𝑥𝑥= 0

b) 𝑦𝑦(𝑥𝑥) = −12𝑥𝑥

𝑑𝑑𝑦𝑦

𝑑𝑑𝑥𝑥= −12

c) 𝑦𝑦(𝑥𝑥) = 𝑥𝑥2 + 3𝑥𝑥

𝑑𝑑𝑦𝑦

𝑑𝑑𝑥𝑥= 2𝑥𝑥 + 3

d) 𝐼𝐼𝐼𝐼(𝑞𝑞) = 𝑝𝑝(𝑞𝑞)𝑞𝑞

𝑑𝑑𝐼𝐼𝐼𝐼

𝑑𝑑𝑞𝑞= 𝑑𝑑𝑝𝑝(𝑞𝑞)

𝑑𝑑𝑞𝑞𝑞𝑞 + 𝑝𝑝(𝑞𝑞) 𝑑𝑑𝑞𝑞

𝑑𝑑𝑞𝑞= 𝑑𝑑𝑝𝑝(𝑞𝑞)

𝑑𝑑𝑞𝑞𝑞𝑞 + 𝑝𝑝(𝑞𝑞)

e) 𝑦𝑦 = (𝑥𝑥2 + 6)3

𝑑𝑑𝑦𝑦

𝑑𝑑𝑥𝑥= 3(𝑥𝑥2 + 6)2(2𝑥𝑥) = 6𝑥𝑥(𝑥𝑥4 + 12𝑥𝑥2 + 36)

f) 𝑦𝑦 = 20√𝑥𝑥

𝑑𝑑𝑦𝑦

𝑑𝑑𝑥𝑥= 20

2√𝑥𝑥= 10

√𝑥𝑥

g) 𝑦𝑦 = ln (5𝑥𝑥5)

𝑑𝑑𝑦𝑦

𝑑𝑑𝑥𝑥= 1

5𝑥𝑥5 25𝑥𝑥4 = 5𝑥𝑥

h) 𝑦𝑦 = � x

1+x�5

𝑑𝑑𝑦𝑦

𝑑𝑑𝑥𝑥= 5 � x

1+x�

4�x′(1+x)−x(1+x)′

(1+x)2 � = 5 � x

1+x�

4�(1+x)−x

(1+x)2 � = 5𝑥𝑥4

(1+𝑥𝑥)6

i) 𝑦𝑦(𝛽𝛽) = 𝛼𝛼 + 𝛽𝛽𝛽𝛽 𝑑𝑑𝑦𝑦

𝑑𝑑𝛽𝛽= 𝛽𝛽 y sabemos que 𝛽𝛽 < 0.

j) 𝑅𝑅𝐶𝐶(𝐸𝐸𝑠𝑠𝑐𝑐) = 1.27 + 0.3𝐸𝐸𝑠𝑠𝑐𝑐

𝑑𝑑𝑅𝑅𝐶𝐶

𝑑𝑑𝐸𝐸𝑠𝑠𝑐𝑐= 0.33

Page 24: Elementos Cuantitativos de Investigación en las Ciencias ...

24

Ejercicios Propuestos: a continuación se proponen una serie de ejercicios con el objeto de ejercitar las derivadas (Ayres, 1971):

a) 𝑦𝑦 = 𝑥𝑥5 + 5𝑥𝑥4 − 10𝑥𝑥2 + 6 sol. 𝑑𝑑𝑦𝑦𝑑𝑑𝑥𝑥

= 5𝑥𝑥(𝑥𝑥3 + 4𝑥𝑥2 − 4)

b) 𝑦𝑦 = 12𝑥𝑥2

+ 4√𝑥𝑥

sol. 𝑑𝑑𝑦𝑦𝑑𝑑𝑥𝑥

= − 1𝑥𝑥3− 2

𝑥𝑥3/2

c) 𝑦𝑦 = √2𝑥𝑥 + 2√𝑥𝑥 sol. 𝑑𝑑𝑦𝑦𝑑𝑑𝑥𝑥

= 1+√2√2𝑥𝑥

d) 𝑦𝑦 = (1 − 5𝑥𝑥)6 sol. 𝑑𝑑𝑦𝑦𝑑𝑑𝑥𝑥

= −30(1− 5𝑥𝑥)5

e) 𝑦𝑦 = (3 + 4𝑥𝑥 − 𝑥𝑥2)12 sol. 𝑑𝑑𝑦𝑦

𝑑𝑑𝑥𝑥= 2−𝑥𝑥

𝑦𝑦

f) 𝜃𝜃 = 3𝐷𝐷+2

2𝐷𝐷+3 sol. 𝑑𝑑𝜃𝜃

𝑑𝑑𝑑𝑑= 5

(2𝐷𝐷+3)2

g) 𝑦𝑦 = � 𝑥𝑥1+𝑥𝑥

�5 sol. 𝑑𝑑𝑦𝑦

𝑑𝑑𝑥𝑥= 5𝑥𝑥4

(1+𝑥𝑥)6

h) 𝑦𝑦 = 𝑤𝑤√1−4𝑤𝑤2 sol. 𝑑𝑑𝑦𝑦

𝑑𝑑𝑥𝑥= 1

(1−4𝑤𝑤2)3/2

i) 𝑦𝑦 = �1 + √𝑥𝑥 sol. 𝑑𝑑𝑦𝑦𝑑𝑑𝑥𝑥

= 1

4�𝑥𝑥+𝑥𝑥√𝑥𝑥

j) 𝑓𝑓(𝑥𝑥) = �𝑥𝑥−1𝑥𝑥+1

sol. 𝑑𝑑𝑦𝑦𝑑𝑑𝑥𝑥

= 1(𝑥𝑥+1)√𝑥𝑥2−1

3.8.1. Aplicaciones de la derivada.

La derivada tiene un uso de utilidad pues permite obtener cual es el punto que maximiza o minimiza una función. Esto eso, suponga que la curva de producción de un organismo público se puede definir como una función f(x)=y, tal como la que aparece en la Figura 3.7, donde x corresponde a un insumo específico en la producción de cierto organismo público (i.e. insumos de oficina en una repartición pública). Ya que la derivada corresponde a la pendiente en un punto (y’), puedo restringir la pendiente en cero (y’=0), y así obtener el mínimo o máximo de la respectiva función. En este caso y’=0 en el punto A, y el x correspondiente al punto A es el x que maximiza la función.

Page 25: Elementos Cuantitativos de Investigación en las Ciencias ...

25

Figura 3.7: Curva de Producción de un Organismo Público y A y’=0 x Ejemplo 1: Si la función y de la Figura 3.7 corresponde a 𝑦𝑦 = 2 + 𝑥𝑥 − 𝑥𝑥2, entonces al aplicar la condición de primer orden (𝑦𝑦′ = 0) llegamos a 𝑦𝑦′ = 0 => 1 − 2𝑥𝑥 = 0. Al obtener la segunda derivada de la expresión 𝑦𝑦 = 2 + 𝑥𝑥 − 𝑥𝑥2, esto es, 𝑦𝑦′′ = −2 < 0, sabemos que corresponde a un máximo. Entonces, el valor de x que maximiza la función corresponde a ½. Este último punto es importante, pues la condición de primer orden (CPO) indica que la derivada debe ser cero, lo que nos puede situar en un mínimo o un máximo, dependiendo de la forma de la función. La segunda derivada es la que nos indica si hemos encontrado un mínimo (𝑦𝑦′′ > 0) o un máximo (𝑦𝑦′′ < 0). Adicionalmente, la derivada tiene múltiples usos de gran interés para las ciencias sociales. En nuestro curso será de vital importancia para las sesiones de econometría. Método de los Multiplicadores de Lagrange: Un ejemplo importante de aplicación de las derivadas se tiene en el caso de la “Teoría del Consumidor” en Microeconomía. Si bien este caso se aplica al consumidor, se puede pensar en un sinfín situaciones en las cuales un individuo, un individuo representativo, o una organización, deben maximizar algún tipo de función sujeto a una restricción. Para ilustrar este punto piense en la maximización del bien común (medido de alguna forma) sujeto a la restricción de los recursos del Estado, en la maximización de las consultas de calidad de un hospital sujeto a la restricción presupuestaria de dicho hospital, en la maximización de la calidad de la educación medida por el SIMCE (proxy de la calidad de la educación) sujeta a los recursos disponibles del colegio respectivo. Respecto del problema básico del consumidor, se puede pensar en que este tiene una utilidad definida por la función 𝑈𝑈 = 𝑈𝑈(𝑥𝑥,𝑦𝑦), donde 𝜕𝜕𝑈𝑈

𝜕𝜕𝑥𝑥> 0 y 𝜕𝜕𝑈𝑈

𝜕𝜕𝑦𝑦> 0, esto es, x e y son bienes. En forma

adicional se puede pensar en la restricción que enfrenta el consumidor. En este caso los bienes x e y están disponibles en la economía, pero a un precio 𝑝𝑝𝑥𝑥 y 𝑝𝑝𝑦𝑦, y el consumidor tiene un ingreso I, para gastar en los dos bienes. De acuerdo a esto, el problema del consumidor queda definido por:

𝑚𝑚𝑎𝑎𝑥𝑥𝑥𝑥,𝑦𝑦 𝑈𝑈 = 𝑈𝑈(𝑥𝑥,𝑦𝑦) (Función de Utilidad) Sujeto a: 𝐼𝐼 = 𝑝𝑝𝑥𝑥𝑥𝑥 + 𝑝𝑝𝑦𝑦𝑦𝑦 (Restricción Presupuestaria)

Donde se deja claro que el individuo quiere maximizar una función de utilidad U¸ eligiendo para ello las variables x e y, sujeto a la restricción 𝐼𝐼 = 𝑝𝑝𝑥𝑥𝑥𝑥 + 𝑝𝑝𝑦𝑦𝑦𝑦. Una forma útil de solucionar este problema es recurrir al método de los Multiplicadores de Lagrange, el que consiste en plantear el problema de la siguiente forma:

Page 26: Elementos Cuantitativos de Investigación en las Ciencias ...

26

𝐿𝐿 = 𝑈𝑈(𝑥𝑥,𝑦𝑦) + 𝜆𝜆[𝐼𝐼 − 𝑝𝑝𝑥𝑥𝑥𝑥 − 𝑝𝑝𝑦𝑦𝑦𝑦] (3.21) Donde L es el Lagrange y 𝜆𝜆 es el multiplicador de Lagrange. En este problema se ha incorporado simultáneamente la función de utilidad y la restricción presupuestaria, y el óptimo se puede obtener encontrando las siguientes CPO del problema. 𝜕𝜕𝐿𝐿

𝜕𝜕𝑥𝑥= 0, 𝜕𝜕𝐿𝐿

𝜕𝜕𝑦𝑦= 0, 𝜕𝜕𝐿𝐿

𝜕𝜕𝜆𝜆= 0 (3.22)

Entonces, al resolver las tres condiciones, se tienen 3 ecuaciones. Al tener 3 variables y 3 ecuaciones, se puede resolver el problema para x, y y 𝜆𝜆. Ejemplo 1: Sea 𝑈𝑈 = 𝑥𝑥𝑦𝑦, sujeto a 𝐼𝐼 = 𝑝𝑝𝑥𝑥𝑥𝑥 + 𝑝𝑝𝑦𝑦𝑦𝑦. En este caso se plantea el problema y se resuelven las CPO. 𝐿𝐿 = 𝑥𝑥𝑦𝑦 + 𝜆𝜆[𝐼𝐼 − 𝑝𝑝𝑥𝑥𝑥𝑥 − 𝑝𝑝𝑦𝑦𝑦𝑦] 𝜕𝜕𝐿𝐿

𝜕𝜕𝑥𝑥= 𝑦𝑦 − 𝜆𝜆𝑝𝑝𝑥𝑥 = 0 (3.23)

𝜕𝜕𝐿𝐿

𝜕𝜕𝑥𝑥= 𝑥𝑥 − 𝜆𝜆𝑝𝑝𝑦𝑦 = 0 (3.24)

𝜕𝜕𝐿𝐿

𝜕𝜕𝜆𝜆= 𝐼𝐼 − 𝑝𝑝𝑥𝑥𝑥𝑥 − 𝑝𝑝𝑦𝑦𝑦𝑦 = 0 (3.25)

Despejando 𝜆𝜆 en (3.23) y en (3.24) se tiene: 𝜆𝜆 = 𝑦𝑦

𝑝𝑝𝑥𝑥 ^ 𝜆𝜆 = 𝑥𝑥

𝑝𝑝𝑦𝑦

Igualando las expresiones anteriores se tiene la siguiente ecuación, que indica que la Utilidad Marginal de x por peso gastado en x, es igual a la Utilidad Marginal de y por peso gastado y. 𝑦𝑦

𝑝𝑝𝑥𝑥= 𝑥𝑥

𝑝𝑝𝑦𝑦 (3.26)

Finalmente, reemplazando (3.26) en (3.25), se tiene: 𝐼𝐼 = 𝑝𝑝𝑥𝑥𝑥𝑥 + 𝑝𝑝𝑦𝑦𝑦𝑦 𝐼𝐼 = 𝑝𝑝𝑥𝑥𝑥𝑥 + 𝑝𝑝𝑦𝑦

𝑝𝑝𝑥𝑥𝑥𝑥𝑝𝑝𝑦𝑦

𝐼𝐼 = 2𝑝𝑝𝑥𝑥𝑥𝑥 𝑥𝑥∗ = 𝐼𝐼

2𝑝𝑝𝑥𝑥 ^ 𝑦𝑦∗ = 𝐼𝐼

2𝑝𝑝𝑦𝑦 (3.27)

Donde 𝑥𝑥∗ e 𝑦𝑦∗corresponden a los valores que maximizan la función, y son lo que en la Teoría Microeconómica se conoce como Demandas Marshallianas. Dichos valores se pueden reemplazar en la función de Utilidad obteniendo así la Función de Utilidad Indirecta (FUI): 𝑈𝑈 = 𝑥𝑥∗𝑦𝑦∗

Page 27: Elementos Cuantitativos de Investigación en las Ciencias ...

27

𝑈𝑈 = 𝐼𝐼2𝑝𝑝𝑥𝑥

𝐼𝐼2𝑝𝑝𝑦𝑦

𝑈𝑈 = 𝐼𝐼2

4𝑝𝑝𝑥𝑥𝑝𝑝𝑦𝑦 (FUI)

Ejemplo 2: El siguiente problema se inserta dentro de la “Teoría de los Costos” en Microeconomía. Intuitivamente el problema dice relación con minimizar los costos de la empresa, sujeto a la función de producción. Suponga una empresa que tiene la siguiente función de producción 𝑄𝑄 = 𝑓𝑓(𝐾𝐾, 𝐿𝐿) =√𝐾𝐾𝐿𝐿, donde 𝑑𝑑 = 4 es el precio del capital y 𝑤𝑤 = 2 corresponde al salario (Frank, 2005: 339). Para obtener los valores de K y L que minimizan el costo de la empresa al producir 2 unidades, se plantea el problema de optimización:

𝜓𝜓 = 𝑑𝑑𝐾𝐾 + 𝑤𝑤𝐿𝐿 + 𝜆𝜆[√𝐾𝐾𝐿𝐿 − 𝑄𝑄𝐷𝐷]

Las condiciones de primer orden corresponden a:

𝜕𝜕𝜓𝜓𝜕𝜕𝐾𝐾

= 𝑑𝑑 + 𝜆𝜆 √𝐿𝐿2√𝐾𝐾

= 0 (3.28) 𝜕𝜕𝜓𝜓

𝜕𝜕𝐿𝐿= 𝑤𝑤 + 𝜆𝜆 √𝐾𝐾

2√𝐿𝐿= 0 (3.29)

𝜕𝜕𝜓𝜓

𝜕𝜕𝜆𝜆= √𝐾𝐾𝐿𝐿 − 𝑄𝑄𝐷𝐷 = 0 (3.30)

Despejando 𝜆𝜆 en (3.28) y en (3.29) se tiene: 𝜆𝜆 = −𝑑𝑑 2√𝐾𝐾

√𝐿𝐿 ^ 𝜆𝜆 = −𝑤𝑤 2√𝐿𝐿

√𝐾𝐾

Igualando las expresiones anteriores se tiene la siguiente ecuación, que indica que la Productividad Marginal de L por peso gastado en L, es igual a la Productividad Marginal de K por peso gastado en K.

� √𝐾𝐾2√𝐿𝐿

𝑤𝑤=

� √𝐿𝐿2√𝐾𝐾

𝐷𝐷 (3.31)

Y reemplazando los valores 𝑑𝑑 = 4 y 𝑤𝑤 = 2 en 3.31 se obtiene:

𝐾𝐾 = 12𝐿𝐿 (3.32)

Finalmente, reemplazando 3.32 en 3.30, y reemplazando 𝑄𝑄𝐷𝐷 = 2, se tiene:

√𝐾𝐾𝐿𝐿 − 𝑄𝑄𝐷𝐷 = 0

�12𝐿𝐿2 − 2 = 0

𝐿𝐿�12− 2 = 0

𝐿𝐿2

2= 4

Page 28: Elementos Cuantitativos de Investigación en las Ciencias ...

28

𝐿𝐿 = √8 𝐿𝐿∗ = 2√2 , 𝐾𝐾∗ = √2

Por lo que la elección de K y L que minimiza el costo de producir 2 unidades corresponde a 𝐿𝐿∗ = 2√2 y 𝐾𝐾∗ = √2. Ejercicios propuestos.

a) 𝑈𝑈 = √𝑥𝑥1𝑥𝑥2 s.a. 1000 = 10𝑥𝑥1 + 5𝑥𝑥2 b) 𝑞𝑞 = 𝐾𝐾0.35𝐿𝐿0.65 s.a. 2.5𝐾𝐾 + 3.6𝐿𝐿 = 150 c) 𝐹𝐹 = 𝐾𝐾0.5𝐿𝐿0.5 s.a. 𝐾𝐾2 + 𝐿𝐿2 = 1500 d) 𝐹𝐹 = 𝐾𝐾0.6𝐿𝐿0.2 s.a. 𝐾𝐾2 + 𝐿𝐿2 = 2700

Referencias. Arya, Jagdish C., y Lardner, Robin W. (2009). “Matemáticas aplicadas a la administración y a la economía”. Quinta edición, Pearson Educación, México, 2009. ISBN: 978-607-442-302-0. Ayres, Frank (1971). “Teoría y Problemas de Calculo Diferencial e Integral”. McGraw-Hill, México, S.A. de C.V. Budnick, Frank S. (2007). “Matemáticas aplicadas para administración, economía y ciencias sociales”. Cuarta edición. McGraw-Hill/Interamericana Editores, S.A. de C.V. Dornbusch, Fischer y Startz (2004). Macroeconomía. McGraw-Hill. 10a edición (D). Frank, Robert (2005). “Microeconomía y Conducta”. 5ta Edición. Mc Graw Hill. España Palma, José Gabriel (2011). “Homogeneous middles vs. heterogeneous tails, and the end of the ‘Inverted-U’: the share of the rich is what it’s all about”. Cambridge Working Papers in Economics (CWPE) 1111. Available at http://www.econ.cam.ac.uk/dae/repec/cam/pdf/cwpe1111.pdf.

Page 29: Elementos Cuantitativos de Investigación en las Ciencias ...

29

4. Estadística Descriptiva

4.1. Introducción Es importante mencionar algunos conceptos de utilidad en estadística. Uno de los más usados dice relación con el concepto de población, que consiste en “la recolección completa de todas las observaciones de interés para el investigador” (Webster, 2000). Este concepto es de vital importancia, toda vez que se refiere al conjunto total de datos, al que rara vez se puede acceder. Es por eso que se recurre a la muestra, cuya definición dice que es “una parte representativa de la población que se selecciona para ser estudiada ya que la población es demasiado grande como para analizarla en su totalidad” (Webster, 2000). Con estos conceptos, es posible definir lo que es un parámetro, que corresponde a una “medida descriptiva de la población de observaciones de interés para el investigador”, mientras que un estadístico es un “elemento que describe una muestra y sirve como una estimación del parámetro de la población correspondiente” (Webster, 2000). Dada la diferencia entre población y muestra resulta importante mencionar la diferencia entre parámetro y estadístico. Por último, nuestro interés siempre estará en determinada característica de la muestra/población, y esa característica se definirá en la mayoría de los casos como “variable”. Esta “es una característica de la población que se está analizando en un estudio estadístico” (Webster, 2000). En la sección siguiente se clasifican los tipos de variables que se enfrentan en el análisis estadístico. 4.1.1. Tipos de Variables Dado que el objetivo del curso es aprender a cuantificar los fenómenos, se hace necesario comprender cuales son los tipos de variables que existen. Esto por cuanto al referirnos a un fenómeno en particular, como las características de una persona, algunas de ellas serán susceptibles de medirse cuantitativamente mientras que otras no. Por ejemplo, el sexo de una persona se puede determinar, aunque no se puede expresar cuantitativamente, más bien se puede delimitar a través de las palabras hombre o mujer. Sin embargo, cuando hablamos del ingreso monetario de la persona, dicha variable se puede expresar de forma cuantitativa, pues podemos decir que la persona tiene x unidades monetarias, donde x es mensurable y se puede ordenar. Entonces, las variables se pueden clasificar en variables cuantitativas y cualitativas (Webster, 2000). Sin embargo, estas también se pueden clasificar en variables continuas y discretas, siendo las primeras aquellas que pueden tomar cualquier valor dentro de un rango, como los valores fraccionarios, y las segundas aquellas que solo pueden tomar ciertos valores, como la edad o escolaridad de las personas (Webster, 2000). También es posible hablar de variables ordinales y nominales. Las ordinales son aquellas que tienen un orden o jerarquía pre-establecido, como por ejemplo el estatus socioeconómico, mientras que las nominales son aquellas que no son susceptibles de ordenarse o jerarquizarse, tales como el sexo, la pertenencia a un partido político, entre otras. (Levin y Levin, 1999: 4-5). 4.1.2. Algunas herramientas de medición. La formulación de indicadores corresponde a la medición concreta de un fenómeno de interés. Para esto se hace necesario plantear el objeto que se quiere medir, así como la lógica o el sentido en el cual el indicador está midiendo dicho fenómeno. A continuación se revisan algunas herramientas básicas para la construcción de indicadores. Esta sección se basa en Levin y Levin, (1999).

Page 30: Elementos Cuantitativos de Investigación en las Ciencias ...

30

Proporciones: en la práctica no es posible analizar distribuciones que tienen el mismo número de casos, razón por la cual los datos de dos muestras distintas se deben estandarizar. En consecuencia, se puede convertir cualquier frecuencia en una proporción P, dividiendo el número de casos en cualquier categoría dada f por el número total en la distribución N (Levin & Levin, 1999: 17). Ej.: la proporción de alumnos con Notebook en la sala de clases. 𝛽𝛽 = 𝑓𝑓

𝑁𝑁 (4.1)

Porcentaje: una forma de expresar la proporción en la lógica “por cada 100 casos” es expresarla en porcentaje (Levin & Levin, 1999: 17). Ej.: el porcentaje de familias pobres en la comuna de Alhué.

% = 𝑓𝑓𝑁𝑁

× 100 (4.2)

Razones: otra forma de estandarizar es comparar el número de casos de una categoría (f1) directamente con el número de casos de otra categoría (f2) (Levin & Levin, 1999: 18). Ej.: la razón entre casos de muerte por accidentes de tránsito y muertes por infarto al miocardio. 𝑑𝑑𝑎𝑎𝑎𝑎ó𝐶𝐶 = 𝑓𝑓1

𝑓𝑓2 (4.3)

Tasas: comparan el número de casos reales (freales) respecto al número de casos potenciales (fpotenciales) (Levin & Levin, 1999: 19). Ej.: la tasa de alumnos de educación municipal sobre los alumnos en edad escolar. 𝐶𝐶𝑎𝑎𝑠𝑠𝑎𝑎 = 𝑓𝑓𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟

𝑓𝑓𝑝𝑝𝑝𝑝𝑝𝑝𝑟𝑟𝑛𝑛𝑝𝑝𝑝𝑝𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟 × 1000 (4.4)

Tasa de variación: otra forma de medición que se usa bastante en ciencias sociales, y sobre todo en economía es la tasa de variación o la variación porcentual de una variable (y) a través del tiempo. Un ejemplo común es la tasa de variación del Producto Interno Bruto (PIB) del país, variable que siempre aparece en la prensa y al cual las personas le prestan bastante atención. Dicha variación se calcula como: 𝑣𝑣𝑎𝑎𝑑𝑑% = �𝑦𝑦𝑝𝑝−𝑦𝑦𝑝𝑝−1

𝑦𝑦𝑝𝑝−1� × 100 (4.5)

Una vez entendidas estas herramientas básicas, es posible generar indicadores, como por ejemplo: Ejemplo 1: Objetivo: mejorar mis notas (𝐶𝐶𝑡𝑡) en la asignatura X. Forma de medición: razón de notas = 𝐶𝐶𝑡𝑡+1/𝐶𝐶𝑡𝑡 Meta: que las notas del periodo 2 (𝐶𝐶𝑡𝑡+1) sean un 1.3 de las notas del periodo 1 (𝐶𝐶𝑡𝑡) Resultado: si 𝐶𝐶𝑡𝑡= 5 y 𝐶𝐶𝑡𝑡+1= 6.5 => razón de notas = 𝐶𝐶𝑡𝑡+1/𝐶𝐶𝑡𝑡=6.5/5=1.3 Asimismo, es posible generar otro tipo de formas de medición, tales como la variación porcentual de las notas, de la forma [(nt2-nt1)/nt1]*100. Entonces, reemplazando en el indicador 1, podemos replantear la forma de medición y la meta. Ejemplo 2: Objetivo: mejorar mis notas (𝐶𝐶𝑡𝑡) en la asignatura X.

Page 31: Elementos Cuantitativos de Investigación en las Ciencias ...

31

Forma de medición: 𝑣𝑣𝑎𝑎𝑑𝑑% = �𝑛𝑛𝑝𝑝+1−𝑛𝑛𝑝𝑝 𝑛𝑛𝑝𝑝

�100 Meta: que las notas del periodo 2 aumenten en un 30% respecto al periodo anterior (var%=30%) Resultado: si 𝐶𝐶𝑡𝑡= 5 y 𝐶𝐶𝑡𝑡+1=6.1 => var% = ((6.1-5)/5)*100=22% También es posible definir indicadores más complejos y sofisticados. Por ejemplo, quiero diseñar un indicador tal, que su conformación mida el rendimiento global de la organización en la que trabajo. Supongamos que las perspectivas a través de las cuales se mide el rendimiento de la organización son la financiera, que pondera un 30%, y la de atención al usuario, que pondera un 70%. A su vez, cada perspectiva se mide de la siguiente forma: 𝑓𝑓𝐶𝐶𝐶𝐶𝑎𝑎𝐶𝐶𝑐𝑐𝐶𝐶𝐶𝐶𝑑𝑑𝑎𝑎𝑡𝑡= porcentaje de presupuesto ejecutado al 31 de marzo del año t. 𝑎𝑎𝐶𝐶𝐶𝐶𝐶𝐶𝑐𝑐𝐶𝐶ó𝐶𝐶 𝑎𝑎𝑙𝑙 𝑢𝑢𝑠𝑠𝑢𝑢𝑎𝑎𝑑𝑑𝐶𝐶𝐶𝐶𝑡𝑡= número de becas otorgadas al 31 de marzo del año t, respecto de diciembre del año t-1. Si el porcentaje de presupuesto ejecutado al 31 de marzo del año t es de 40%, y el número de becas otorgadas al 31 de marzo de t es de 30, mientras que en diciembre del año t-1 es de 200, el valor del índice de rendimiento para este periodo (t) es de: 𝑅𝑅𝐶𝐶𝐶𝐶𝑑𝑑𝐶𝐶𝑚𝑚𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝑡𝑡 = (0.3)𝑓𝑓𝐶𝐶𝐶𝐶𝑎𝑎𝐶𝐶𝑐𝑐𝐶𝐶𝐶𝐶𝑑𝑑𝑎𝑎𝑡𝑡 + (0.7)𝑎𝑎𝐶𝐶𝐶𝐶𝐶𝐶𝑐𝑐𝐶𝐶ó𝐶𝐶 𝑎𝑎𝑙𝑙 𝑢𝑢𝑠𝑠𝑢𝑢𝑎𝑎𝑑𝑑𝐶𝐶𝐶𝐶𝑡𝑡 𝑅𝑅𝐶𝐶𝐶𝐶𝑑𝑑𝐶𝐶𝑚𝑚𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝑡𝑡 = (0.3)0.4 + (0.7) 30

200

𝑅𝑅𝐶𝐶𝐶𝐶𝑑𝑑𝐶𝐶𝑚𝑚𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝑡𝑡 = 0.12 + (0.7)15 𝑅𝑅𝐶𝐶𝐶𝐶𝑑𝑑𝐶𝐶𝑚𝑚𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝑡𝑡 = 0.12 + 0.105 = 0.225 Por lo que el índice de rendimiento en el periodo t es de 22.5%. Este índice de rendimiento es dinámico y varía a través del tiempo. Índices de tal tipo son la base del control de gestión en la actualidad, y la base de los sistemas que llegan a conforman el Balanced Scorecard. Lo importante es determinar las ponderaciones respectivas y la forma de medición de las variables. 4.1.3. Distribuciones en la organización de datos. En estadística es frecuente ordenar los datos de formas útiles para el investigador. Un elemento básico de este orden es el concepto de frecuencia, que dice relación con el número de veces que un puntaje, valor o característica aparece en el conjunto de datos. Un ejemplo se puede observar en la Tabla 4.1. En dicha tabla aparece el puntaje (p), que es la variable de interés, y en la columna f aparece la frecuencia de dicha variable. Suponiendo que en este caso tenemos una población de 23 elementos, el puntaje 1 aparece 2 de 23 veces, mientras que el puntaje 6 aparece 3 de 23 veces. Sin embargo, también se pude estudiar la frecuencia acumulada (fa), que no es más que la frecuencia acumulada a nivel de cada puntaje. Por ejemplo, cuando el puntaje toma el valor 4, la frecuencia acumulada toma el valor 14, lo que quiere decir que existen 14 casos iguales o menores a 4.

Page 32: Elementos Cuantitativos de Investigación en las Ciencias ...

32

Tabla 4.1: Tabla de frecuencia simple para puntajes. Puntajes (p) f fa fa/N

1 2 2 0.0870 2 3 5 0.2174 3 4 9 0.3913 4 5 14 0.6087 5 4 18 0.7826 6 3 21 0.9130 7 2 23 1.0000 Σ 23

Fuente: Levin y Levin (1999). Una aplicación interesante de la frecuencia acumulada es que también se puede presentar en términos porcentuales, por ejemplo, en la cuarta columna se tiene la frecuencia acumulada en forma de proporción (fa/N), la que indica que por ejemplo el 8.7% ((fa/N)*100) de los casos presentan puntajes de 1, mientras que el 78% de los casos presentan puntajes iguales o inferiores a 5. Como se verá en la siguiente sección, la distribución acumulada es importante para obtener el rango percentil. Sin embargo, en estadística esta no es la única forma de presentar la información, es frecuente también encontrarse con los datos en forma agrupada, u organizados en intervalos, como es el caso de la Tabla 4.2, en la cual aparecen los datos de la Tabla 4.1 organizados en 3 intervalos. He aquí que la frecuencia sea de 9 para el intervalo 1 a 3, y de 12 para el intervalo de 4 a 6. El concepto de frecuencia acumulada tiene la interpretación usual. Sin embargo, en este caso se necesita una medida representativa de cada intervalo, por lo que se recurre a la marca de clase (x), que corresponde al promedio entre los límites de cada intervalo. Para el último intervalo es (7+9)/2=8.

Tabla 4.2. Tabla de Datos Agrupados para Puntajes Intervalo x f fa

1 a 3 2 9 9 4 a 6 5 12 21 7 a 9 8 2 23

Σ 23 Fuente: elaboración propia en base a Tabla 4.1. 4.1.4. Rango Percentil. En la Tabla 4.1 sé que la frecuencia acumulada porcentual del puntaje 6 es 91.3%, pero ¿qué ocurre cuando tenemos datos agrupados? El rango percentil (RP) nos permite saber cuál es la frecuencia acumulada exacta de cualquier puntaje. En la Tabla 4.3 aparecen puntajes organizados mediante intervalos, y queremos saber el rango percentil de un puntaje específico.

Page 33: Elementos Cuantitativos de Investigación en las Ciencias ...

33

Tabla 4.3. Tabla de Datos Agrupados para Puntajes Intervalo f fa fa/N

40-49 6 6 0.1224 50-59 7 13 0.2653 60-69 10 23 0.4694 70-79 12 35 0.7143 80-89 8 43 0.8776 90-99 6 49 1.0000

Σ 49 Fuente: Levin y Levin (1999). Para encontrar dicho RP es necesario aplicar la siguiente fórmula, definiendo para ello un intervalo de análisis que denotaremos por I. 𝑅𝑅𝛽𝛽 = �𝑓𝑓𝑎𝑎𝐼𝐼−1

𝑁𝑁100� + �𝑥𝑥−𝐿𝐿𝐼𝐼𝐼𝐼

𝑇𝑇𝐼𝐼� �𝑓𝑓𝐼𝐼

𝑁𝑁100� (4.6)

Donde: �𝑓𝑓𝑎𝑎𝐼𝐼−1

𝑁𝑁100�=frecuencia acumulada porcentual del intervalo anterior al intervalo de análisis.

x = puntaje del cual queremos obtener el RP. 𝐿𝐿𝐼𝐼𝐼𝐼= límite inferior del intervalo de análisis. 𝐼𝐼𝐼𝐼 = tamaño del intervalo de análisis. �𝑓𝑓𝐼𝐼

𝑁𝑁100�= frecuencia relativa del intervalo de análisis.

Entonces, queremos obtener el RP de un puntaje de 92. Primero se debe definir el intervalo de análisis, y dicho puntaje se encuentra en el intervalo 90-99, por lo que este es I. Por otro lado, sabemos que x=92, 𝐿𝐿𝐼𝐼𝐼𝐼 = 89.5 (Promedio entre 89 y 90), y 𝐼𝐼𝐼𝐼 = 10. Finalmente, sabemos que �𝑓𝑓𝑎𝑎𝐼𝐼−1

𝑁𝑁100� = (0.8776)100 = 87.76 , y que �𝑓𝑓𝐼𝐼

𝑁𝑁100� = � 6

49100� =

12.24. Aplicando finalmente la formula, queda: 𝑅𝑅𝛽𝛽 = (87.76 ) + �92−89.5

10� (12.24)

𝑅𝑅𝛽𝛽 = 90.82 Por lo que el rango percentil de un puntaje 92 es de 90.82. Esto es, el 91% recibió un puntaje más bajo que 92, y solo el 9.18% recibió un puntaje más alto (Levin y Levin, 1999). La aplicación del percentil es de suma importancia, pues permite efectuar otros análisis más sofisticados para medir la desigualdad en el ingreso. Por ejemplo, el p90/p10, que corresponde al ratio entre el percentil 90 y el 10 de una distribución de ingresos, o los p90/p50, p10/p50 o p75/p25.

4.2. Medidas de tendencia central:

Las medidas de tendencia central corresponden a estadísticos que resumen y permiten extraer información de forma sintética de una muestra. Entre estos se tiene la moda, la mediana y el promedio. Estos estadísticos a su vez, dependiendo de sus interrelaciones, permiten dar una idea de la distribución con la que se está tratando.

Page 34: Elementos Cuantitativos de Investigación en las Ciencias ...

34

Moda: puntaje o categoría que ocurre más frecuentemente en una distribución (Mo). Ej.: en las siguientes muestras, ¿qué datos corresponden a la moda?

1, 4, 5, 6, 6, 9 => Mo=6 3, 2, 4, 5, 6, 7, 7, 3, 10, 14 => Mo=3 y 7.

Mediana: medida de tendencia central que corta la distribución en dos partes iguales (Mdn). Amplias aplicaciones en diferentes campos (Teoría del votante mediano). Dado que en la mayoría de los casos su posición no es tan clara, es conveniente encontrarla a través de la siguiente fórmula, para lo cual los datos deben estar ordenados de forma ascendente: 𝛽𝛽𝐶𝐶𝑠𝑠𝐶𝐶𝑐𝑐𝐶𝐶ó𝐶𝐶 𝑀𝑀𝐶𝐶𝑑𝑑𝐶𝐶𝑎𝑎𝐶𝐶𝑎𝑎 = 𝑛𝑛+1

2 (4.7)

Un ejemplo de obtención de la mediana se encuentra en Levin y Levin (1999):

11, 12, 13, 16, 17, 20, 25 => (7+1)/2=4 lo que implica que la Mediana=16. 1, 2, 3, 4 => (4+1)/2=2,5 lo que implica que la Mediana=2.5

Media ( x ): la media o promedio de una muestra se define como el centro de gravedad de dicha muestra, siendo el valor que resulta de dividir los diferentes valores de la muestra por el número de casos. Es un estadístico bastante usado, corriente al sentido común, que permite dar una idea “preliminar” respecto de los datos.

∑==

n

ii

Nxx

1 (4.8)

Ejemplo 1: Obtenga el promedio de la muestra A: 500, 600, 750, 810

6654

8107506005004

4

14321

1=

+++=

+++=== ∑∑ == i

in

ii

Axxxx

Nx

Nxx

Ahora, obtenga el promedio de la siguiente muestra, B: 1.000, 400, 595, 665

?4

66559540010004

4

14321

1=

+++=

+++=== ∑∑ == i

in

ii

Bxxxx

Nx

Nxx

Observación 1: uno de los problemas que presenta la media, es que es altamente sensible a los valores extremos de una muestra. Si se toma la fórmula de la media (4.8), se puede analizar lo siguiente: 𝑋𝑋� = 𝑋𝑋1+𝑋𝑋2+⋯+𝑋𝑋𝑁𝑁

𝑁𝑁

𝑋𝑋� = 𝑋𝑋1 �

1𝑁𝑁� + 𝑋𝑋2 �

1𝑁𝑁�+ ⋯+ 𝑋𝑋𝑁𝑁 �

1𝑁𝑁�

Donde N corresponde al número de observaciones que tiene una muestra. Si se analiza la media, se tiene que esta ofrece un índice en el cual cada observación tiene la misma ponderación, esto es

Page 35: Elementos Cuantitativos de Investigación en las Ciencias ...

35

(1/N). Entonces, el promedio o media, dado que pondera de la misma forma a todas las observaciones de la muestra, es altamente sensible a los valores extremos.

Relaciones entre Moda, Mediana y Media: la relación entre estos tres estadísticos puede arrojar información de importancia respecto al conocimiento de una muestra. Para esto es necesario entender que la x se ve fuertemente influenciada por los valores extremos, mientras que la moda se da donde existe acumulación de valores (picos de la distribución normal).

Si Mo = Mdn = x => distribución simétrica Si Mo < Mdn < x => distribución sesgada hacia la derecha Si Mo > Mdn > x => distribución sesgada hacia la izquierda

Ejemplo 2: en las siguientes distribuciones, obtenga los valores de la moda, la mediana y el promedio, y analice el sesgo de cada una.

Distribución X: 5, 6, 6, 7, 8, 9, 10, 10, 10 Distribución Y: 5, 6, 6, 7, 8, 9, 10, 10, 95 Distribución Z: 1, 2, 5, 5, 5, 5, 5, 6, 7

4.2.1. Medidas de Tendencia Central en Frecuencias de Distribución Simple

En la sección anterior analizamos las medidas de tendencia central en su forma más simple. Pero ¿Cómo podemos obtener dichos estadísticos cuando tenemos una frecuencia simple?. La dificultad de obtención de cada medida variará en función de los cálculos que se requieran. En la Tabla 4.4 se puede observar una frecuencia simple, sobre la base de Levin y Levin (1999: 40). Al observar dicha tabla tenemos los puntajes en la primera columna1, la frecuencia (f) en la segunda columna, y la frecuencia acumulada (fa) en la tercera columna. En este caso es fácil ver que la moda corresponde a 4, pues es el valor que más se repite en la muestra, es decir, aparece 5 de 23 veces en los datos. Para obtener la mediana aplicamos la fórmula de posición, esto es, (n+1)/2=12. Una vez que sabemos que la mediana se encuentra en la posición 12, solo tenemos que encontrar en qué puntaje se encuentra el dato n° 12. Esto ocurre cuando el puntaje es igual a 4 (fa=14), por lo que la mediana es 4. Para obtener el promedio, solo debemos ponderar cada puntaje por el número de veces que aparece en la muestra, esto es, como aparece en la cuarta columna de la Tabla 4.4. Aplicamos la fórmula siguiente: ��𝑥 = ∑𝑓𝑓𝑝𝑝

𝑛𝑛= 92

23= 4

1 En Levin & Levin (1999) la variable corresponde a puntajes, pero puede ser cualquier tipo de variable: Salarios en millones de pesos, número de goles en partidos de futbol, código asignado a un individuo con ciertas características, etc.

Page 36: Elementos Cuantitativos de Investigación en las Ciencias ...

36

Tabla 4.4: Tabla de frecuencia simple para puntajes. Puntajes (p) f fa f*p

1 2 2 2 2 3 5 6 3 4 9 12 4 5 14 20 5 4 18 20 6 3 21 18 7 2 23 14 Σ 23 92

Fuente: Levin & Levin (1999). Finalmente, podemos comprobar nuestros resultados generando una muestra de 23 datos y calculando sobre ellos la moda, la mediana y la media. Un cálculo sencillo en Microsoft Excel arroja para los datos de la Tabla 2, una moda=4, mediana=4 y promedio=4. (Otra vez…¿Cuál es el sesgo de esta distribución?)

Tabla 4.5. Datos de la Tabla 1 en forma extensiva.

Fuente: elaboración propia en base a Tabla 4.4.

4.2.2. Medidas de Tendencia Central en Datos Agrupados. ¿Qué ocurre ahora cuando los datos se encuentran de forma agrupada?. Esto le añade complejidad al análisis pues ahora no estaremos observando todos los datos, tal como aparecen en la Tabla 4.4 o 4.5, por el contrario, ahora observamos una agrupación del tipo que aparece en la Tabla 4.6. En dicha tabla se ha incorporado x, que corresponde a la marca de clase o punto medio del intervalo particular. En este caso, dado que la moda corresponde al valor que más se repite en la muestra, tenemos que la moda es 5, o en otras palabras, la moda corresponde al punto medio del intervalo que tiene mayor frecuencia. La obtención del promedio es bastante simple, pues al igual que en el caso anterior, acá debemos considerar la frecuencia del intervalo, pero considerando en este caso el punto medio. La media queda entonces: ��𝑥 = ∑𝑓𝑓𝑥𝑥

𝑛𝑛= 94

23= 4.1

Tabla 4.6. Tabla de Datos Agrupados para Puntajes

Intervalo x f fa f*x 1 a 3 2 9 9 18 4 a 6 5 12 21 60 7 a 9 8 2 23 16

Σ 23 94 Fuente: elaboración propia en base a Tabla 4.1.

Page 37: Elementos Cuantitativos de Investigación en las Ciencias ...

37

La mediana, dada su característica de ser el estadístico que divide a la muestra en dos partes iguales, requiere un cálculo más preciso. En este caso consideramos la siguiente fórmula (Levin & Levin, 1999):

𝑀𝑀𝐶𝐶𝑑𝑑𝐶𝐶𝑎𝑎𝐶𝐶𝑎𝑎 = 𝐿𝐿𝐼𝐼𝐼𝐼 + 𝐼𝐼𝐼𝐼 �𝑛𝑛2−𝑓𝑓𝑎𝑎𝐼𝐼−1

𝑓𝑓𝐼𝐼� (4.9)

Donde LII corresponde al límite inferior del “intervalo de análisis”, 𝐼𝐼𝐼𝐼 al tamaño de dicho intervalo, 𝐶𝐶 al número de datos, 𝑓𝑓𝑎𝑎𝐼𝐼−1 a la frecuencia acumulada del intervalo anterior y 𝑓𝑓𝐼𝐼 a la frecuencia del intervalo de análisis. Sin embargo, necesitamos definir qué se entiende por “intervalo de análisis”. Dicho intervalo es el intervalo más probable que contiene a la mediana. Para obtenerlo se aplica la siguiente regla: n/2. Aplicando la regla, se tiene que n/2=11.5. Analizando la fa de la Tabla 4.6, concluimos que dicho valor se encuentra en el intervalo [4 - 6], pues en él van acumulados 21 datos. Aplicando la fórmula al caso de la Tabla 4.6 se obtiene: 𝑀𝑀𝐶𝐶𝑑𝑑𝐶𝐶𝑎𝑎𝐶𝐶𝑎𝑎 = 3.5 + 3 �11.5−9

12�

𝑀𝑀𝐶𝐶𝑑𝑑𝐶𝐶𝑎𝑎𝐶𝐶𝑎𝑎 = 3.5 + 0.625 = 4.125 Finalmente, obtenemos que en este caso la mediana es 4.125.

4.3. Medidas de dispersión:

Las medidas de dispersión corresponden a estadísticos que permiten analizar la variabilidad o heterogeneidad de una muestra determinada. Esta variabilidad se estima a través de diferencias respecto de la media de la distribución. Rango: Es el estadístico básico de dispersión y consiste en la resta entre el valor más alto y el valor más bajo de la distribución.

Rango: Xmax –Xmin (4.10)

Por ejemplo, supongamos que estamos estudiando el porcentaje de pobreza en las comunas de Chile, y observamos que en nuestra base de datos la comuna con menor pobreza tiene un porcentaje de 0% de pobres, mientras que la comuna con mayor pobreza tiene un porcentaje de pobres de 49%, el rango del índice de pobreza comunal es de 49%-0%=49%.

Desviación estándar: Corresponde al estadístico que mide la dispersión de una muestra como el valor promedio de las desviaciones respecto a la media. Sirve para estimar la heterogeneidad o volatilidad de una muestra de datos.

Nxxn

i i∑=−

= 12)(

σ (4.11)

Ejemplo 1: estime la desviación estándar de las siguientes muestras:

A: 500, 600, 750, 810 B: 1.000, 400, 595, 665

Page 38: Elementos Cuantitativos de Investigación en las Ciencias ...

38

¿Qué muestra tiene una mayor dispersión? ¿Qué relación tiene este cálculo respecto de la obtención de promedios de la sección anterior? Varianza: corresponde al cuadrado de la desviación estándar. Le da mayor peso a los valores extremos.

Nxxn

i i∑=−

= 12

2 )(σ (4.12)

Coeficiente de variación (CV): corresponde a la razón entre la desviación estándar y el promedio. Sirve para estandarizar la dispersión cuando tenemos dos muestras en distintas escalas.

xCV σ

= (4.13)

Ej.: se tienen dos muestras, B: 2, 4, 10, C: 2000, 4000, 2000. El promedio y la desviación estándar de la muestra B corresponden a 5.33 y 3.4, y el promedio y la desviación estándar de C corresponden a 2,667 y 943. ¿Qué distribución tiene una mayor dispersión según la desviación estándar? ¿y según el CV?. Observación 1: Una forma más intuitiva de comprender por qué se usa el CV es suponer que se tiene la desviación estándar de la muestra Y, la que toma el valor 𝜎𝜎𝑌𝑌. Supongamos ahora que todos los datos de la muestra Y se multiplican por 1000, generando la muestra Z, la que tiene a su vez una desviación estándar, 𝜎𝜎𝑍𝑍. En la práctica, lo que ocurre es que la desviación estándar de Y se termina multiplicando por 1000, esto es:

𝜎𝜎𝑍𝑍 = �∑(1000𝑥𝑥𝑝𝑝−1000��𝑥)2

𝑛𝑛

𝜎𝜎𝑍𝑍 = �10002 ∑(𝑥𝑥𝑝𝑝−��𝑥)2

𝑛𝑛

𝜎𝜎𝑍𝑍 = √10002�∑(𝑥𝑥𝑝𝑝−��𝑥)2

𝑛𝑛

𝜎𝜎𝑍𝑍 = 1000�∑(𝑥𝑥𝑝𝑝−��𝑥)2

𝑛𝑛

𝜎𝜎𝑍𝑍 = 1000𝜎𝜎𝑌𝑌 Entonces, se hace evidente que la desviación estándar depende de las unidades de medida de la variable, por lo que se hace necesario un estadístico que sea a-dimensional, o invulnerable a las unidades de medida, como el CV. Ejemplo 2: En el ciclo económico uno de los componentes del PIB que más varía es la inversión. De ahí que la hipótesis es que si se estima algún estadístico de dispersión sobre los componentes del PIB, este estadístico debería indicar que la inversión tiene una mayor variabilidad en el tiempo. En el Gráfico 4.1 se observan los componentes del PIB para Chile, considerando el periodo 1980-1995.

Page 39: Elementos Cuantitativos de Investigación en las Ciencias ...

39

En el gráfico se observa que la magnitud del consumo es mucho mayor a la de la inversión, por lo que quizá, la desviación estándar del consumo termine siendo mayor a la de la inversión.

Gráfico 4.1: Componentes del PIB 1980-1995, Chile. Millones de pesos de 2005 (MM$2005)

Fuente: elaboración propia en base a Braun, Juan et al (2000). En la Tabla 4.7 se puede observar la desviación estándar del consumo, la que alcanza la cifra de 2,759,022, muy superior a la de la inversión, 1,482,769. En este caso, la desviación estándar no representa el hecho de que la inversión debiese ser más volátil. Es por eso que se estima el coeficiente de variación, el que presenta una mayor volatilidad para la inversión respecto del consumo.

Tabla 4.7. Estadística Descriptiva de Componentes del PIB, 1980-1995, Chile. Millones de pesos de 2005 (MM$2005)

Estadístico Consumo Privado

Inversión Total

Gasto de Gobierno

Exportaciones Netas

��𝑥 10,164,447 3,213,594 2,111,575 741,129 𝜎𝜎 2,759,022 1,482,769 200,605 688,978

CV 0.27 0.46 0.10 0.93 Fuente: elaboración propia en base a Braun, Juan et al (2000). 4.3.1. Medidas de Dispersión Frecuencias de Distribución Simple. Al igual que el caso de las medidas de tendencia central, en el caso de las medidas de dispersión también nos encontramos con casos en los cuales se deben analizar frecuencias simples, por lo que el cálculo de los estadísticos varía. En la Tabla 4.7 se tienen los mismos datos de la Tabla 4.4, pero en este caso calcularemos las medidas de dispersión. En primer lugar, el rango de la frecuencia simple es igual a 7-1=6. Del apartado anterior sabemos que la desviación estándar se calcula como la raíz del promedio de las desviaciones respecto a la media al cuadrado. Sin embargo, recurriendo al algebra, podemos encontrar una forma más simple de calcular la desviación estándar.

Page 40: Elementos Cuantitativos de Investigación en las Ciencias ...

40

Tabla 4.7: Tabla de frecuencia simple para puntajes. Puntajes (p) F fa f*p f*p2

1 2 2 2 2 2 3 5 6 12 3 4 9 12 36 4 5 14 20 80 5 4 18 20 100 6 3 21 18 108 7 2 23 14 98 Σ 23 92 436

Fuente: elaboración propia en base a Tabla 4.1. Recordando la fórmula de la desviación estándar (4.11), tenemos lo siguiente:

𝜎𝜎 = �∑(𝑥𝑥𝑝𝑝−��𝑥)2

𝑛𝑛

Dado que al interior de la formula existe un cuadrado de binomio, podemos tomar dicha expresión y desarrollarla: ∑(𝑥𝑥𝐷𝐷 − ��𝑥)2 ∑(𝑥𝑥𝐷𝐷 − ��𝑥)(𝑥𝑥𝐷𝐷 − ��𝑥) ∑(𝑥𝑥𝐷𝐷2 − 2��𝑥𝑥𝑥𝐷𝐷 + ��𝑥2) Aplicando la sumatoria en la expresión, nos queda: Σ𝑥𝑥𝐷𝐷2 − Σ2��𝑥𝑥𝑥𝐷𝐷 + Σ��𝑥2 (4.14) Dejando las constantes por delante de la sumatoria, se obtiene (2.3): Σ𝑥𝑥𝐷𝐷2 − 2��𝑥Σ𝑥𝑥𝐷𝐷 + Σ��𝑥2 (4.15) Dado que el promedio al cuadrado corresponde a una constante, esto es, puede ser igual 25, la sumatoria de dicho valor es igual a n veces 25, esto es, n*25. Por otro lado, como Σ𝑥𝑥𝐷𝐷 = ��𝑥 ∗ 𝐶𝐶, entonces:

Σ𝑥𝑥𝐷𝐷2 − 2��𝑥��𝑥 ∗ 𝐶𝐶 + 𝐶𝐶��𝑥2 Σ𝑥𝑥𝐷𝐷2 − 2��𝑥2𝐶𝐶 + 𝐶𝐶��𝑥2

Σ𝑥𝑥𝐷𝐷2 − ��𝑥2𝐶𝐶 (4.16) Luego, reemplazando la expresión (4.16) en (4.11) nos queda:

𝜎𝜎 = �Σ𝑥𝑥𝑝𝑝2 𝑛𝑛− ��𝑥2 (4.17)

𝜎𝜎 = �Σ𝑓𝑓𝑥𝑥𝑝𝑝2

𝑛𝑛− ��𝑥2 (4.18)

Page 41: Elementos Cuantitativos de Investigación en las Ciencias ...

41

Donde 4.17 es la expresión alternativa para calcular la desviación estándar, y 4.18 es la expresión para calcular la desviación estándar en los casos de frecuencia simple. De hecho, aplicando la fórmula 4.18 sobre los datos de la Tabla 4.7, tomando en consideración que la media estimada es 4, y que x es p, tenemos lo siguiente:

𝜎𝜎 = �Σ𝑓𝑓𝑥𝑥𝑝𝑝2

𝑛𝑛− ��𝑥2

𝜎𝜎 = �43623

− (4)2 = 1.72

Por lo que la desviación estándar corresponde a 1.72. Dado que la varianza es el cuadrado de la desviación estándar, se tiene que 𝜎𝜎2 = 2.96. Por último, el coeficiente de variación es igual a CV= 𝜎𝜎 /��𝑥, por lo que CV=0.43. 4.3.2. Medidas de Dispersión en Datos Agrupados. Para el caso de los datos agregados, tendremos datos como en la Tabla 4.8, clasificados por intervalo, por lo que nuevamente se debe calcular la marca de clase o punto medio (x). Observando la tabla, se tiene que el rango corresponde a 7-1=6. Para calcular la desviación estándar, se recurre nuevamente a la formula derivada en el apartado anterior:

𝜎𝜎 = �Σ𝑓𝑓𝑥𝑥𝑝𝑝2

𝑛𝑛− ��𝑥2

𝜎𝜎 = �46423

− (4.1)2 = 1.83

Tabla 4.8. Tabla de Datos Agrupados para Puntajes

Intervalo x f fa f*x f*x2 1 a 3 2 9 9 18 36 4 a 6 5 12 21 60 300 7 a 9 8 2 23 16 128

Σ 23 94 464 Fuente: elaboración propia en base a Tabla 4.4. Por lo que la varianza corresponde a 𝜎𝜎2 = 3.35, y el coeficiente de variación es de CV=0.45.

4.4. Distribución normal. Los conceptos tratados anteriormente permiten introducir una de las distribuciones más usadas en el trabajo empírico, la distribución normal. Entre las características de esta distribución se tiene que es simétrica, es decir, a partir de la media, se acumula la misma cantidad de datos hacia la izquierda y la derecha. En segundo lugar, es una distribución unimodal (Levin y Levin, 1999). En el gráfico 4.2 se observa una curva normal, donde en el eje de las abscisas están los valores que puede tomar una variable, mientras que en el eje de las ordenadas esta la frecuencia. En el eje de las abscisas se pueden observar desviaciones respecto de la media en unidades de desviación estándar; esto es, 1 implica una distancia de una desviación estándar hacia la derecha respecto de la media, mientras que 2 implica dos desviaciones estándar hacia la derecha respecto de la media. Por el contrario, -3

Page 42: Elementos Cuantitativos de Investigación en las Ciencias ...

42

quiere decir 3 desviaciones estándar hacia la izquierda de la media. Dichas distancias son relevantes pues permiten definir las siguientes áreas de acumulación:

Entre -1σ y 1σ => 68,26% Entre -2σ y 2σ => 95,44% Entre -3σ y 3σ => 99,74%

De acuerdo a lo anterior, entre la media y una desviación estándar hacia la derecha, se encuentra el 34.13% de los datos (68.26/2=34.13), entre la media y dos desviaciones estándar hacia la derecha se encuentra el 47.72% de los datos (95.44/2=47.72), y entre la media y tres desviaciones estándar hacia la derecha se encuentra el 49.87% de los datos (99.74/2=49.87).

Gráfico 4.2. Distribución normal y el área acumulada bajo la curva.

Fuente: Elaboración propia usando el software STATA.

Sin embargo, dado que las distancias definidas por sumas o restas de desviaciones estándar respecto de la media no son los únicos casos que se tienen en la curva normal, es factible obtener los porcentajes de acumulación de cualquier distancia respecto de la media usando la siguiente fórmula (Levin y Levin, 1999):

σxxZ i −= (4.19)

Donde Z = puntaje estandarizado. 𝑥𝑥𝐷𝐷 = variable a estandarizar. ��𝑥 = media. 𝜎𝜎 = desviación estándar Ejemplo 1: la distribución de las notas de un curso presenta una media de 4 y una desviación estándar de 1.72. Si se supone que la distribución está normalmente distribuida, la nota 6.0 tiene el siguiente orden Z: 𝑎𝑎 = 𝑥𝑥𝑝𝑝−��𝑥

𝜎𝜎

𝑎𝑎 = 6−41.72

= 1.16 Esto a su vez implica que es posible elegir percentiles a discreción, lo que nos lleva a hablar del concepto de confianza y que es útil en inferencia estadística. Si queremos hacer un análisis al 90% de confianza, los valores -1,645 y +1,645 en el eje de las abscisas acumulan el 90% de la

Frec

uenc

ia

-3 -2 -1 1 2 3x

Page 43: Elementos Cuantitativos de Investigación en las Ciencias ...

43

probabilidad. El análisis es análogo para los niveles de confianza de 95% (-1,96; +1.96), y 99% (-2.58; +2.58). 4.4.1. Probabilidades en la curva normal. La curva normal nos permite hablar de probabilidades. Una probabilidad se define como la relación entre el número de veces que un evento puede ocurrir y la cantidad total de eventos. En este caso, podemos entender el área de la curva normal como un área de probabilidad total, y las sumas/restas de desviaciones estándar, o los puntajes Z¸ como áreas que definen la acumulación de probabilidades. La probabilidad tiene tres propiedades importantes. La primera implica que la probabilidad siempre se encuentra entre 0 y 1. La segunda dice relación con la regla de la suma, que implica que “la probabilidad de obtener un resultado cualquiera entre varios diferentes es igual a la suma de sus distintas probabilidades” (Levin y Levin, 1999). Esto implica en el ejemplo de los puntajes que la probabilidad de obtener un 5, un 6, o un 7 es de 4

23+ 3

23+ 2

23, lo que equivale a 9

23, es decir, a una

probabilidad de de 0.3913. Una tercera propiedad es la regla de la multiplicación¸ que se usa para casos en los cuales los eventos ocurren en forma sucesiva. Esta regla implica que “la probabilidad de obtener una combinación de resultados que se excluyen mutuamente, es igual al producto de sus probabilidades por separado” (Levin y Levin, 1999). Por ejemplo, ¿cuál es la probabilidad de obtener el mismo número al lanzar el dado dos veces seguidas?. La probabilidad de obtener un número al lanzar el dado (de 6 caras) es de 1

6, mientras que la probabilidad de obtener el mismo número al lanzarlo

nuevamente es de 16. Entonces, la probabilidad de obtener el mismo número dos veces seguidas es

igual a 16

× 16

= 136

, es decir, 0.03. Ejemplo 2: utilizando el ejemplo 1, es posible obtener la probabilidad de que la persona que se seleccione de la muestra tenga una nota entre la media y 6.0. Consultando la tabla de probabilidad de la distribución normal podemos saber exactamente cuál es la probabilidad acumulada de 1.16, la que corresponde a 37.70% desde la media, y a 87.70% de probabilidad acumulada total (37.75+50=87.75)2. Entonces, la probabilidad de obtener una nota entre la media y 6.0 es de 37.70%. Es más, también es posible obtener la probabilidad de que la nota este sobre 6.0, y para esto solo debemos restar a 50, la probabilidad obtenida para 1.16, esto es 50-37.70=12.3. Esto es, la probabilidad de obtener una nota por sobre 6.0 es de 12.3%. El teorema del límite central: Un fuerte argumento para usar la distribución normal es el teorema del límite central. A medida que se extraen suficientes muestras de una población, la distribución de la media muestral se aproximará a una normal, en forma independiente al tamaño de las muestras (Soto, 2010). Esto es, si extraigo bastantes muestras de una población, y se calcula le media de cada una de esas muestras, la distribución de dichas medias se distribuirá normal, siempre que el número de extracciones sea grande. Y es independiente del tamaño de las muestras.

2 Es relativamente simple obtener la probabilidad acumulada total con el software Excel. Para este caso basta con introducir en una celda la siguiente fórmula: =DISTR.NORM.ESTAND(1.16), la que dará por resultado 0.8770.

Page 44: Elementos Cuantitativos de Investigación en las Ciencias ...

44

4.5. Otros conceptos de relevancia en la Estadística Descriptiva. Una distribución de probabilidad a menudo puede resumirse en términos de algunas de sus características, conocidas como los momentos de la distribución. Dos de los momentos más utilizados son la media y la varianza (Gujarati, 1997), que corresponden al primer y segundo momento de una distribución. Sin embargo, a través de los momentos tercero y cuarto es posible construir dos indicadores, uno de asimetría y otro de apuntamiento. Coeficiente de asimetría (CA) o Skewness:

∑=

−−=

n

ii

sxx

nnnCA

1

3

)2(*)1( (4.20)

Respecto a curtosis, el indicador corresponde a:

)2)(2()1(3

)3)(2)(1()1( 24

1 −−−

−−−+

= ∑ = nnn

sxx

nnnnnCurtosis n

ii (4.21)

Los valores que toma cada uno de estos indicadores define la forma de la distribución. Por ejemplo, cuando CA>0 tenemos una distribución con sesgo derecho, mientras que si CA<0, la distribución tiene sesgo izquierdo. Por otro lado, respecto al cuarto momento, la forma de la curva normal presenta una curtosis=3, por lo que si curtosis>3 la distribución tiene un grado de apuntamiento mayor a la normal (leptocúrtica), y si curtosis<3 la distribución tiene un grado de apuntamiento menor a la normal (platicúrtica). ¿Tienen alguna relación estos conceptos con las relaciones entre las medidas de tendencia central media, mediana y moda? Para responder a esta pregunta es posible acudir a la estadística descriptiva de 3 variables tipo. En la Tabla 4.9, para la variable X, la media es casi idéntica a la mediana, mientras que skewness y curtosis implican un leve sesgo negativo y menor grado de apuntamiento que la normal, respectivamente. Para la variable Y, la media es bastante mayor a la mediana, y skewness y curtosis presentan sesgo derecho y un elevado grado de apuntamiento, respectivamente.

Page 45: Elementos Cuantitativos de Investigación en las Ciencias ...

45

Tabla 4.9. Estadística Descriptiva, variables X y Y. sum, detail x ------------------------------------------------------------- Percentiles Smallest 1% 5 5 5% 5 6 10% 5 6 Obs 9 25% 6 7 Sum of Wgt. 9 50% 8 Mean 7.888889 Largest Std. Dev. 1.964971 75% 10 9 90% 10 10 Variance 3.861111 95% 10 10 Skewness -.1518817 99% 10 10 Kurtosis 1.479504 y ------------------------------------------------------------- Percentiles Smallest 1% 5 5 5% 5 6 10% 5 6 Obs 9 25% 6 7 Sum of Wgt. 9 50% 8 Mean 17.33333 Largest Std. Dev. 29.18047 75% 10 9 90% 95 10 Variance 851.5 95% 95 10 Skewness 2.456778 99% 95 95 Kurtosis 7.073819

Fuente: Elaboración propia usando el software STATA.

Referencias Braun, Juan et al (2000), Economía Chilena 1810-1995. Estadísticas Históricas, Documento de Trabajo, Instituto de Economía, Universidad Católica de Chile. Levin, Jack; Levin, William C. (1999). “Fundamentos de Estadística en la Investigación Social”. Oxford University Press. Segunda Edición. Soto, Raimundo (2010). “Notas de Clases, Teoría Econométrica”. Trabajo Docente N° 78. Instituto de Economía, Pontificia Universidad Católica de Chile. ISSN: 0717-7593. Webster, Allen (2000). “Estadística aplicada a los negocios y la economía”. Tercera Edición. McGraw-Hill Interamericana, S.A. Santa Fe de Bogotá, Colombia.

Page 46: Elementos Cuantitativos de Investigación en las Ciencias ...

46

Ejercicios propuestos.

1. Usted tiene los siguientes datos de PIB (Y) a precios constantes. Determine las tasas de variación del PIB del periodo 2010 respecto a 2009, 2008 a 2007, y 2010 respecto a 2007. Y2007=1000, Y2008=1130, Y2009=1456, Y2010=1278.

2. Suponga que tiene las siguientes muestras (A y B) de números: A= 10, 22, 3, 14, 5, 6, 7 B=1, 4, 5, 8, 8, 3, 4 Obtenga los promedios de ambas muestras. ¿Qué muestra tiene una mayor dispersión?

3. Suponga que tiene dos países, A y B, conformados por 5 habitantes (i, ii, iii, iv, y v) y sus respectivos ingresos en la Tabla 1

Tabla 1 personas Pais A Pais B

i 100 20 ii 50 23 iii 30 70 iv 20 96 v 30 40

a) ¿Cuál es el ingreso promedio ( y ) de cada País, y que proporción representa el ingreso

promedio del País A sobre el País B? b) ¿Qué porcentaje representa el ingreso promedio del País B respecto al ingreso promedio del

País A? c) Lleve a escala de 0 a 1 los ingresos de los dos países, donde 0 corresponda a la cifra mínima

de ingreso y 1 a la cifra máxima. ¿Cuál de los países presenta una mayor dispersión del ingreso?

d) Investigue respecto del coeficiente de Gini y presente una definición conceptual en no más de 5 líneas. ¿Cree que sirve ese estadístico para este análisis? Fundamente.

4. Usted se enfrenta a la decisión de tomar un programa de postgrado en el área de la gestión

pública. En la Tabla 2 tiene datos respecto a las diferentes universidades que llevan a cabo el programa.

Tabla 2 Universidad Prestigio

(encuesta) Tasa de reprobación (1er año)

Posibilidades de encontrar trabajo

Cercanía al hogar (km)

U. de Y 0 30% 50% 10 U. de X 1 20% 90% 4 U. de Z 2 15% 65% 5 U. de W 1 50% 100% 8

Suponga que usted desea efectuar la mejor elección posible, pero para eso debe observar sus preferencias. Quiere el máximo prestigio posible, lo que le importa en un 40%. Dado que usted es un alumno esforzado, no le interesa la reprobación, pues usted es capaz de asumir el desafío, razón por la que ésta le importa solo un 5% (sin embargo, si la universidad tiene el nivel más alto en ranking, ésta le importa 0%). Las posibilidades de trabajo le importan un 30%, sin embargo, si se trata de la mejor universidad, usted le exigirá

Page 47: Elementos Cuantitativos de Investigación en las Ciencias ...

47

más al prestigio, razón por la cual le asignará una ponderación de 35%. Respecto a la cercanía al hogar, mientras más cerca mejor. Plantee un índice para efectuar la mejor elección. Considere la inversa proporcional cuando el sub-indicador lo requiera.

5. Tiene los siguientes índices de pobreza para dos países, Z e Y, para tres años, ¿en cuál de los dos países existe una mayor variabilidad de la pobreza? Ocupe todos los estadísticos de dispersión. Z: 3%, 5%, 5% Y: 5%, 7%, 6%

6. “Hay dos panes. Usted se come dos. Yo ninguno. Consumo promedio: un pan por persona”.

Nicanor Parra Utilice la frase de Nicanor Parra y compárela con una situación en la cual haya igualdad total en el consumo de los dos panes (2 personas, 2 panes). ¿Qué puede decir respecto de la desigualdad usando el promedio y la desviación estándar? ¿Aporta el análisis del coeficiente de gini?

7. Si el coeficiente de variación de una muestra es de 3 y su desviación estándar es (100/300)-1

¿Cuál es la media de dicha muestra? ¿Cuál es la varianza?

8. Usted es el jefe del Departamento de Estudios de cierto organismo público. Dentro de los productos estratégicos de dicho organismo está la entrega de subsidios de arancel universitario para aquellos jóvenes de buen rendimiento académico y escasos recursos. Estos subsidios se entregan en base a los resultados obtenidos en la educación secundaria.

El Jefe del Departamento de Subsidios (DESUB), le encarga a usted resolver la forma de asignar los recursos en la muestra de jóvenes inscritos en el programa. Solo se puede asignar el subsidio a dos estudiantes, razón por la que la asignación debe estar muy bien fundamentada. Usted dispone de la siguiente base de datos:

Tabla 3

Nombre

Notas Primero Medio

Notas Segundo Medio

Notas Tercero Medio

Notas Cuarto Medio

Ingreso Familiar

Personas en el Hogar

Manuel 5 5 5.4 7 100 3 Josefina 3 4 5 6.5 200 4 Andrés 6 6.1 6.2 6.2 150 3 Raúl 6 6.5 6.4 6.6 430 6 Clotilde 4 6 7 6 300 5

a) El Jefe del DESUB no sabe de estadísticas ni métodos cuantitativos, razón por lo que le

pide a usted asignar los subsidios de acuerdo al promedio de notas de los 4 años de enseñanza secundaria.

b) El Jefe del DESUB, confundido con su decisión, se acerca nuevamente a usted, y le propone asignar mejor los subsidios de acuerdo al grado de superación anual en el rendimiento de los estudiantes.

Page 48: Elementos Cuantitativos de Investigación en las Ciencias ...

48

c) A esta altura, el Jefe del DESUB tiene un ataque de nervios, pues un asesor le comentó que no está cumpliendo con los productos estratégicos de la organización, pues no ha considerado la variable “escasos recursos” en el análisis. Debido a esto, le pide a usted que distribuya los subsidios considerando el ingreso. En caso de existir problemas, se le pide que decida en base al grado de superación anual.

d) Frente al problema anterior, un asesor le propone dirimir el subsidio en base al nivel de riesgo de los alumnos, considerando como riesgo la variabilidad en las notas.

e) Un profesional de otro departamento le recomienda a usted usar el siguiente ratio para asignar el subsidio: ratio = (promedio de notas) / (ingreso per cápita). Haga el ejercicio y discuta de la conveniencia de usar este método.

f) ¿Se le ocurre a usted otro método? ¿Qué solución propone? (Opcional: 3 respuestas más creativas tendrán 5 décimas en la prueba)

9. Las predicciones de terremoto del Comando de Predicciones Internacionales de Terremotos

(CPIT) y del Red Alert Quake (RAQ) son las siguientes, donde Pi corresponde a la predicción “i”:

P1 P2 P3 P4 CPIT 7,5 7,4 7,5 7,2 RAQ 8 6,5 7 4

Dado que cada organismo ha estimado los terremotos usando sus propias metodologías en forma constante sobre diferentes muestras de datos, se le pide hacer un estudio descriptivo de las predicciones.

a) Aplique todas las medidas de tendencia central vistas en clase. b) Aplique todas las medidas de dispersión vistas en clase. c) ¿Qué estimación parece más confiable? ¿Por qué?

10. Si al promedio de una muestra normal le suma ¼ de la desviación estándar. ¿dentro de que

intervalo, en términos del promedio y la desviación estándar, se encuentra dicho valor?

11. Usted quiere estimar un promedio ponderado de rendimiento a partir de las evaluaciones de tres organizaciones del sector público. Estas evaluaciones son buenas (b), super buenas (sb), y excelentes (e). Si para usted las evaluaciones buenas valen 10, las evaluaciones super buenas valen 30, y las evaluaciones excelentes valen: Peso evaluaciones b*(Peso evaluaciones sb)1/2

Determine la evaluación ponderada de cada organismo en base a la tabla de evaluaciones siguiente: Organismo buenas Super buenas excelentes Ministerio de Salubridad 100 80,1 99,3 Ministerio de Instrucción 99,4 90 93 Ministerio de Desarrollo 95,01 97 93,2

Page 49: Elementos Cuantitativos de Investigación en las Ciencias ...

49

5. Medidas de Asociación. 5.1. Intuición de las medidas de asociación. Hasta el momento nos hemos enfocado en el análisis básico de estadística descriptiva con una variable. Es decir, se ha hecho una revisión aplicada de estadísticos de tendencia central, tales como la moda, la mediana, y el promedio, y de estadísticos de dispersión, tales como el rango, la desviación estándar, la varianza, y el coeficiente de variación. Sin embargo, en la realidad suelen observarse fenómenos que implican la interacción de dos o más variables, tales como la relación entre la escolaridad y los ingresos que percibe una persona, el desempleo y los índices de pobreza, los precios de un mercado particular y las cantidades demandadas. Por ejemplo, en las primeras sesiones conformamos un índice de medición del rendimiento educacional, tal como ((𝐶𝐶𝑡𝑡+1-𝐶𝐶𝑡𝑡)/ 𝐶𝐶𝑡𝑡)*100, donde 𝐶𝐶𝑡𝑡+1 corresponde a las notas del periodo futuro y 𝐶𝐶𝑡𝑡 a las notas del periodo actual. Si el resultado de este indicador corresponde a un porcentaje mayor a 0%, quiere decir que el rendimiento educacional está evolucionando de forma positiva. Sin embargo, ¿Qué determina dicha variación positiva del rendimiento educacional que se mide a través de la evolución de las notas?. Antes de efectuar un análisis un poco más exhaustivo, tal como el que se propone una investigación, es necesario observar relaciones básicas entre las variables, con el objeto de establecer alguna hipótesis relevante. En este panorama se tienen los estadísticos de asociación, entre los cuales se encuentra la co-varianza y el coeficiente de correlación. Si bien estos dos estadísticos se distribuyen de diferente forma, valores elevados en valor absoluto dicen relación con altos grados de correlación o evolución lineal entre las variables. 5.2. Estadísticos de asociación (Covarianza, Coef. de Correlación). Dado que en la realidad existen fenómenos que implican la asociación entre dos o más variables, es necesario conocer las herramientas que permiten conocer y medir dicha asociación. Dichas herramientas pueden ser intuitivas y específicas. En la Tabla 5.1 tenemos datos de ingreso y escolaridad. Aquí la hipótesis principal, presente en gran parte de la literatura de capital humano, es que a mayor escolaridad existe un mayor retorno de la educación, medido ese retorno en este caso, por el nivel de ingreso. La primera aproximación es utilizar una herramienta intuitiva, tal como el análisis gráfico (Gráfico 5.1). Tabla 5.1. Ingreso y Escolaridad

Escolaridad (X) Ingreso (Y) 9 10 8 11 6 5 7 8 7 7 4 5 3 3 2 1

Page 50: Elementos Cuantitativos de Investigación en las Ciencias ...

50

Grafico 5.1: Ingreso y Escolaridad.

Fuente: Elaboración propia en base a 5.1.

Si bien el análisis gráfico permite establecer un grado de relación entre las variables, también es necesario contar con herramientas formales, que permitan establecer en forma específica el nivel de correlación entre las variables.

5.2.1. Covarianza La covarianza corresponde a una medida de asociación que se construye a partir de las diferencias respecto a la media de cada variable, en este caso, X e Y, por lo que establece una relación entre sus variabilidades. Respecto a la variabilidad, recordemos el estadístico usado para medir la dispersión de una muestra como la desviación estándar:

Nxxn

i ix

∑=−

= 12)(

σ (5.1)

Sin embargo, otra medida dice relación con la varianza, la que tiene una relación cuadrática con la desviación estándar:

Nxxn

i ix∑=

−= 1

22 )(

σ (5.2)

Nxxxxn

i iix∑=

−−= 12 ))((

σ (5.3)

Al analizar la fórmula de la varianza, podemos ver que la forma de medir la dispersión dice relación con el cuadrado de las desviaciones respecto de la media. El cuadrado es una forma de neutralizar los valores negativos que se obtienen de las diferencias, pues, los valores se encuentran por abajo y por arriba de la media. Entonces, a medida que estos valores estén más lejos de la media, hacia abajo y hacia arriba, se incremente la variabilidad. Sin embargo, podemos hacer una transformación útil, que implica cambiar el segundo componente de la sumatoria por y. Al hacer esta transformación, inmediatamente obtenemos la covarianza, que mide la variabilidad entre las variables x e y, y cuya fórmula viene definida por (Spiegel, 1976: 82):

05

10In

gres

o (Y

)

2 4 6 8 10Escolaridad (X)

Page 51: Elementos Cuantitativos de Investigación en las Ciencias ...

51

Nyyxxn

i iixy

∑=−−

= 1))((

σ (5.4)

Al analizar la ecuación 5.4 se tiene que si el valor de x esta por sobre su media el resultado será un valor positivo, asimismo, si y esta por sobre su media también tendrá un valor positivo, y su producto (𝑥𝑥𝐷𝐷 − ��𝑥)(𝑦𝑦𝐷𝐷 − 𝑦𝑦�), tendrá un valor positivo. Si por el contrario, x está por debajo de su media, e y por arriba de su media, su producto (𝑥𝑥𝐷𝐷 − ��𝑥)(𝑦𝑦𝐷𝐷 − 𝑦𝑦�) tendrá un valor negativo. Este es el sentido de la covarianza. Al hacer operar la covarianza con los datos de la Tabla 5.1, se tiene lo siguiente:

Tabla 5.2. Ingreso y Escolaridad N Escolaridad

(X) Ingreso

(Y) )( xxi − )( yyi − ))(( yyxx ii −−

1 9 10 3.25 3.75 12.1875 2 8 11 2.25 4.75 10.6875 3 6 5 0.25 -1.25 -0.3125 4 7 8 1.25 1.75 2.1875 5 7 7 1.25 0.75 0.9375 6 4 5 -1.75 -1.25 2.1875 7 3 3 -2.75 -3.25 8.9375 8 2 1 -3.75 -5.25 19.6875

x , y 5.75 6.25 ∑=−−

n

i ii yyxx1

))(( 56.5

xσ , yσ 2.33 3.19 Nyyxxn

i ii /))((1∑ =

−− 7.0625

Fuente: Elaboración propia en base a 5.1 Entonces, 𝜎𝜎𝑥𝑥𝑦𝑦=7,0625, lo que quiere decir que existe una relación de carácter positivo entre las variables x e y. Si por el contrario, el resultado de ∑ (𝑥𝑥𝐷𝐷 − ��𝑥)(𝑦𝑦𝐷𝐷 − 𝑦𝑦�)𝑛𝑛

𝐷𝐷=1 fuera negativo, entonces la covarianza seria negativa. Entonces, −∞ < 𝜎𝜎𝑥𝑥𝑦𝑦 < +∞, con lo que la covarianza da una medida de evolución lineal entre las variables que se distribuye entre el menos infinito y el más infinito. Cabe destacar que la covarianza se puede estimar también de la siguiente forma:

𝜎𝜎𝑥𝑥𝑦𝑦 = ∑(𝑥𝑥𝑝𝑝−��𝑥)(𝑦𝑦𝑝𝑝−𝑦𝑦�)𝑁𝑁

= ∑ 𝑥𝑥𝑝𝑝𝑦𝑦𝑝𝑝𝑁𝑁− ��𝑥𝑦𝑦� (5.5)

Para llegar a la expresión 5.5, se puede partir de 5.4, de la siguiente forma: 𝜎𝜎𝑥𝑥𝑦𝑦 = ∑(𝑥𝑥𝑝𝑝−��𝑥)(𝑦𝑦𝑝𝑝−𝑦𝑦�)

𝑁𝑁

𝜎𝜎𝑥𝑥𝑦𝑦 = ∑(𝑥𝑥𝑝𝑝𝑦𝑦𝑝𝑝−𝑥𝑥𝑝𝑝𝑦𝑦�−��𝑥𝑦𝑦𝑝𝑝+��𝑥𝑦𝑦�)

𝑁𝑁

𝜎𝜎𝑥𝑥𝑦𝑦 = ∑𝑥𝑥𝑝𝑝𝑦𝑦𝑝𝑝−∑𝑥𝑥𝑝𝑝𝑦𝑦�−∑𝑦𝑦𝑝𝑝��𝑥+∑ ��𝑥𝑦𝑦�

𝑁𝑁

𝜎𝜎𝑥𝑥𝑦𝑦 = ∑𝑥𝑥𝑝𝑝𝑦𝑦𝑝𝑝−𝑦𝑦� ∑𝑥𝑥𝑝𝑝−��𝑥 ∑𝑦𝑦𝑝𝑝+𝑁𝑁��𝑥𝑦𝑦�

𝑁𝑁

Page 52: Elementos Cuantitativos de Investigación en las Ciencias ...

52

𝜎𝜎𝑥𝑥𝑦𝑦 = �∑ 𝑥𝑥𝐷𝐷𝑦𝑦𝐷𝐷 − 𝑁𝑁 �1𝑁𝑁� 𝑦𝑦� ∑ 𝑥𝑥𝐷𝐷 − 𝑁𝑁 �1

𝑁𝑁� ��𝑥 ∑ 𝑦𝑦𝐷𝐷 + 𝑁𝑁��𝑥𝑦𝑦�� 1

𝑁𝑁

𝜎𝜎𝑥𝑥𝑦𝑦 = �∑ 𝑥𝑥𝐷𝐷𝑦𝑦𝐷𝐷 − 𝑁𝑁𝑦𝑦� ∑𝑥𝑥𝑝𝑝

𝑁𝑁− 𝑁𝑁��𝑥 ∑𝑦𝑦𝑝𝑝

𝑁𝑁+ 𝑁𝑁��𝑥𝑦𝑦�� 1

𝑁𝑁

𝜎𝜎𝑥𝑥𝑦𝑦 = (∑𝑥𝑥𝐷𝐷𝑦𝑦𝐷𝐷 − 𝑁𝑁𝑦𝑦���𝑥 − 𝑁𝑁��𝑥𝑦𝑦� + 𝑁𝑁��𝑥𝑦𝑦�) 1

𝑁𝑁

𝜎𝜎𝑥𝑥𝑦𝑦 = ∑𝑥𝑥𝑝𝑝𝑦𝑦𝑝𝑝−𝑁𝑁𝑦𝑦���𝑥−𝑁𝑁��𝑥𝑦𝑦�+𝑁𝑁��𝑥𝑦𝑦�

𝑁𝑁

𝜎𝜎𝑥𝑥𝑦𝑦 = ∑𝑥𝑥𝑝𝑝𝑦𝑦𝑝𝑝−𝑁𝑁𝑦𝑦���𝑥

𝑁𝑁

𝜎𝜎𝑥𝑥𝑦𝑦 = ∑𝑥𝑥𝑝𝑝𝑦𝑦𝑝𝑝

𝑁𝑁− ��𝑥𝑦𝑦� (5.6)

Por lo que la equivalencia 5.5 es correcta. Es más, la ecuación 5.6 presenta una mayor simpleza a la hora de estimar la covarianza, pues no requiere calcular las diferencias entre las observaciones.

Observación 1: Sin embargo, la distribución de la covarianza representa una desventaja, pues ésta dependerá de la unidad de medición de las variables. Por ejemplo si multiplico la variable escolaridad por 1000, ¿Qué valor toma la covarianza?. Para solucionar este problema necesito considerar lo siguiente:

a. Un estadístico que no dependa de las unidades de medida (que sea a-dimensional). b. Estandarizado en una escala de fácil uso e intuitiva, de 0 a 1, o de 0% a 100%. c. Que considere la variabilidad máxima de cada variable para estandarizar (para poder

cumplir con “a” y “b”)

5.2.2. Coeficiente de Correlación Los problemas de la covarianza para medir asociación pueden ser paliados considerando el coeficiente de correlación de Pearson. El coeficiente de Correlación de Pearson es una forma de solucionar a, b, y c. Este se define como (Spiegel, 1976: 82).

yx

xyxy σσ

σρ = (5.7)

Que corresponde al coeficiente de correlación entre x e y, y que se construye a partir de la razón entre la covarianza y el producto de las desviaciones estándar de las muestras x e y. ¿Qué determina su signo? Entonces, el coeficiente de correlación se distribuye de la siguiente forma: −1 ≤ 𝜌𝜌𝑥𝑥𝑦𝑦 ≤ +1. Además, el coeficiente de correlación puede aproximarse a los siguientes valores dependiendo del grado de evolución lineal entre las variables.

Page 53: Elementos Cuantitativos de Investigación en las Ciencias ...

53

Grafico 5.2: Ejemplos de Correlación.

(a) (b) (c) 1+≈xyρ 1−≈xyρ 0≈xyρ

A modo de ejemplo, en nuestro ejercicio anterior 𝜎𝜎𝑥𝑥 = 2.33, 𝜎𝜎𝑦𝑦 = 3.19, y 𝜎𝜎𝑥𝑥𝑦𝑦 = 7.0625, entonces el coeficiente de correlación entre x e y corresponde a:

95.0)19.3)(33.2(

0625.7===

yx

xyxy σσ

σρ

Lo que quiere decir existe un alto grado de evolución entre las variables. Observación 1: Para observar de qué forma concreta se resuelven a, b, y c, solo resta explicitar los componentes que conforman el coeficiente de correlación. Esto es, explicitando 5.6: 𝜌𝜌𝑥𝑥𝑦𝑦 = 𝜎𝜎𝑥𝑥𝑦𝑦

𝜎𝜎𝑥𝑥𝜎𝜎𝑦𝑦

Reemplazado las formulas de la covarianza y la desviación estándar que ya conocemos, se tiene:

𝜌𝜌𝑥𝑥𝑦𝑦 =∑�𝑥𝑥𝐶𝐶−𝑥𝑥��(𝑦𝑦𝐶𝐶−𝑦𝑦�)

𝑁𝑁

�∑(𝑥𝑥𝑝𝑝−𝑥𝑥�)2

𝑁𝑁�∑(𝑦𝑦𝑝𝑝−𝑦𝑦�)2

𝑁𝑁

𝜌𝜌𝑥𝑥𝑦𝑦 =∑(𝑥𝑥𝐶𝐶−𝑥𝑥�)�𝑦𝑦𝐶𝐶−𝑦𝑦��

1𝑁𝑁

�1𝑁𝑁�∑(𝑥𝑥𝑝𝑝−��𝑥)2�1

𝑁𝑁�∑(𝑦𝑦𝑝𝑝−𝑦𝑦�)2

𝜌𝜌𝑥𝑥𝑦𝑦 =∑(𝑥𝑥𝐶𝐶−𝑥𝑥�)�𝑦𝑦𝐶𝐶−𝑦𝑦��

1𝑁𝑁

�∑(𝑥𝑥𝑝𝑝−��𝑥)2�∑(𝑦𝑦𝑝𝑝−𝑦𝑦�)2��1𝑁𝑁�

2

𝜌𝜌𝑥𝑥𝑦𝑦 =∑(𝑥𝑥𝐶𝐶−𝑥𝑥�)�𝑦𝑦𝐶𝐶−𝑦𝑦��

�∑(𝑥𝑥𝑝𝑝−��𝑥)2�∑(𝑦𝑦𝑝𝑝−𝑦𝑦�)21𝑁𝑁𝑁𝑁1

𝜌𝜌𝑥𝑥𝑦𝑦 =

∑(𝑥𝑥𝐶𝐶−𝑥𝑥�)�𝑦𝑦𝐶𝐶−𝑦𝑦���∑(𝑥𝑥𝑝𝑝−��𝑥)2�∑(𝑦𝑦𝑝𝑝−𝑦𝑦�)2

(5.8) Ahora, si se supone que 𝑥𝑥𝐷𝐷 = 𝑦𝑦𝐷𝐷, entonces la expresión 5.8, queda como 5.9, pues al ser idénticas las variables, la correlación entre ellas será igual a 1.

Page 54: Elementos Cuantitativos de Investigación en las Ciencias ...

54

𝜌𝜌𝑥𝑥𝑦𝑦 = ∑(𝑥𝑥𝐶𝐶−𝑥𝑥�)2

��∑(𝑥𝑥𝑝𝑝−��𝑥)2�2

𝜌𝜌𝑥𝑥𝑦𝑦 = ∑(𝑥𝑥𝐶𝐶−𝑥𝑥�)2

∑(𝑥𝑥𝑝𝑝−��𝑥)2 = 1 (5.9) Por el contrario, si 𝑥𝑥𝐷𝐷 = −𝑦𝑦𝐷𝐷, la expresión 5.8 queda como:

𝜌𝜌𝑥𝑥𝑦𝑦 = ∑(𝑥𝑥𝐶𝐶−𝑥𝑥�)(−𝑥𝑥𝐶𝐶−(−𝑥𝑥�))

�∑(𝑥𝑥𝑝𝑝−��𝑥)2�∑(−𝑥𝑥𝐶𝐶−(−𝑥𝑥�))2

𝜌𝜌𝑥𝑥𝑦𝑦 = ∑(𝑥𝑥𝐶𝐶−𝑥𝑥�)(−𝑥𝑥𝐶𝐶+𝑥𝑥�)

�∑(𝑥𝑥𝑝𝑝−��𝑥)2�∑(−𝑥𝑥𝐶𝐶+𝑥𝑥�)2

𝜌𝜌𝑥𝑥𝑦𝑦 = ∑(𝑥𝑥𝐶𝐶−𝑥𝑥�)(𝑥𝑥𝐶𝐶−𝑥𝑥�)(−1)

�∑(𝑥𝑥𝑝𝑝−��𝑥)2�∑((𝑥𝑥𝐶𝐶−𝑥𝑥�)(−1))2

𝜌𝜌𝑥𝑥𝑦𝑦 = ∑(𝑥𝑥𝐶𝐶−𝑥𝑥�)(𝑥𝑥𝐶𝐶−𝑥𝑥�)(−1)

�∑(𝑥𝑥𝑝𝑝−��𝑥)2�∑(𝑥𝑥𝐶𝐶−𝑥𝑥�)2�(−1)2

𝜌𝜌𝑥𝑥𝑦𝑦 = ∑(𝑥𝑥𝐶𝐶−𝑥𝑥�)(𝑥𝑥𝐶𝐶−𝑥𝑥�)(−1)

��∑(𝑥𝑥𝑝𝑝−��𝑥)2�2√1

𝜌𝜌𝑥𝑥𝑦𝑦 = ∑(𝑥𝑥𝑝𝑝−��𝑥)2(−1)

∑(𝑥𝑥𝑝𝑝−��𝑥)2 = −1 (5.10)

Por lo que el coeficiente de correlación se distribuye de -1 a 1. En este caso consideramos casos extremos, en los cuales la variable está correlacionada perfectamente en forma directa (𝑥𝑥𝐷𝐷 = 𝑦𝑦𝐷𝐷), y correlacionada perfectamente en forma indirecta (𝑥𝑥𝐷𝐷 = −𝑦𝑦𝐷𝐷). La realidad se encuentra entre estos casos, pues es poco probable que dos variables estén perfectamente correlacionadas. En el extremo, si no existe ninguna relación entre las variables, el coeficiente de correlación es cero.

Referencias Spiegel, Murray R. (1976) “Teoría y Problemas de Probabilidad y Estadística”. McGRAW-HILL, México. S. A. de C. V.

Page 55: Elementos Cuantitativos de Investigación en las Ciencias ...

55

Ejercicios Propuestos.

1. Usted ha sido contratado hace dos días en el Departamento de Investigación y Proyección de un organismo público relacionado a la Salud. En la unidad donde se desempeña, le han encargado a su equipo obtener alguna medida de asociación entre trastornos músculo-esqueléticos (TME) y variables de carácter socioeconómico (una medida de desigualdad y pobreza).

Usted dispone de la siguiente base de datos, donde aparece información para 6 provincias que corresponden a la población de estudio. Esta es la oportunidad de demostrar la calidad de su trabajo!! Tabla 1

Provincias Personas con TME Población Coeficiente de GINI

(de 0 a 100%) Nº Personas

Pobres A 5 100 65 30 B 4 250 45 26 C 8 270 90 40 D 3 230 20 30

a. Obtenga la co-varianza entre el porcentaje de personas con TME y el coeficiente de GINI

de cada provincia. ¿Por qué se propone usar el porcentaje de personas-TME?

b. Obtenga la co-varianza entre el porcentaje de personas con TME y el porcentaje de personas pobres de la provincia. ¿Qué variable aparenta estar más relacionada a los casos de TME?

c. Ahora obtenga el coeficiente de correlación entre las personas con TME y la desigualdad, y personas con TME y la pobreza. Use las variables debidamente corregidas por población y use la siguiente información:

Desviación estándar poblacional para el porcentaje de casos TME: 1,46 Desviación estándar poblacional para el porcentaje de casos pobres: 7,63 Desviación estándar poblacional para la desigualdad: 25,74.

d. ¿Es consistente el resultado de 3) con los resultados de 1) y 2)? ¿Qué puede decir con

respecto a esto? ¿En qué medida confía más?

e. Diga algo respecto a las desviaciones estándar expuestas en 3), transfórmelas a varianza, y luego grafique considerando en el eje de abscisas la primera y en el eje de ordenadas la segunda. ¿A qué función corresponde la relación expuesta?

Page 56: Elementos Cuantitativos de Investigación en las Ciencias ...

56

2. En los siguientes gráficos de dispersión señale de qué signo debería ser la covarianza y el coeficiente de correlación.

(a) (b) (c) (d)

Hasta el momento solo se ha visto correlación, y no hemos incursionado en la causalidad. No obstante, si quisiéramos señalar que existe causalidad, debemos plantear las relaciones de la siguiente forma: y=f(x), es decir, y es una función de x. Ayudándose de su intuición, plantee una ecuación hipotética para las relaciones entre las variables x e y en los gráficos del (a) al (d).

Page 57: Elementos Cuantitativos de Investigación en las Ciencias ...

57

5.3. Otros estadísticos de asociación. Como ya hemos visto, en el análisis empírico es frecuente tener fenómenos en los cuales se da la interrelación entre dos o más variables, para lo cual es útil usar el análisis gráfico desde el punto de vista intuitivo, y estadísticos de asociación desde el punto de vista formal. La medida básica dentro de los estadísticos formales es la covarianza, sin embargo, dado que ésta no entrega un valor estandarizado de correlación, se suele utilizar el coeficiente de correlación de Pearson. Sin embargo, también existen otros coeficientes de correlaciones, como el de Spearman, cuya fórmula y características pasamos a revisar a continuación.

5.3.1. Coeficiente de correlación de Spearman Si bien el coeficiente de correlación de Pearson es bastante útil y corresponde a uno de los más utilizados para medir asociación lineal, existen ciertos casos en los cuales estamos interesados en medir la relación entre el ranking de las variables más que la relación entre sus niveles. Esto se puede dar debido a la naturaleza de las variables, que pueden corresponder a variables ordinales, o porque estamos interesados en obtener una medida más conservadora de correlación, inmune a datos extremos y muy alejados de la muestra. Para estos casos, se usa el coeficiente de correlación de Spearman (Levin y Levin, 1999), cuya estimación se realiza de la siguiente forma:

)1()(6

1 21

2

−−= ∑ =

nnRR

rn

i xysxy (5.10)

Donde (𝑅𝑅𝑦𝑦 − 𝑅𝑅𝑥𝑥) corresponde a la diferencia entre el ranking de la variable y y la variable x. El ranking se diseña de la siguiente forma: la variable de mayor (menor) valor en y tiene ranking=1, la segunda de mayor (menor) valor tiene ranking=2, y así sucesivamente. Ej.: muestra A, ranking entre paréntesis: 1(4), 2(3), 3(2), 4(1). Considere los datos de la Tabla 5.3 (Levin & Levin, 1999: 217) donde las personas se encuentran ordenadas por rango, donde Miguel tiene el más alto estatus socioeconómico y Araceli el mayor tiempo viendo TV.

Tabla 5.3. Cálculo del Coeficiente de Correlación de Spearman Entrevistado Estatus

Socioeco. (Rx) Tiempo empleado en ver la TV (Ry)

)( xy RR − 2)( xy RR −

Miguel 1 2 1 1 Araceli 2 1 -1 1 Juan 3 3 0 0 Norma 4 5 1 1 María 5 4 -1 1 Tomás 6 8 2 4 Rafael 7 6 -1 1 Alejandra 8 7 -1 1 ∑=

−n

i xy RR1

2)( 10

Fuente: Levin y Levin (1999). De acuerdo a los cálculos de la Tabla 1, el coeficiente de correlación de Spearman es igual a:

Page 58: Elementos Cuantitativos de Investigación en las Ciencias ...

58

881.01190.01504601

)164(8601

)18(8)10(61

)1()(6

1 221

2

=−=−=−

−=−

−=−

−−= ∑ =

nnRR

rn

i xysxy

Su interpretación es idéntica a la del coeficiente de correlación de Pearson, por lo que se tiene un alto grado de correlación entre los datos. La literatura señala que este coeficiente es menos sensible a los datos extremos que el coeficiente de Pearson ¿Por qué?. Observación 1: A menudo llama la atención la fórmula del coeficiente de correlación de Spearman, sin embargo, dicha fórmula nace de la misma fórmula del Pearson. A continuación se deriva el coeficiente de Spearman siguiendo la metodología de Sarabia y Pascual (2005). Consideremos la formula 5.7:

𝜌𝜌𝑥𝑥𝑦𝑦 =∑(𝑥𝑥𝐶𝐶−𝑥𝑥�)�𝑦𝑦𝐶𝐶−𝑦𝑦��

�∑(𝑥𝑥𝑝𝑝−��𝑥)2�∑(𝑦𝑦𝑝𝑝−𝑦𝑦�)2 (5.7)

Dado que se está trabajando exclusivamente con rankings, y por ende, ordenamientos de números con un espacio uniforme entre ellos, se puede obtener la media de estos, la que corresponde a: ��𝑥 = 𝑦𝑦� = 1

𝑛𝑛∑ 𝑥𝑥𝐶𝐶𝐶𝐶𝐶𝐶=1 = 1

𝑛𝑛∑ 𝐶𝐶𝐶𝐶𝐶𝐶=1 = 1

𝐶𝐶𝐶𝐶(𝐶𝐶+1)

2 = 𝐶𝐶+12 (5.11)

Donde se utiliza el hecho de que la sumatoria de cualquier serie de 1 a n es igual a n(n+1)/2. Por ejemplo, la suma de 1 a 3 es 1+2+3=6. Con la fórmula es 3(3+1)/2=6. Por otro lado, sabemos que las diferencias respecto de la media al cuadrado se pueden expresar de la siguiente forma: ∑(𝑥𝑥𝐷𝐷 − ��𝑥)2 = ∑𝑥𝑥𝐷𝐷2 − 𝐶𝐶��𝑥2 (5.12) Y reemplazando en la última expresión algunas de las identidades de la ecuación 5.11, se obtiene que:

∑(𝑥𝑥𝐷𝐷 − ��𝑥)2 = ∑𝑥𝑥𝐷𝐷2 − 𝐶𝐶��𝑥2 = ∑ 𝐶𝐶2 − 𝐶𝐶 �𝐶𝐶+12 �

2 (5.13)

En este punto, se puede utilizar otra identidad de las sumatorias, la que consiste en que ∑ 𝐶𝐶2 =𝑛𝑛

𝐷𝐷=1𝑛𝑛(𝑛𝑛+1)(2𝑛𝑛+1)

6. Reemplazando en 5.13 se tiene:

∑(𝑥𝑥𝐷𝐷 − ��𝑥)2 = 𝑛𝑛(𝑛𝑛+1)(2𝑛𝑛+1)

6− 𝑛𝑛(𝑛𝑛+1)2

4

= 𝑛𝑛(𝑛𝑛+1)(2𝑛𝑛+1)6

− 𝑛𝑛(𝑛𝑛2+2𝑛𝑛+1)4

= 𝑛𝑛(𝑛𝑛+1)(2𝑛𝑛+1)6

− (𝑛𝑛3+2𝑛𝑛2+𝑛𝑛)4

= 2(2𝑛𝑛3+3𝑛𝑛2+𝑛𝑛)12

− 3(𝑛𝑛3+2𝑛𝑛2+𝑛𝑛)12

= 4𝑛𝑛3+6𝑛𝑛2+2𝑛𝑛−3𝑛𝑛3−6𝑛𝑛2−3𝑛𝑛12

= 𝑛𝑛3−𝑛𝑛12

(5.14) Finalmente, la suma de los cuadrados de las diferencias entre rankings es: ∑𝑑𝑑𝐷𝐷2 = ∑(𝑥𝑥𝐷𝐷 − 𝑦𝑦𝐷𝐷)2 = ∑[(𝑥𝑥𝐷𝐷 − ��𝑥) − (𝑦𝑦𝐷𝐷 − 𝑦𝑦�)]2

Page 59: Elementos Cuantitativos de Investigación en las Ciencias ...

59

= ∑(𝑥𝑥𝐷𝐷 − ��𝑥)2 + ∑(𝑦𝑦𝐷𝐷 − 𝑦𝑦�)2 − 2∑(𝑥𝑥𝐷𝐷 − ��𝑥)(𝑦𝑦𝐷𝐷 − 𝑦𝑦�) (5.15) A continuación se despeja el último miembro del lado derecho de la ecuación 5.15, pues de esta forma se obtiene el numerador del coeficiente de Pearson: ∑𝑑𝑑𝐷𝐷2 = ∑(𝑥𝑥𝐷𝐷 − ��𝑥)2 + ∑(𝑦𝑦𝐷𝐷 − 𝑦𝑦�)2 − 2∑(𝑥𝑥𝐷𝐷 − ��𝑥)(𝑦𝑦𝐷𝐷 − 𝑦𝑦�) ∑(𝑥𝑥𝐷𝐷 − ��𝑥)(𝑦𝑦𝐷𝐷 − 𝑦𝑦�) = 1

2(∑(𝑥𝑥𝐷𝐷 − ��𝑥)2 + ∑(𝑦𝑦𝐷𝐷 − 𝑦𝑦�)2 − ∑𝑑𝑑𝐷𝐷2)

∑(𝑥𝑥𝐷𝐷 − ��𝑥)(𝑦𝑦𝐷𝐷 − 𝑦𝑦�) = 1

2�𝑛𝑛

3−𝑛𝑛12

+ 𝑛𝑛3−𝑛𝑛12

− ∑𝑑𝑑𝐷𝐷2� = 𝑛𝑛3−𝑛𝑛12

− 12∑𝑑𝑑𝐷𝐷2 (5.16)

Ahora, reemplazando todas las expresiones en la fórmula del coeficiente de Pearson, se tiene la ecuación 5.17:

𝜌𝜌𝑥𝑥𝑦𝑦 =∑(𝑥𝑥𝐶𝐶−𝑥𝑥�)�𝑦𝑦𝐶𝐶−𝑦𝑦��

�∑(𝑥𝑥𝑝𝑝−��𝑥)2�∑(𝑦𝑦𝑝𝑝−𝑦𝑦�)2

𝑑𝑑𝑥𝑥𝑦𝑦 =𝑛𝑛3−𝑛𝑛12 − 12∑𝑑𝑑𝑝𝑝

2

�𝑛𝑛3−𝑛𝑛12 𝑥𝑥 𝑛𝑛

3−𝑛𝑛12

(5.17)

Y el coeficiente de correlación de Spearman es:

𝑑𝑑𝑥𝑥𝑦𝑦 =𝑛𝑛3−𝑛𝑛12 − 12∑𝑑𝑑𝑝𝑝

2 𝑛𝑛3−𝑛𝑛12

= 1 − 12𝑛𝑛3−𝑛𝑛

12∑𝑑𝑑𝐷𝐷2

𝑑𝑑𝑥𝑥𝑦𝑦 = 1 − 6∑𝑑𝑑𝑝𝑝

2

𝑛𝑛(𝑛𝑛2−1)

5.3.2. Aplicaciones con medidas de asociación. Otro elemento de importancia en el análisis de datos dice relación con la matriz de correlación. Esta matriz nos ofrece información cuando se está analizando la correlación entre una serie de variables antes de realizar un análisis de tipo explicativo. En la Tabla 1 se tiene una matriz de correlaciones de 3x3 en la cual se tienen los coeficientes de correlación de Pearson. ¿Por qué hay espacios en blanco en dicha matriz?

Tabla 5.4. Matriz de correlaciones

1x 2x 3x

1x 11xxρ

2x 12 xxρ 22 xxρ

3x 13 xxρ

23 xxρ 33 xxρ

Donde

11xxρ =22 xxρ =

33 xxρ =1.

Page 60: Elementos Cuantitativos de Investigación en las Ciencias ...

60

Referencias. Sarabia Alegría, José María; Pascual Sáez, Marta (2005). “Curso básico de estadística para economía y administración de empresas”. Textos Universitarios, n° 2, Ciencias Sociales, Universidad de Cantabria.

Page 61: Elementos Cuantitativos de Investigación en las Ciencias ...

61

Ejercicios propuestos.

1. Demuestre que la covarianza es igual a la expresión (1):

yxn

yxs

n

i iixy −= ∑ =1 (1)

¿Qué método le resulta más eficiente para estimar la covarianza?

2. Suponga que tiene los siguientes datos para estimar el coeficiente de correlación de Spearman. Organice los datos por Ranking y luego realice los cálculos necesarios. Tabla 1. Datos

X y 18 15 17 18 15 12 12 16 10 6 9 10 8 8 8 7 5 5 1 2

3. ¿Cuál es la diferencia entre la co-varianza y el coeficiente de correlación? Expréselo

formalmente señalando la intuición detrás de las expresiones. ¿Qué determina el signo del coeficiente de correlación?

4. Ahora estime el coeficiente de correlación de Pearson para los mismos datos de la Tabla 1. ¿Existe alguna relación entre los coeficientes? ¿Cuál es más elevado y por qué?

5. Estime la matriz de correlaciones para los siguientes datos. ¿Cuáles corresponden a las variables menos correlacionadas? Tabla 2. Datos

X Y Z 1 2.33 6 2 4 5 3 5 1

Page 62: Elementos Cuantitativos de Investigación en las Ciencias ...

62

6. Elementos de Inferencia Estadística

6.1. El porqué del uso de muestras. En primer lugar es necesario comprender que se entiende por inferencia estadística. En los capítulos anteriores se revisaron los fundamentos de la estadística descriptiva, es decir, todos aquellos estadísticos que nos permiten extraer información de una agrupación de datos, referentes a su posición, su dispersión, y otras características particulares. Asimismo, se revisaron estadísticos referentes a la asociación del comportamiento de dos variables. Sin embargo, en dichas ocasiones se asumió que los datos con los que contábamos correspondían a una población. Ese es un supuesto simplificador, pues en la realidad no necesariamente los datos con los que contamos corresponden a datos representativos del fenómeno que queremos estudiar, debido a diferentes restricciones. Estas restricciones, como la disponibilidad de los datos, el tiempo del investigador, sus recursos, conllevan a la elección de muestras. En este contexto, es de interés determinar si los datos que tenemos, y por ende sus estadísticos, permiten hacer inferencia respecto de los datos de la población. Las secciones siguientes se basan en Levin y Levin (1999).

6.2. Métodos de Muestreo. Siguiendo a Levin y Levin (1999), los métodos de muestreo se pueden dividir en muestreo no aleatorio y muestreo aleatorio. De acuerdo a los autores, para el caso de los métodos de muestreo no aleatorio se encuentra el muestreo por accidente y el muestreo por cuota. El primero implica que el investigador no tiene ninguna restricción en la elección de la muestra, salvo la conveniencia, mientras que el segundo implica que ciertas características de la población se encuentren representadas en la muestra. Por ejemplo, si en una población de 1000 personas hay 600 mujeres y 400 hombres, y quiero que una muestra de 100 personas (n) conserve el mismo nivel de representatividad desde el punto de vista del sexo, debo escoger a 60 mujeres y 40 hombres. El muestreo aleatorio, por el contrario, implica que cada elemento de una población tiene la misma probabilidad de aparecer en la muestra, y entre estos se tiene el muestro aleatorio simple, el muestreo sistemático, y el muestreo estratificado. Suponiendo que se tiene una lista con toda la población de N personas, el muestreo aleatorio simple implica que la elección aleatoria de una muestra n de la población no sigue ningún patrón predeterminado, por el contrario, surge del azar, para lo que es útil generar números aleatorios, los que pueden servir para llevar a cabo la selección. El muestreo sistemático consiste en seleccionar una iésima persona de la población en forma iterativa hasta completar el n deseado (Webster, 2000). Por ejemplo, si se define i=3, y se ordenan los datos de forma aleatoria, se debe definir la primera observación de la muestra, que debe estar entre 1 y 3. Si se elige 2 por ejemplo, la elección implica elegir los elementos [2, 2+(i), 2+2(i), 2+3(i)]. Entonces, se eligen los elementos que aparecen en negrita en la siguiente lista de números, pues tienen las posiciones 2, 5, 8 y 11.

6, 5, 7, 8, 9, 4, 6, 5, 8, 4, 6. Por último, el muestreo estratificado implica el subdividir la población en estratos, dependiendo de cuáles son las variables que considere relevante. Por ejemplo, se puede subdividir la población en tramos de ingreso y color político, y luego aplicar muestreo aleatorio sobre cada tramo definido.

Page 63: Elementos Cuantitativos de Investigación en las Ciencias ...

63

6.3. Error de muestreo. En la práctica es frecuente que en la muestra que tenemos exista error de muestreo. Esto es, si por ejemplo se tiene una muestra N, que tiene una media poblacional µ, y si obtenemos tres muestras de la población, n1, n2, y n3, cada una con sus propias medias, ��𝑥1, ��𝑥2, y ��𝑥3, no es extraño que dichas medias no coincidan del todo con la media poblacional, µ. Esto se da, pues si bien se elige una muestra aleatoria, siempre está la posibilidad de que nuestros datos provengan de un sector particular o sesgado de la población. En forma adicional, así como cada muestra tiene su propia media, cada una de estas también tienen asociada su propia desviación estándar, por lo que al diferenciar, tenemos la media y la desviación estándar poblacional, µ y σ, respectivamente, y la media y la desviación estándar de la muestra, ��𝑥 y s, respectivamente. Sin embargo, existe un modelo teórico que nos permite relacionar las medias muestrales con la población. Por ejemplo, si se saca el mayor número posible de muestras del mismo tamaño de una población, digamos n1, n2,…,nz, luego se obtiene el promedio de cada muestra, es decir, ��𝑥1, ��𝑥2, … ,��𝑥𝑧𝑧, y después se construye una distribución a partir de las medias estimadas, se obtiene lo que se conoce como distribución muestral de medias. Esta distribución tiene las siguientes propiedades (Levin & Levin, 1999: 102):

i. La distribución muestral de medias se aproxima a una curva normal, ii. La media de una distribución muestral de medias es igual a la verdadera media de la

población, iii. La desviación estándar de una distribución muestral de medias es menor que la desviación

estándar de la población (¿Por qué?).

6.4. Distribución normal en la inferencia. Conociendo las propiedades de la distribución muestral de medias, podemos acudir a la distribución normal, y usar sus propiedades para la inferencia. En este sentido, de la sección de “Distribución Normal” sabemos que ésta tiene áreas de acumulación de probabilidades, y también tenemos información respecto de algunos intervalos de acumulación. En el Gráfico 6.1 se observan las áreas que comprende cada sección de desviaciones respecto a la media, en unidades de desviación estándar.

Gráfico 6.1. Distribución normal y el área acumulada bajo la curva.

Fuente: Elaboración propia usando el Software STATA.

Den

sida

d

-3 -2 -1 1 2 3x

Page 64: Elementos Cuantitativos de Investigación en las Ciencias ...

64

El valor particular de probabilidad acumulada puede encontrarse en una tabla de porcentaje acumulado bajo la curva normal. En la curva normal, si queremos hacer un análisis al 90% de confianza, el valor -1,645;+1,645 en el eje de las abscisas acumula el 90% de la probabilidad. El análisis es análogo para los niveles de confianza de 95% (-1,96; +1.96), y 99% (-2.58; +2.58). Llamaremos a esos números que denotan los intervalos, z.

6.5. Error estándar de la media. Dado que en la realidad es difícil contar con muestras, y por ende, tener precisión en los datos que estimamos, es útil acudir a una medida de error. Para esto, se tiene el error estándar de la media (esm), que corresponde a una estimación de la desviación estándar de la distribución muestral de medias. Dicho estadístico se estima como:

1−=

ns

Xσ (6.1)

Donde s corresponde a la desviación estándar de la muestra y el n el número de valores de una muestra. Esta fórmula indica que a medida que aumenta n, disminuye el esm. Por el contrario, si tengo una muestra con dos observaciones, s es igual al esm. Este estadístico provee información importante para estimar la media poblacional, a través del intervalo de confianza, el que se estima de la forma: XzX σ×± (6.2) Por ejemplo, si el ingreso promedio de una muestra de 10 personas es de 2.7 y su desviación estándar corresponde a 1.27, un intervalo de confianza al 95% sería igual a:

𝑋𝑋� ± 𝑎𝑎𝜎𝜎��𝑥 2.7 ± (1.96) 1.27

√10−1

2.7 ± (1.96)0.42 (1.8768; 3.5232 ) (6.3) Por lo que con un 95% de confianza, la verdadera media poblacional se encuentra entre 1.88 y 3.52.

6.6. Estimación de proporciones. De la misma forma en la que es posible estimar una media poblacional, también es posible estimar proporciones.

𝜎𝜎𝑝𝑝 = �𝑃𝑃(1−𝑃𝑃)𝑁𝑁

(6.4)

Donde 𝜎𝜎𝑝𝑝 corresponde al error estándar de la proporción, P es la proporción muestral, y N es el número de observaciones de la muestra.

Page 65: Elementos Cuantitativos de Investigación en las Ciencias ...

65

Siguiendo a Levin y Levin (1999: 114), si el 45% de una muestra aleatoria de 100 personas informa que estas están a favor de la legalización de la droga, y se busca un intervalo de confianza al 95%, la estimación sería:

𝛽𝛽 ± 𝑎𝑎𝜎𝜎𝑝𝑝

0.45 ± (1.96)�0.45(1−0.45)100

0.45 ± (1.96)0.05 (0.352; 0.548) (6.5)

Por lo que con un 95% de confianza, la proporción poblacional se encuentra entre 0.35 y 0.55. Referencias Levin, Jack y Levin, William C. (1999). “Fundamentos de Estadística en la Investigación Social”. Oxford University Press. Segunda Edición. Webster, Allen (2000). “Estadística aplicada a los negocios y la economía”. Tercera Edición. McGraw-Hill Interamericana, S.A. Santa Fe de Bogotá, Colombia.

Page 66: Elementos Cuantitativos de Investigación en las Ciencias ...

66

Ejercicios Propuestos.

1. Suponga que tiene una muestra de 1000 personas, cuya frecuencia promedio de uso de bicicleta por día es igual a 2.3. La desviación estándar de la muestra es de 0.8. Estime un intervalo de confianza al 95%.

2. Dispone de la siguiente base de datos, estime un intervalo de confianza al 90%: 5, 6, 7, 4, 4, 5, 7, 8, 9, 11

3. Suponga que tiene la siguiente población. Obtenga una muestra aleatoria del 60% de la

población, obtenga la media muestral, y compárela con la media poblacional. Obtenga luego una muestra estratificada para zona urbana y rural, del 60%. Obtenga las medias y compárelas con la población.

Tabla 1

Zona Pobreza por Zona Urbana 0.3 Urbana 0.2 Urbana 0.23 Urbana 0.17 Rural 0.2 Rural 0.3 Rural 0.3 Rural 0.4 Rural 0.5

Page 67: Elementos Cuantitativos de Investigación en las Ciencias ...

67

7. Test de Hipótesis.

7.1. Test estadísticos relevantes Dado que no poseemos la población en la mayoría de los casos, suele ser útil usar inferencia para testear la validez de ciertas hipótesis que se establecen respecto de los datos. El proceso de inferencia estadística conlleva el establecimiento de una hipótesis nula (H0), una hipótesis alternativa (H1), el planteamiento de un estadístico, y un criterio de rechazo/aceptación. A continuación revisaremos algunos test estadísticos que se usan en forma usual para analizar la diferencia de medias o de frecuencias relativas. Esta sección se basa íntegramente en Levin y Levin (1999).

7.2. Test de Diferencia de Medias Este corresponde a una prueba en la cual se testea si dos medias muestrales difieren significativamente. Suponga que saca n pares de muestras de una población normal y calcula la diferencia de los promedios, por ejemplo, el ingreso entre hombres y mujeres. Estas diferencias también se distribuyen normal, y el conjunto de todas ellas da origen a la Distribución Muestral de Diferencias de Medias (se vería como el gráfico 7.1). La media de dicha distribución corresponderá a cero, si se avanza hacia la derecha dicha diferencia será positiva, mientras que a la izquierda será negativa.

Gráfico 7.1. Distribución Muestral de Diferencias.

Fuente: Elaboración propia usando el Software STATA.

En este caso, el estadístico del test sería la diferencia de medias (��𝑥1 − ��𝑥2) corregida por la desviación estándar de la Distribución Muestral de Diferencias (σDIF). Dicho estadístico se definirá como Z. El valor que tome este estadístico será vital para determinar si las medias son similares o difieren. La intuición indica que un Z cerca de cero (media de la Distribución) corresponderá a una situación en la cual las medias son bastantes similares, mientras que un Z alejado de cero, tanto a la derecha como a la izquierda, implica una diferencia importante de las medias. En términos estadísticos, el valor de Z definirá una probabilidad acumulada en la distribución, y dicha probabilidad determinará si la diferencia de medias se debe simplemente a error muestral, o a que efectivamente existe una diferencia entre ellas. El proceso de implementación se detalla a continuación:

a) Planteamiento de hipótesis:

Den

sida

d

-3 -2 -1 1 2 3x

Page 68: Elementos Cuantitativos de Investigación en las Ciencias ...

68

210 : µµ =H

211 : µµ ≠H

La hipótesis nula (H0) supone que cualquier diferencia entre las medias solo es producto del error de muestreo.

b) Planteamiento del estadístico: 𝑍𝑍 = (��𝑥1−��𝑥2)−(𝜇𝜇1−𝜇𝜇2)

𝜎𝜎𝐷𝐷𝐼𝐼𝐹𝐹 (7.1)

Donde σDIF corresponde a la desviación estándar de la Distribución Muestral de Diferencias. Un estimador de este estadístico corresponde a:

𝜎𝜎𝐷𝐷𝐼𝐼𝐷𝐷 = �𝜎𝜎��𝑥12 + 𝜎𝜎��𝑥2

2 (7.2)

Donde:

𝜎𝜎��𝑥1 = 𝐷𝐷𝑥𝑥�1�𝑛𝑛1−1

(7.3)

c) Obtención de la probabilidad: se supone que la Distribución de Diferencia de Medias tiene

una distribución normal, entonces de debe obtener la probabilidad acumulada a la altura del Z obtenido, y luego calcular la probabilidad para rechazar o no rechazar la hipótesis nula.

PA=PA(Z) P = (1- PA)*2 (7.4)

Donde P corresponde a la probabilidad de que la diferencia de medias se dé en base a error muestral.

d) Regla de decisión: se rechaza la hipótesis nula si la probabilidad de que la diferencia de medias se dé por error muestral (P) es inferior a 10%, 5%, o 1%.

Ejemplo: Se tienen los siguientes datos, ��𝑥1 = 7, ��𝑥2 = 2, σDIF = 2. Implemente un test de diferencia de medias (Levin y Levin, 1999: 129).

a) Planteamiento de hipótesis:

210 : µµ =H

211 : µµ ≠H b) Planteamiento del estadístico:

𝑍𝑍 = (��𝑥1−��𝑥2)−(𝜇𝜇1−𝜇𝜇2)

𝜎𝜎𝐷𝐷𝐼𝐼𝐹𝐹

Page 69: Elementos Cuantitativos de Investigación en las Ciencias ...

69

Dado que la hipótesis nula señala que 𝜇𝜇1 = 𝜇𝜇2, entonces 𝜇𝜇1 − 𝜇𝜇2 = 0, por lo que se reemplaza dicha expresión en el estadístico en conjunto con los valores dados en el enunciado

𝑍𝑍 = 7−2

2= 2.5

c) Obtención de la probabilidad: al buscar en la tabla de la distribución normal, se tiene que la

probabilidad acumulada en el percentil Z=2,5, es de 0.9938, entonces PA=0.9938, y reemplazando:

P = (1- PA)*2 P = (1- 0.9938)*2 P = 0.0124 ≈ 1.24%

Entonces, la probabilidad de que la diferencia de medias de 5 entre dos medias ocurra en base al error muestral, es de 1.24%, por lo que se rechaza hipótesis nula al 5% de significancia.

7.2.1. Test de Diferencia de Medias: muestras pequeñas Para el caso de muestras grandes, como se acude al teorema del límite central, se supone que la variable aleatoria se distribuye normal. Sin embargo, al usar un número reducido de datos (<30 datos), se debe usar la distribución t-student. Dado que a medida que se reduce el tamaño de la muestra se tiene menos libertad para inferir cosas respecto de la población, dicha distribución internaliza este aspecto a través de los grados de libertad (gl). Entonces, a medida que disminuye el tamaño muestral, disminuyen los grados de libertad; a medida que aumenta el tamaño muestral, aumentan los grados de libertad; en el extremo, si el tamaño muestral fuera muy grande, este estadístico tendería al Z de la distribución normal. El estadístico corresponde a la ecuación 7.5.

𝐶𝐶 = (��𝑥1−��𝑥2)𝜎𝜎𝐷𝐷𝐼𝐼𝐹𝐹

~𝐶𝐶(𝑛𝑛1+𝑛𝑛2−2)∗ 𝑥𝑥% (7.5)

Donde (𝐶𝐶1 + 𝐶𝐶2 − 2) corresponde a los grados de libertad, 𝐶𝐶1 y 𝐶𝐶2 corresponden a los tamaños muestrales, y x% al nivel de significancia al cual se puede realizar el análisis. En este caso se rechaza la hipótesis nula si el t calculado es mayor al t teórico, es decir, 𝐶𝐶𝑐𝑐 > 𝐶𝐶∗.

7.2.2. Test de Diferencia de Medias: tamaños muestrales distintos. Para el caso en el cual los tamaños muestrales son distintos se hace necesario corregir la desviación estándar (𝜎𝜎𝐷𝐷𝐼𝐼𝐷𝐷) de la Distribución de Diferencia de Medias. En este sentido, el análisis es similar a los casos anteriores de diferencias de medias, pero se debe obtener 𝜎𝜎𝐷𝐷𝐼𝐼𝐷𝐷 como:

𝜎𝜎𝐷𝐷𝐼𝐼𝐷𝐷 = ��𝑁𝑁1𝑠𝑠12+𝑁𝑁2𝑠𝑠2

2

𝑁𝑁1+𝑁𝑁2−2� � 1

𝑁𝑁1+ 1

𝑁𝑁2� (7.6)

Donde 𝑠𝑠1 y 𝑠𝑠2 son las desviaciones estándar de la primera y segunda muestra respectivamente, y 𝑁𝑁1 y 𝑁𝑁2, son los tamaños muestrales de las muestras, respectivamente.

Page 70: Elementos Cuantitativos de Investigación en las Ciencias ...

70

7.3. Test Chi cuadrado Este test corresponde a un test de hipótesis para pruebas no paramétricas, en las cuales no se está estimando la diferencia de parámetros, por el contrario, se analiza la similitud entre frecuencias de 2 o más categorías (Levin y Levin, 1999: 170). Su proceso de implementación es el siguiente:

a) Planteamiento de hipótesis: H0: frecuencia de una variable x es igual para las categorías A y B. H1: frecuencia de una variable x es desigual para las categorías A y B.

b) El estadístico corresponde a:

𝑥𝑥𝑐𝑐2 = ∑ �(𝑓𝑓0−𝑓𝑓𝑟𝑟)2

𝑓𝑓𝑟𝑟�~𝑥𝑥∗2(𝑓𝑓−1)(𝑐𝑐−1)(𝑥𝑥%) (7.7)

Donde el estadístico se distribuye con (f-1)x(c-1) grados de libertad (gl), y fo corresponde a la frecuencia real, mientras que fe corresponde a la esperada. Cabe destacar que en los grados de libertad, f y c corresponden a las filas y columnas de la matriz de frecuencias que se tenga. En el ejemplo de la sección esto va a quedar más claro.

c) Regla de decisión: se rechaza la hipótesis nula si 2cc >

2*c

Ejemplo: Suponga que tiene los siguientes datos respecto a los métodos de crianza de los niños, separados por la orientación política de los padres (Levin y Levin, 1999:171). La información se observa en la Tabla 7.1, en el cual se denotan los diferentes espacios usando la notación matricial “fila, columna”. Por ejemplo, para referirse al número de liberales que emplean métodos no rígidos nos referimos al 11 (fila 1, columna 1), mientras que para referirse a los conservadores que emplean métodos no rígidos, nos referimos al 12 (fila 1, columna 2). En este sentido, las dimensiones de la matriz corresponden a 2x2, pues existen dos filas y dos columnas.

Tabla 7.1. Métodos de crianza por categoría liberal o conservadora Métodos Liberales Conservadores No rígidos 5 11 10 12 Rígidos 15 21 10 22

Fuente: Levin & Levin (1999). Luego es necesario calcular las frecuencias esperadas que se obtienen como el producto entre los totales marginales respectivos y la división por el total de observaciones. Los totales marginales corresponden a las sumas totales de cada fila y columna. Por ejemplo, para el espacio de la primera fila y primera columna (11), la frecuencia real es 5, sin embargo la frecuencia esperada es: fe = (total marginal fila “i”) x (total marginal columna “j”) / N (7.8) fe = (total marginal fila 1) x (total marginal columna 1) /40 fe = (15) x (20) /40 = 7.5 Tal como se observa en la Tabla 7.2. Este proceso se repite para todas los espacios de la matriz de 2x2.

Page 71: Elementos Cuantitativos de Investigación en las Ciencias ...

71

Tabla 7.2. Métodos de crianza por categoría liberal o conservadora Métodos Liberales Conservadores Total marginal No rígidos 5 (7.5) 11 10 (7.5) 12 15 Rígidos 15 (12.5) 21 10 (12.5) 22 25 Total marginal 20 20 Total=40

Fuente: Levin & Levin (1999). Luego, una vez que se obtienen todas las frecuencias esperadas, es necesario calcular el estadístico y los grados de libertad.

𝑥𝑥𝑐𝑐2 = (5−7.5)2

7.5+ (10−7.5)2

7.5+ (15−12.5)2

12.5+ (10−12.5)2

12.5

𝑥𝑥𝑐𝑐2 = 0.83 + 0.83 + 0.5 + 0.5 => 𝑥𝑥𝑐𝑐2 = 2.66 gl= (f-1) x (c-1) gl= (2-1) x (2-1) gl= (1) x (1) = 1, y al 5% 𝑥𝑥∗2 = 3.841

Entonces, si el estadístico (𝑥𝑥𝑐𝑐2) es mayor que el valor teórico (𝑥𝑥∗2) se rechaza la hipótesis nula. En este caso, dado que 𝑥𝑥𝑐𝑐2 < 𝑥𝑥∗2, “se acepta” la hipótesis nula. Referencias Levin, Jack y Levin, William C. (1999). “Fundamentos de Estadística en la Investigación Social”. Oxford University Press. Segunda Edición.

Page 72: Elementos Cuantitativos de Investigación en las Ciencias ...

72

Ejercicios Propuestos.

1. Suponga que tiene los siguientes datos: ��𝑥1 = 1.71; ��𝑥2 = 1.54; s1=1.07; s2= 0.94, n1=35 n2=35. Realice un test de diferencia de medias (Levin y Levin, 1999).

2. Tiene la siguiente tabla respecto al consumo de marihuana en universitarios y no universitarios. Realice un test al 5% de significancia (Levin y Levin, 1999). Tabla 2

Universitario No Universitario Fumador 15 5 No fumador 6 10

3. Realice un test de diferencia de medias a partir de la siguiente información: ��𝑥1 = 1.33;

��𝑥2 = 4.5; s1=0,48; s2= 0,76, n1= n2=6, al 5% de significancia (Levin y Levin, 1999).

4. Realice un test al 5% de significancia (Levin y Levin, 1999):

Tabla 3 A B C

X 7 9 14 Y 10 10 8 Z 15 11 5

Page 73: Elementos Cuantitativos de Investigación en las Ciencias ...

73

8. La Programación Lineal. Durante la Segunda Guerra Mundial un equipo de científicos en Inglaterra comenzó a preguntarse de qué formas era posible usar el material bélico de modo de maximizar la eficiencia y la productividad (Taha, 2012). Dicha investigación dio origen a un área que se conoció como Investigación de Operaciones (IO), y que abarca diferentes técnicas tales como la Programación Lineal, el Modelo de Transporte, el Modelo de Redes, Programación Dinámica, así como algunas que son comunes a la estadística y a la econometría, entre otras. Esta disciplina corresponde a una parte esencial en las carreras de ingeniería y administración en la actualidad, toda vez que permite incrementar la eficiencia de actividades productivas y ofrecer un instrumental analítico para solución de problemas que impliquen la gestión de recursos. La técnica que esta sección describe corresponde a la Programación Lineal (PL), y consiste en una herramienta de optimización en la cual se plantea una función objetivo sujeta a una o más restricciones, con el objeto de obtener los valores que maximizan o minimizan la función objetivo (Peñafiel, 1976: 13). Dicha función puede corresponder a una función de beneficios o costos, y como es imposible llevar los beneficios a infinito, así como llevar los costos a cero, es que se plantea un problema de optimización. La característica de este problema de optimización es que las ecuaciones implicadas tienen formas lineales, por lo que es un caso de optimización menos general que el caso de los Método de los Multiplicadores de Lagrange de la sección “Aplicaciones de la Derivada”.

8.1. Problema de Programación Lineal. Desde el punto formal, un problema de PL consiste en una función objetivo lineal (8.1) sujeta a una serie de restricciones (8.2) (Peñafiel, 1976: 18). Tanto la función objetivo como las restricciones se encuentran en función de variables, 𝑥𝑥1, 𝑥𝑥2, … , 𝑥𝑥𝑛𝑛, por lo que hallar los valores de las variables que optimizan el problema es el objetivo subyacente de la PL.

𝑎𝑎 = 𝑐𝑐1𝑥𝑥1 + 𝑐𝑐2𝑥𝑥2 + ⋯+ 𝑐𝑐𝑛𝑛𝑥𝑥𝑛𝑛 (8.1) s.a.:

𝑎𝑎11𝑥𝑥1 + 𝑎𝑎12𝑥𝑥2 + ⋯+ 𝑎𝑎1𝑛𝑛𝑥𝑥𝑛𝑛 ≤ (≥)𝑏𝑏1 𝑎𝑎21𝑥𝑥1 + 𝑎𝑎22𝑥𝑥2 + ⋯+ 𝑎𝑎2𝑛𝑛𝑥𝑥𝑛𝑛 ≤ (≥)𝑏𝑏2 ⋮ 𝑎𝑎𝑚𝑚1𝑥𝑥1 + 𝑎𝑎𝑚𝑚2𝑥𝑥2 +⋯+ 𝑎𝑎𝑚𝑚𝑛𝑛𝑥𝑥𝑛𝑛 ≤ (≥)𝑏𝑏𝑚𝑚 (8.2)

Donde 𝑥𝑥𝑗𝑗 ≥ 0 para 𝑗𝑗 = 1,2, … ,𝐶𝐶. Dependiendo del problema específico, la solución del modelo de PL se puede obtener de diferentes formas, ocupando el Método Simplex o simplemente aplicando el método gráfico.

8.2. Solución con Método Gráfico.

A continuación se expone un ejemplo de resolución de PL con dos variables. Ejemplo 1: Existe una empresa que produce pinturas para exterior (𝑋𝑋1) y para interior (𝑋𝑋2), utilizando dos materias primas, M1 y M2. En la Tabla 8.1 se observa la materia prima que necesita

Page 74: Elementos Cuantitativos de Investigación en las Ciencias ...

74

la empresa para producir ambos tipos de pintura, en conjunto con la disponibilidad máxima de dichas materias primas, y la utilidad que la empresa obtiene al vender cada tonelada de su producto (Taha, 2012: 13, Ejemplo 2.1-1).

Tabla 8.1. Materias primas por producto,

Disponibilidad de materias primas y Utilidad por producto (Toneladas). Pintura para

Exterior (𝑋𝑋1) Pintura para Interior (𝑋𝑋2)

Disponibilidad (Toneladas)

Materia Prima 1, M1 6 4 24 Materia Prima 2, M2 1 2 6 Ut.($) por Tonelada 5 4

Fuente: Taha (2012), todos los datos en Toneladas. En forma adicional, se tienen dos restricciones: “Una encuesta de mercado indica que la demanda diaria de pintura para interiores no puede exceder la de pintura para exteriores en más de una tonelada. Asimismo, que la demanda diaria máxima de pintura para interiores es de dos toneladas”. (Taha, 2012). Para solucionar el problema de PL primero este debe plantear.

𝑀𝑀𝑎𝑎𝑥𝑥 𝑎𝑎 = 5𝑥𝑥1 + 4𝑥𝑥2 s.a.: 6𝑥𝑥1 + 4𝑥𝑥2 ≤ 24 (L1) (Restricción M1) 𝑥𝑥1 + 2𝑥𝑥2 ≤ 6 (L2) (Restricción M2) −𝑥𝑥1 + 𝑥𝑥2 ≤ 1 (L3) (Restricción de demanda 1) 𝑥𝑥2 ≤ 2 (L4) (Restricción de demanda 2) 𝑥𝑥1,𝑥𝑥2 ≥ 0 (L5) (Restricción de no negatividad) (8.3)

Una vez planteado el problema las ecuaciones se pueden reordenar de forma de graficarlas. Una alternativa es obtener los puntos críticos de cada ecuación. Por ejemplo, para el caso de L1, cuando 𝑥𝑥2 = 0, 𝑥𝑥1 = 4, y cuando 𝑥𝑥1 = 0, 𝑥𝑥2 = 6. De esta forma L1 se grafica considerando que su intersección con el eje de 𝑥𝑥1 corresponde a 4 y con el eje 𝑥𝑥2 corresponde a 6. Otra alternativa es dejar L1 en función de 𝑥𝑥2; al realizar esto la ecuación queda como 8.4, y es claro que el intercepto de la ecuación corresponde a 6 mientras que la pendiente es -3/2. Se puede efectuar la misma operación en todas las restricciones, quedando estas definidas en las ecuaciones 8.4 a 8.7.

𝑥𝑥2 = 6 − 32𝑥𝑥1 (8.4)

𝑥𝑥2 = 3 − 1

2𝑥𝑥1 (8.5)

𝑥𝑥2 = 1 + 𝑥𝑥1 (8.6) 𝑥𝑥2 = 2 (8.7)

Page 75: Elementos Cuantitativos de Investigación en las Ciencias ...

75

Figura 8.1. Gráfico del Problema 8.3

Fuente: Sobre la base de Taha (2012).

Nota: eje de las x es 𝑥𝑥1, eje de las y es 𝑥𝑥2. Una vez realizado el análisis con todas las restricciones es claro que el área factible de solución al problema corresponde al área limitada por los puntos (0, 1), (1, 2), (2, 2), (3, 1.5), (4, 0). Si bien el planteamiento de las desigualdades en forma de ecuación permite delimitar las áreas, las desigualdades implícitas en cada una permiten saber que sección corresponde efectivamente al área factible. En la figura 8.1 es bastante clara la intersección entre todas las restricciones, sin embargo el punto (3, 1.5) tiene decimales. Para encontrar este punto es necesario igualar las restricciones que pasan por ese punto, las que corresponden a L1 y a L2; como resultado en ese punto (𝑥𝑥1,𝑥𝑥2) =(3, 1.5). A continuación se procede a evaluar cada uno de los puntos obtenidos en la función objetivo.

𝑎𝑎(0, 1) = 5(0) + 4(1) = 4 𝑎𝑎(1, 2) = 5(1) + 4(2) = 13

𝑎𝑎(2, 2) = 5(2) + 4(2) = 18 𝑎𝑎(3, 1.5) = 5(3) + 4(1.5) = 21 𝑎𝑎(4, 0) = 5(4) + 4(0) = 20

Entonces, la solución que maximiza la función objetivo corresponde al conjunto (𝑥𝑥1,𝑥𝑥2) = (3, 1.5), donde 𝑎𝑎 = 21, el valor máximo que obtiene la función en los vértices definidos por el área factible.

Ejemplo 2: A continuación se analiza un caso de minimización que consiste en obtener el mínimo costo posible de una dieta (Taha, 2012: 24, Ejemplo 2.2-2). Se consume diariamente un mínimo de 800 libras de un alimento compuesto por maíz y soya. La composición del alimento se observa en la Tabla 8.2.

Tabla 8.2. Composición del Alimento y costo. Forraje Proteína Fibra Costo ($/libras) Maíz 0.09 0.02 0.30 Soya 0.60 0.06 0.90

Fuente: Taha (2012). A su vez, “las necesidades dietéticas del alimento especial son un mínimo de 30% de proteína y un máximo de 5% de fibra” (Taha, 2012). De acuerdo a la información anterior se procede a plantear el problema de PL, donde 𝑥𝑥1= libras de maíz en la mezcla diaria y 𝑥𝑥2= libras de soya en la mezcla diaria.

Page 76: Elementos Cuantitativos de Investigación en las Ciencias ...

76

𝑀𝑀𝐶𝐶𝐶𝐶 𝑎𝑎 = 0.3𝑥𝑥1 + 0.9𝑥𝑥2 s.a.: 𝑥𝑥1 + 𝑥𝑥2 ≥ 800 (L1) (Restricción cantidad total) 0.09𝑥𝑥1 + 0.6𝑥𝑥2 ≥ 0.3(𝑥𝑥1 + 𝑥𝑥2) (L2) (Restricción de proteína) 0.02𝑥𝑥1 + 0.06𝑥𝑥2 ≤ 0.05(𝑥𝑥1 + 𝑥𝑥2) (L3) (Restricción de fibra) 𝑥𝑥1,𝑥𝑥2 ≥ 0 (L5) (Restricción de no negatividad) (8.8)

El problema 8.8 presenta unas restricciones complicadas (L2 y L3) por lo que se puede facilitar el análisis replanteando el problema. En 8.9 solo se simplificaron las restricciones L2 y L3.

𝑀𝑀𝐶𝐶𝐶𝐶 𝑎𝑎 = 0.3𝑥𝑥1 + 0.9𝑥𝑥2 s.a.: 𝑥𝑥1 + 𝑥𝑥2 ≥ 800 (L1) (Restricción cantidad total) 0.21𝑥𝑥1 − 0.3𝑥𝑥2 ≤ 0 (L2) (Restricción de proteína) 0.03𝑥𝑥1 − 0.01𝑥𝑥2 ≥ 0 (L3) (Restricción de fibra) 𝑥𝑥1,𝑥𝑥2 ≥ 0 (L5) (Restricción de no negatividad) (8.9)

Planteado el problema se procede a graficar de la misma forma que en el ejemplo anterior, analizando las rectas y la forma en la cual se gráfica, para lo cual es útil plantear las restricciones en la forma de 8.10 a 8.12.

𝑥𝑥2 = 800− 𝑥𝑥1 (8.10) 𝑥𝑥2 = 0.7𝑥𝑥1 (8.11) 𝑥𝑥2 = 3𝑥𝑥1 (8.12)

Figura 8.2. Gráfico del Problema 8.9.

Fuente: Sobre la base de Taha (2012).

Nota: eje de las x es 𝑥𝑥1, eje de las y es 𝑥𝑥2.

En el gráfico 8.2 se graficaron las restricciones y es claro que la zona factible está delimitada desde el infinito hacia el cero por los puntos (200, 600) y (470.6, 329.4). El primer punto se observa fácilmente mientras que el segundo se debe calcular como la intersección de las rectas L1 y L2. Entonces, la intersección entre L1 y L2 corresponde al punto (470.6, 329.4). A continuación se procede a evaluar los puntos en la función objetivo y se tiene que:

Page 77: Elementos Cuantitativos de Investigación en las Ciencias ...

77

𝑎𝑎(200, 600) = 0.3(200) + 0.9(600) = 600 𝑎𝑎(470.6, 329.4) = 0.3(470.6) + 0.9(329.4) = 437.64

Entonces, la solución que minimiza la función objetivo corresponde al conjunto (x1, x2) =(470.6, 329.4), donde z = 437.64, el valor mínimo que obtiene la función en los vértices definidos por el área factible.

Referencias Peñafiel Millán, Luis, Programación Lineal: base teórica y aplicaciones administrativas; 1976, Ed. Trillas, 1º edición, México. Taha, Hamdy A. (2012). Investigación de operaciones. Novena edición. Pearson Educación, México, 2012.

Page 78: Elementos Cuantitativos de Investigación en las Ciencias ...

78

Ejercicios Propuestos.

1. Una compañía fabrica dos productos, A y B. El volumen de ventas de A es por lo menos 80% de las ventas totales de A y B. Sin embargo, la compañía no puede vender más de 100 unidades de A por día. Ambos productos utilizan una materia prima, cuya disponibilidad diaria máxima es de 240 libras. Las tasas de consumo de la materia prima son de 2 libras por unidad de A y de 4 libras por unidad de B. Las utilidades de A y B son de $20 y $50, respectivamente. Determine la combinación óptima de productos para la compañía (Taha, 2012).

2. El gobierno debe encargarse del proceso de reconstrucción debido a los desastres ocurridos luego de un terremoto, para lo que cuenta con dos bienes cuya valoración puede compensar a las personas por las pérdidas sufridas. El bien 𝑥𝑥1 tiene la cualidad de compensar las pérdidas por bienes inmuebles de los damnificados por un valor de $2.000, mientras que el bien 𝑥𝑥2 por un valor de $3.000. Sin embargo, dada la gravedad de la situación post-desastre, y las demandas de la ciudadanía por una actuación rápida del gobierno, éste se ha puesto plazos para producir los bienes 𝑥𝑥1 y 𝑥𝑥2, es decir, ha definido dos fases de producción. Para la primera fase solo dispone de 50 horas, y producir una unidad del bien 𝑥𝑥1 requiere de 12 horas, mientras que para producir una unidad del bien 𝑥𝑥2 se requieren 23 horas. Para la segunda fase, se dispone de 45 horas, y ahora producir una unidad de 𝑥𝑥1 corresponde a 16 horas, mientras que producir una unidad de 𝑥𝑥2 corresponde a 10 horas. Grafique y encuentre el óptimo, considerando cantidades positivas de 𝑥𝑥1 y 𝑥𝑥2.

3. Use el método gráfico para encontrar los valores de 𝑥𝑥1 y 𝑥𝑥2 que maximizan la función

objetivo, 𝑓𝑓(𝑥𝑥1, 𝑥𝑥2) en cada uno de los siguientes casos3: a) 𝑓𝑓(𝑥𝑥1,𝑥𝑥2) = 3𝑥𝑥1 + 2𝑥𝑥2 b) 𝑓𝑓(𝑥𝑥1,𝑥𝑥2) = 5𝑥𝑥1 + 2𝑥𝑥2 c) 𝑓𝑓(𝑥𝑥1,𝑥𝑥2) = 2𝑥𝑥1 + 3𝑥𝑥2 d) 𝑓𝑓(𝑥𝑥1,𝑥𝑥2) = 3𝑥𝑥1 + 3𝑥𝑥2 Las restricciones en todos los casos son:

2𝑥𝑥1 + 3𝑥𝑥2 ≤ 12 4𝑥𝑥1 + 2𝑥𝑥2 ≤ 16 𝑥𝑥1,𝑥𝑥2 ≥ 0

4. Usé el método gráfico para resolver el siguiente problema4:

Min 𝑓𝑓(𝑥𝑥1,𝑥𝑥2) = −𝑥𝑥1 − 𝑥𝑥2 s.a.: 𝑥𝑥1 + 3𝑥𝑥2 ≤ 6 −𝑥𝑥1 + 𝑥𝑥2 ≤ 1 −2𝑥𝑥1 + 𝑥𝑥2 ≥ −4 𝑥𝑥1,𝑥𝑥2 ≥ 0

3 Gonzalo Edwards (1994). “Modelos de Optimización”. Trabajo Docente Nº 57, Instituto de Economía, Pontificia Universidad Católica de Chile. ISSN: 0716-7334. 4 Ídem.

Page 79: Elementos Cuantitativos de Investigación en las Ciencias ...

79

9. Introducción al Modelo de Regresión Lineal. Entre los objetivos de este documento se encuentra la comprensión de los fenómenos sociales desde el punto de vista de la dimensión cuantitativa. Para esto se han analizado una serie de estadísticos que nos permiten obtener información de forma inteligente de los datos. Un momento superior del análisis cuantitativo dice relación con la conformación del modelo. Tal como vimos en instancias anteriores, dicho modelo se elabora como una explicación a la realidad, y puede considerar diferentes variables. Una forma de obtener un modelo que interrelacione variables es la aplicación del Modelo de Mínimos Cuadrados Ordinarios (MCO). Es menester considerar que esta relación no corresponde a la realidad misma, por el contrario, es una interpretación de esta. Asimismo, MCO no permite establecer causalidad entre dos variables, toda vez que dicha causalidad proviene en primera instancia del marco teórico que vincule las variables. Una vez que hemos hecho la revisión teórica respectiva, podemos estar interesados en testear la hipótesis que se deriva de la teoría de forma empírica, usando para ello el MCO. Las siguientes secciones no pretenden ser tanto una exposición detallada del análisis de regresión como una motivación e introducción al mismo. Dado el número de aspectos, especificidades y problemas que trata el análisis de regresión se recomienda acudir a los textos usualmente usados como Gujarati (2004) y Wooldridge (2010), así como también a la sección respectiva de Levin y Levin (1999).

9.1. Modelo de Mínimos Cuadrados Ordinarios (MCO) Para elaborar un modelo que interrelaciona dos variables, por ejemplo X e Y, debemos recurrir a una relación matemática básica, que relaciona las variables en función de un intercepto, 𝛽𝛽0, y una pendiente, 𝛽𝛽1. Esta es una relación determinista, que nos dice cuanto cambia Y a partir de la variación en una unidad de X: 𝑌𝑌𝐷𝐷 = 𝛽𝛽𝐷𝐷 + 𝛽𝛽1𝑋𝑋𝐷𝐷 (9.1)

Donde Y corresponde a la variable endógena o explicada, y X a la variable exógena o explicativa. En las ciencias físicas es común ocupar modelos matemáticos, los que tienen una alta capacidad explicativa y predictiva. Esto explica el gran crecimiento de las ciencias y la tecnología desde la revolución industrial. Sin embargo, en las ciencias sociales existen algunos factores que pueden relativizar la relación entre las variables, tales como el comportamiento humano, que se caracteriza por ser irracional, la presencia de errores de medición, y la necesidad de obtener muestras (ya sabemos las restricciones) entre otras, razón por lo que es necesario incorporar un componente que agrupe toda esa incertidumbre. En este punto, se debe desechar el modelo matemático por cuanto nos plantea una relación determinista, y perfeccionarlo a través de un modelo estadístico:

𝑌𝑌𝐷𝐷 = 𝛽𝛽𝐷𝐷 + 𝛽𝛽1𝑋𝑋𝐷𝐷 + 𝜀𝜀𝐷𝐷 (9.2) Donde 𝜀𝜀𝐷𝐷 corresponde a la perturbación estocástica (residuo), y representa todas aquellas cosas que afectan a Y, pero que no están de forma explícita en el modelo. Cabe destacar que el MCO tiene una serie de supuestos, los que corresponden a linealidad en los parámetros, muestreo aleatorio, no

Page 80: Elementos Cuantitativos de Investigación en las Ciencias ...

80

colinealidad perfecta, media condicional cero, y homocedasticidad (Wooldridge, 2010: 84), los que se detallan a continuación.

9.2. Supuestos del MCO. Siguiendo a Wooldridge (2010), los supuestos del modelo de MCO corresponden a los siguientes. Estos supuestos se extienden al caso del modelo multivariable.

1. Linealidad en los parámetros: como se desprende de la ecuación 9.2, el MCO supone linealidad en los parámetros, esto es, que los coeficientes a estimar sean constantes tal como en el caso de la ecuación señalada para 𝛽𝛽𝐷𝐷 y 𝛽𝛽1. Esto no quiere decir que las formas funcionales presenten no linealidades, tales como la presencia de un x elevado al cuadrado o al cubo. Por el contrario, puedes existir relaciones no lineales entre las variables, lo importante es que la linealidad sea respecto de los parámetros a estimar.

2. Muestreo aleatorio: los datos mediante los cuales se efectúa el análisis de regresión

corresponden a datos extraídos de una muestra aleatoria.

3. No existencia de colinealidad perfecta: no existe una relación exacta entre las variables independientes. Este supuesto es importante cuando se considera un modelo con múltiples variables independientes.

4. Media condicional cero: este supuesto indica que el valor esperado condicional del error es igual a cero, esto es: 𝐸𝐸(𝜀𝜀|x1,𝑥𝑥2, … 𝑥𝑥𝑘𝑘) = 0 (9.3)

5. Homocedasticidad: la varianza del error es constante, esto es:

𝑉𝑉𝑎𝑎𝑑𝑑(𝜀𝜀|x1,𝑥𝑥2, … 𝑥𝑥𝑘𝑘) = 𝜎𝜎2 (9.4)

6. Supuesto de Normalidad: el error 𝜀𝜀 es independiente de las variables explicativas y está distribuido de forma normal, con media cero y varianza 𝜎𝜎2, esto es, 𝜀𝜀~𝑁𝑁𝐶𝐶𝑑𝑑𝑚𝑚𝑎𝑎𝑙𝑙(0,𝜎𝜎2).

Bajo los supuestos 1 a 4, es posible formular el teorema de insesgamiento de los estimadores MCO, esto es, que “los estimadores MCO son estimadores insesgados de los parámetros poblacionales” (Wooldridge, 2010). Bajo los supuestos 1 a 5, el estimador MCO es el mejor estimador lineal insesgado (MELI) de 𝛽𝛽0,𝛽𝛽1, …𝛽𝛽𝑘𝑘. El supuesto 6 es el más fuerte de todos pues supone que los supuesto 1 a 5 son verdaderos (Wooldridge, 2010). Por último, todos estos supuestos en conjunto conforman el Modelo Clásico de Regresión Lineal.

9.3. Estimación por MCO. Dado que en estricto rigor no es posible observar todos los datos de la población, no es posible estimar la ecuación 9.2, la que corresponde a la Función de Regresión Poblacional (FRP); es por esto que dicha función debe ser estimada a través de la Función de Regresión Muestral (FRM) (Guajarati, 2004):

𝑌𝑌𝐷𝐷 = ��𝛽𝐷𝐷 + ��𝛽1𝑋𝑋𝐷𝐷 + 𝜀𝜀��𝐷 (9.5)

Page 81: Elementos Cuantitativos de Investigación en las Ciencias ...

81

𝑌𝑌𝐷𝐷 = 𝑌𝑌𝚤𝚤� + 𝜀𝜀��𝐷 (9.6)

Donde 𝑌𝑌𝚤𝚤� = ��𝛽𝐷𝐷 + ��𝛽1𝑋𝑋𝐷𝐷, y los valores con gorro (^) son los valores estimados. Dado que el método MCO minimiza las diferencias de los residuos al cuadrado, se debe plantear el problema de optimización como en 9.7.

𝑀𝑀𝐶𝐶𝐶𝐶𝛽𝛽�𝑝𝑝,𝛽𝛽�1 ∑ 𝜀𝜀��𝐷2

𝑀𝑀𝐶𝐶𝐶𝐶𝛽𝛽�𝑝𝑝,𝛽𝛽�1 ∑�𝑌𝑌𝐷𝐷 − 𝑌𝑌𝚤𝚤��2

𝑀𝑀𝐶𝐶𝐶𝐶𝛽𝛽�𝑝𝑝,𝛽𝛽�1 ∑�𝑌𝑌𝐷𝐷 − ��𝛽𝐷𝐷 − ��𝛽1𝑋𝑋𝐷𝐷�2 (9.7)

Para resolver la expresión 9.7 se deben obtener las condiciones de primer orden respecto de ��𝛽𝐷𝐷 y de ��𝛽1, las que se corresponden a las ecuaciones 9.8 y 9.9.

𝜕𝜕∑�𝑌𝑌𝑝𝑝−𝛽𝛽�𝑝𝑝−𝛽𝛽�1𝑋𝑋𝑝𝑝�2

𝜕𝜕𝛽𝛽�𝑝𝑝= 0

2∑�𝑌𝑌𝐷𝐷 − ��𝛽𝐷𝐷 − ��𝛽1𝑋𝑋𝐷𝐷� (−1) = 0 ∑�𝑌𝑌𝐷𝐷 − ��𝛽𝐷𝐷 − ��𝛽1𝑋𝑋𝐷𝐷� = 0 (9.8) 𝜕𝜕∑�𝑌𝑌𝑝𝑝−𝛽𝛽�𝑝𝑝−𝛽𝛽�1𝑋𝑋𝑝𝑝�

2

𝜕𝜕𝛽𝛽�1= 0

2∑�𝑌𝑌𝐷𝐷 − ��𝛽𝐷𝐷 − ��𝛽1𝑋𝑋𝐷𝐷� (−𝑋𝑋𝐷𝐷) = 0 ∑�𝑌𝑌𝐷𝐷 − ��𝛽𝐷𝐷 − ��𝛽1𝑋𝑋𝐷𝐷� (−𝑋𝑋𝐷𝐷) = 0 (9.9)

Una vez obtenidas las condiciones de primer orden, es posible obtener los estimadores MCO. Multiplicando 9.8 por (1/n) y aplicando la sumatoria sobre todos los componentes, se obtiene 9.10.

∑�𝑌𝑌𝐷𝐷 − ��𝛽𝐷𝐷 − ��𝛽1𝑋𝑋𝐷𝐷� (1/𝐶𝐶) = 0

∑𝑌𝑌𝑝𝑝𝑛𝑛− 𝑛𝑛𝛽𝛽�𝑝𝑝

𝑛𝑛− 𝛽𝛽�1 ∑𝑋𝑋𝑝𝑝

𝑛𝑛= 0

𝑌𝑌� − ��𝛽𝐷𝐷 − ��𝛽1𝑋𝑋� = 0

��𝛽𝐷𝐷 = 𝑌𝑌� − ��𝛽1𝑋𝑋� (9.10)

La expresión 9.10 es una expresión para el intercepto de la ecuación. Sin embargo, aún se necesita una expresión para ��𝛽1 en orden a obtener su valor. Reemplazando la expresión 9.10 en 9.9 se obtiene:

∑�𝑌𝑌𝐷𝐷 − ��𝛽𝐷𝐷 − ��𝛽1𝑋𝑋𝐷𝐷� (−𝑋𝑋𝐷𝐷) = 0

∑�𝑌𝑌𝐷𝐷 − 𝑌𝑌� + ��𝛽1𝑋𝑋� − ��𝛽1𝑋𝑋𝐷𝐷� (−𝑋𝑋𝐷𝐷) = 0

−∑(𝑌𝑌𝐷𝐷 − 𝑌𝑌�)(𝑋𝑋𝐷𝐷) − ��𝛽1 ∑(𝑋𝑋� − 𝑋𝑋𝐷𝐷)(𝑋𝑋𝐷𝐷) = 0

−∑(𝑌𝑌𝐷𝐷 − 𝑌𝑌�)(𝑋𝑋𝐷𝐷) + ��𝛽1 ∑(𝑋𝑋𝐷𝐷 − 𝑋𝑋�)(𝑋𝑋𝐷𝐷) = 0

Page 82: Elementos Cuantitativos de Investigación en las Ciencias ...

82

��𝛽1 = ∑(𝑌𝑌𝑝𝑝−𝑌𝑌�)(𝑋𝑋𝑝𝑝)∑(𝑋𝑋𝑝𝑝−𝑋𝑋�)(𝑋𝑋𝑝𝑝)

(9.11)

A continuación, multiplicando numerador y denominador de la expresión 9.11 por 1/n se tiene lo siguiente:

��𝛽1 = ∑(𝑌𝑌𝑝𝑝−𝑌𝑌�)(𝑋𝑋𝑝𝑝)∑(𝑋𝑋𝑝𝑝−𝑋𝑋�)(𝑋𝑋𝑝𝑝)

1/𝑛𝑛1/𝑛𝑛

��𝛽1 =∑�𝑌𝑌𝑝𝑝−𝑌𝑌���𝑋𝑋𝑝𝑝�

𝑛𝑛∑�𝑋𝑋𝑝𝑝−𝑋𝑋���𝑋𝑋𝑝𝑝�

𝑛𝑛

��𝛽1 =∑𝑌𝑌𝑝𝑝𝑋𝑋𝑝𝑝−𝑌𝑌� ∑𝑋𝑋𝑝𝑝

𝑛𝑛∑𝑋𝑋𝑝𝑝

2−𝑋𝑋� ∑𝑋𝑋𝑝𝑝𝑛𝑛

��𝛽1 =∑𝑌𝑌𝑝𝑝𝑋𝑋𝑝𝑝

𝑛𝑛 − 𝑌𝑌� ∑𝑋𝑋𝑝𝑝𝑛𝑛

∑𝑋𝑋𝑝𝑝2

𝑛𝑛 − 𝑋𝑋� ∑𝑋𝑋𝑝𝑝𝑛𝑛

��𝛽1 =∑𝑌𝑌𝑝𝑝𝑋𝑋𝑝𝑝

𝑛𝑛 − 𝑌𝑌�𝑋𝑋�

∑𝑋𝑋𝑝𝑝2

𝑛𝑛 − 𝑋𝑋�2 (9.12)

Si se considera la expresión 9.12, es claro que está conformada por dos estadísticos conocidos, por la varianza (fórmula 4.17) y la covarianza (fórmula 5.6), por lo que la ecuación 9.12 se puede plantear como la 9.13.

��𝛽1 = 𝑐𝑐𝐷𝐷𝐷𝐷(𝑋𝑋,𝑌𝑌)𝐷𝐷𝑎𝑎𝐷𝐷(𝑥𝑥)

(9.13)

En este contexto ya es posible estimar una ecuación de regresión lineal por MCO a través de la fórmula 9.10 y 9.12.

Referencias.

Gujarati, Damodar (2004). Econometría. 4ta edición. McGraw-Hill Interamericana. Wooldridge, Jeffrey M. (2010). “Introducción a la econometría: Un enfoque moderno”. 4ta. edición. Cengage Learning Editores, S.A. de C.V. ISBN-13: 978-607-481-312-8, ISBN-10: 607-481-312-4.

Page 83: Elementos Cuantitativos de Investigación en las Ciencias ...

83

Ejercicios Propuestos.

5. Suponga que tiene los siguientes datos, y se le pide que modele la calificación de los alumnos en establecimientos de vulnerabilidad. Las variables son: X= Tiempo que dedican a estudiar los alumnos de colegios en vulnerabilidad a estudiar en minutos. Y= Calificación del alumno. Tiene la siguiente base de datos: Tabla 1

X Y 58 4.5 40 4.7 32 4.5 65 5.7 21 4.0 15 3.4 80 6.5

6. Usted está estudiando la relación entre el ingreso y la escolaridad y dispone de la siguiente base de datos. Estime el modelo correspondiente.

Tabla 2

Escolaridad (X) Ingreso (Y) 9 10 8 11 6 5 7 8 7 7 4 5 3 3 2 1

Page 84: Elementos Cuantitativos de Investigación en las Ciencias ...

84

10. Modelo de Regresión Lineal: Ajuste e Inferencia. En esta sección veremos los estadísticos que tienen por objeto determinar si nuestro modelo se ajusta bien a los datos, efectuaremos pruebas estadísticas respecto a la significancia de los coeficientes, y se efectuará una lectura global del modelo.

10.1. Bondad de Ajuste (R2) En la sección anterior se analizó cómo estimar la relación lineal entre dos variables utilizando para ello el MCO. Sin embargo, una vez que se ha estimado el modelo, es necesario preguntarse respecto al grado de ajuste de dicho modelo, entendiendo por esto qué tan bien se ajusta a los datos empíricos. Para responder a esta pregunta es necesario revisar algunos conceptos de importancia.

Figura 10.1: Función de Regresión Población (FRP) y Función de Regresión Muestral (FRM)

Y

FRM Yi 𝜀𝜀 Ŷ ɛ E(Y/X) = Y FRP

ii XY 10ˆˆ ββ +=

Xi X Fuente: Gujarati (2004) En la figura 10.1 se observa la función de regresión población (FRP), es decir, la verdadera relación de las variables en la población, y por otro lado, la función de regresión muestral (FRM), que es la relación estimada a través del Método MCO. Si se fija la atención en el punto 𝑋𝑋𝐷𝐷 ,𝑌𝑌𝐷𝐷, se puede ver que a través de la línea formada por el punto 𝑋𝑋𝐷𝐷 pasan ambas funciones generando tramos dentro de esa línea. Estos tramos permiten hablar de los siguientes conceptos.

La suma total de cuadrados (STC): ∑ (𝑌𝑌𝐷𝐷 − 𝑌𝑌�)2𝑛𝑛𝐷𝐷=1 (10.1)

La suma de cuadrados explicada (SEC): ∑ �𝑌𝑌�𝐷𝐷 − 𝑌𝑌��2𝑛𝑛

𝐷𝐷=1 (10.2) La suma de residuos al cuadrado (SRC): ∑ �𝑌𝑌𝐷𝐷 − 𝑌𝑌�𝐷𝐷�

2𝑛𝑛𝐷𝐷=1 (10.3)

Entonces, la STC corresponde a las distancias totales entre una observación en el plano X,Y y el promedio respectivo de Y, la SEC a la suma de las distancias entre el punto respectivo en la FRM y el promedio de Y, mientras que la SRC corresponde a la suma de las distancias entre una observación y el punto respectivo sobre la FRM. Todas estas distancias son elevadas al cuadrado, tal como se indica en las ecuaciones 10.1 a 10.3. Dada la interrelación que presentan estas ecuaciones, es que es posible formular la siguiente ecuación, la que es equivalente a 10.5.

∑ (𝑌𝑌𝐷𝐷 − 𝑌𝑌�)2 = ∑ �𝑌𝑌�𝐷𝐷 − 𝑌𝑌��2𝑛𝑛𝐷𝐷=1

𝑛𝑛𝐷𝐷=1 + ∑ �𝑌𝑌𝐷𝐷 − 𝑌𝑌�𝐷𝐷�

2𝑛𝑛𝐷𝐷=1 (10.4)

Page 85: Elementos Cuantitativos de Investigación en las Ciencias ...

85

STC = SEC + SRC (10.5) Multiplicando la última ecuación por (1/STC), se llega a:

21 RSCTSRC

SCTSEC

=−= (10.6)

Esta última ecuación es la ecuación del coeficiente de determinación, e indica la proporción en la cual el modelo explica (SEC) lo que “debería” explicar (SCT). Este estadístico se distribuye de “0” a “1”, donde “0” es nula bondad de ajuste y “1” es bondad de ajuste total. Por ejemplo, si la SRC= 8.115 y SCT=81.5, entonces 𝑅𝑅2=0.90, por lo que la ecuación estimada tendría un alto ajuste respecto de los datos.

10.2. Test estadísticos. Los supuestos 1 a 6 de la sección anterior permiten elaborar un teorema para definir la distribución de los coeficientes estimados con MCO. Dicho teorema se describe a continuación (Wooldridge, 2010: 120): Bajo los supuestos 1 a 6 del Modelo de Regresión Lineal Clásico:

��𝛽𝑗𝑗~𝑁𝑁𝐶𝐶𝑑𝑑𝑚𝑚𝑎𝑎𝑙𝑙(𝛽𝛽𝑗𝑗 , 𝑣𝑣𝑎𝑎𝑑𝑑(��𝛽𝑗𝑗)) (10.7) �𝛽𝛽�𝑗𝑗−𝛽𝛽𝑗𝑗�

𝑑𝑑𝐷𝐷�𝛽𝛽�𝑗𝑗�~𝑁𝑁𝐶𝐶𝑑𝑑𝑚𝑚𝑎𝑎𝑙𝑙(0, 1) (10.8)

Lo que quiere decir que la distribución de los coeficientes es normal con media 𝛽𝛽𝑗𝑗 y varianza 𝑣𝑣𝑎𝑎𝑑𝑑(��𝛽𝑗𝑗), y que ���𝛽𝑗𝑗 − 𝛽𝛽𝑗𝑗�/𝑑𝑑𝐶𝐶���𝛽𝑗𝑗� se distribuye normal con media 0 y varianza 1. Este teorema es vital pues permite plantear test de hipótesis sobre los coeficientes, tal como se verá en las siguientes secciones.

10.2.1. Test de hipótesis: Coeficientes individuales. Una vez estimado el modelo de regresión lineal es importante preguntarse respecto de la significancia de los coeficientes estimados. En este sentido, en la sección de inferencia estadística se analizó un test que permitía dirimir si dos medias eran distintas; en esta sección nos podemos preguntar respecto a si un coeficiente estimado difiere de cero, por ejemplo. Esta última pregunta es realmente relevante, puesto que si ��𝛽1 no difiere de cero, entonces el modelo 10.9 implicaría que 𝑌𝑌𝚤𝚤� = ��𝛽0, o en otras palabras, que no existe relación entre X e Y.

𝑌𝑌𝚤𝚤� = ��𝛽𝐷𝐷 + ��𝛽1𝑋𝑋𝐷𝐷 (10.9)

Es por eso que en econometría un test de primera relevancia es que el coeficiente de interés es igual a cero, lo que se formaliza en 10.10.

a) Planteamiento de Hipótesis

𝐻𝐻𝐷𝐷:𝛽𝛽1 = 0 𝐻𝐻1:𝛽𝛽1 ≠ 0 (10.10)

Page 86: Elementos Cuantitativos de Investigación en las Ciencias ...

86

b) Estadístico: al igual que en el caso del test de medias, en este caso se plantea el estadístico, el que corresponde, para el caso de ��𝛽1 a:

𝛽𝛽�1−𝛽𝛽1𝐷𝐷𝐷𝐷�𝛽𝛽�1�

~𝐶𝐶𝑛𝑛−2 (10.11) Donde t se distribuye con n-2 grados de libertad, debido a que para calcular la suma de residuos al cuadrado, primero se están calculando dos coeficientes, ��𝛽0 y ��𝛽1, lo que impone dos restricciones al análisis (Gujarati, 2004). Entonces, para modelos más generales, el estadístico corresponde a:

𝛽𝛽�𝑗𝑗−𝛽𝛽𝑗𝑗𝐷𝐷𝐷𝐷�𝛽𝛽�𝑗𝑗�

~𝐶𝐶𝑛𝑛−𝑘𝑘−1 (10.12)

Donde k corresponde a los coeficientes de variables independientes, y 1 a la constante.

c) Criterio de rechazo de la nula: en general, el lado izquierdo de la ecuación 10.12 arroja un valor que se denomina t calculado (𝐶𝐶𝑐𝑐), y luego ese valor se debe cotejar con el valor teórico (𝐶𝐶∗) que hubiese tomado el t con los grados de libertad y la significancia respectiva. La hipótesis nula se rechaza cuando se cumple que |𝐶𝐶𝑐𝑐| > 𝐶𝐶∗. En este sentido, el rechazo de la nula implica que el 𝐶𝐶𝑐𝑐 se encuentra fuera de la región de aceptación de la hipótesis nula, esto es, fuera de la zona en la cual el coeficiente vale cero.

Ejemplo 1: para el caso de un modelo donde la mortalidad infantil es la variable dependiente, se tiene que el coeficiente estimado para el PIB per cápita es -0.0056, su error estándar es 0.002, se tienen 64 observaciones, y se usa un nivel de significancia del 5%. Además, el modelo tiene solo dos variables independientes (Gujarati, 2004: 240). En este caso la hipótesis nula implica que el coeficiente del PIB per cápita es igual a cero, mientras la alternativa, que no lo es. El 𝐶𝐶𝑐𝑐 corresponde a:

𝐶𝐶𝑐𝑐 = −0.00560.002

= −2.8

Mientras que el 𝐶𝐶∗ con 61 grados de libertad, probabilidad de 0.05, y a una y dos colas, es respectivamente:

𝐶𝐶64−2−1∗ 𝛼𝛼 = 𝐶𝐶61∗ 𝛼𝛼 = 1.671 𝐶𝐶64−2−1∗ 𝛼𝛼/2 = 𝐶𝐶61∗ 𝛼𝛼/2 = 2

Haciendo un análisis de una cola o dos colas se cumple que |𝐶𝐶𝑐𝑐| > 𝐶𝐶∗, por lo que se rechaza la hipótesis nula.

10.2.2. P-value. Sin embargo, existe otro enfoque equivalente que permite rechazar o no rechazar la hipótesis nula, y que dice relación con el p-value. El p-value es el nivel exacto de significancia o probabilidad de cometer error tipo I (Gujarati, 2004: 131), error que indica la probabilidad de equivocarse al rechazar la hipótesis nula si esta fuese verdadera. En términos formales:

𝑝𝑝(𝐶𝐶∗ > 𝐶𝐶𝑐𝑐) = 𝑝𝑝(𝐶𝐶𝑑𝑑𝑑𝑑𝐶𝐶𝑑𝑑 𝐶𝐶𝐶𝐶𝑝𝑝𝐶𝐶 𝐼𝐼) (10.13)

Page 87: Elementos Cuantitativos de Investigación en las Ciencias ...

87

Por lo que es un enfoque similar al anterior, salvo que para rechazar la hipótesis nula, en este caso la probabilidad de que 𝐶𝐶∗ > 𝐶𝐶𝑐𝑐 ocurra debe ser lo más baja posible, minimizando al mismo tiempo el error tipo I. De esta forma, si la probabilidad que 𝐶𝐶∗ > 𝐶𝐶𝑐𝑐 es baja, entonces la probabilidad de que 𝐶𝐶𝑐𝑐 > 𝐶𝐶∗ es alta. Sin embargo, aún se requiere fijar el criterio de rechazo de la nula, y tradicionalmente se adopta una significancia de 10%, 5% o 1%. Ejemplo 2: Para del modelo de la mortalidad infantil, el p-value del PIB per cápita es 0.0065. Bajo el enfoque del p-value se rechaza la hipótesis nula al 1% de significancia, por lo que el coeficiente del PIB per cápita es distinto de cero. Como se observa, el enfoque es más preciso y da el mismo resultado del Ejemplo 1. Ejemplo 3: En la Tabla 10.1 se estimó un modelo en el cual Y=ingreso en unidad monetaria, y X= escolaridad en años. La relación teórica entre las variables es que un aumento de la escolaridad en años produce un aumento en el ingreso en unidades monetarias. En este sentido el coeficiente de la variable escolaridad implica que por cada año de estudio, el ingreso se incrementa en 0.04 unidades monetarias. Respecto del grado de ajuste del modelo, la primera sub tabla (Tabla ANOVA5) indica la información necesaria, donde “SS Model” corresponde la SEC y “SS Residual” a la SRC, por lo que el coeficiente de determinación es igual a SEC/SCT=5.5836/6.4771=0.8621, que es el mismo valor que aparece en la segunda sub tabla bajo el nombre “R-squared”. Respecto de la significancia de los parámetros estimados, la tabla arroja el error estándar y el 𝐶𝐶𝑐𝑐 para ambos coeficientes, ��𝛽𝐷𝐷 y ��𝛽1, 0.0402/0.007185=5.59 y 2.9728/0.357=8.33, y también arroja el p-value. De acuerdo a este último enfoque, se rechaza la hipótesis nula para ambos coeficientes al 1% de significancia (P>|t|). En forma adicional, la tabla arroja intervalos de confianza al 95% para ambos coeficientes.

Tabla 10.1. Modelo de Regresión. reg y x Source | SS df MS Number of obs = 7 -------------+------------------------------ F( 1, 5) = 31.25 Model | 5.58363298 1 5.58363298 Prob > F = 0.0025 Residual | .893509285 5 .178701857 R-squared = 0.8621 -------------+------------------------------ Adj R-squared = 0.8345 Total | 6.47714226 6 1.07952371 Root MSE = .42273 ------------------------------------------------------------------------------ y | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------- x | .0401618 .0071849 5.59 0.003 .0216925 .0586311 _cons | 2.972813 .3569679 8.33 0.000 2.055198 3.890428 ------------------------------------------------------------------------------

Fuente: Elaboración propia usando el software STATA.

5 Análisis de Varianza.

Page 88: Elementos Cuantitativos de Investigación en las Ciencias ...

88

Referencias.

Gujarati, Damodar (2004). Econometría. 4ta edición. McGraw-Hill Interamericana. Levin, Jack y Levin, William C. (1999). “Fundamentos de Estadística en la Investigación Social”. Oxford University Press. Segunda Edición. Wooldridge, Jeffrey M. (2010). “Introducción a la econometría: Un enfoque moderno”. 4ta. edición. Cengage Learning Editores, S.A. de C.V. ISBN-13: 978-607-481-312-8, ISBN-10: 607-481-312-4.

Page 89: Elementos Cuantitativos de Investigación en las Ciencias ...

89

11. Modelo de Regresión Multivariado.

El modelo que se ha desarrollado hasta el momento es bastante flexible y permite modelar una serie de fenómenos que se observan en la realidad. En este punto cabe recordar que la elaboración del modelo proviene de la teoría en una primera instancia, para luego ser formalizado a través de las técnicas que se describen en esta sección y en la anterior. Y en relación a esto, se tiene que en la realidad la explicación de un fenómeno no proviene solo de una variable, por el contrario, proviene de un conjunto de variables que pueden afectarlo. Por ejemplo, al tratar de explicar la autonomía financiera de las municipalidades, podemos adoptar el modelo 11.1, donde Y corresponde a la razón entre ingresos propios permanentes6 y el ingreso total municipal, y X1 corresponde a un índice de gestión financiera municipal. La teoría inherente a este modelo es que municipalidades que realicen una mejor gestión financiera podrían tener un mayor índice de autonomía.

𝑌𝑌𝐷𝐷 = 𝛽𝛽𝐷𝐷 + 𝛽𝛽1𝑋𝑋1𝐷𝐷 + 𝜀𝜀𝐷𝐷 (11.1)

Sin embargo, puede que este no sea un modelo tan “correcto”, pues los ingresos propios permanentes de las municipalidades, y por ende su grado de autonomía, dependen no solo de la gestión del Director de Finanzas respectivo, sino que en gran parte del origen de su financiamiento, el que se da a nivel local. En consecuencia, podríamos plantear otras variables de influencia sobre la autonomía financiera, tales como el ingreso per cápita de los habitantes de la comuna, X2, la ubicación respecto de la capital regional en km, X3, etc… por lo que modelo podría quedar como 11.2.

𝑌𝑌𝐷𝐷 = 𝛽𝛽𝐷𝐷 + 𝛽𝛽1𝑋𝑋1𝐷𝐷 + 𝛽𝛽2𝑋𝑋2𝐷𝐷 + 𝛽𝛽3𝑋𝑋3𝐷𝐷 + 𝜀𝜀𝐷𝐷 (11.2) En la práctica, la estimación de los coeficientes de la ecuación 11.2 se lleva a cabo a través de softwares estadísticos, o incluso a través de Microsoft Excel. No obstante, dado que la inferencia estadística es un problema de primer orden en el modelo con una variable explicativa, es también importante en el modelo multivariado.

11.1. Test de hipótesis: Significancia Global. Para el caso del modelo multivariado, aparte de las pruebas de hipótesis de coeficiente individuales, es posible hacer un test de significancia global, el que tiene por objeto analizar la significancia de todos los coeficientes de pendiente estimados. De esta forma, la hipótesis es que todos los coeficientes estimados son simultáneamente iguales a cero. Dado el modelo 11.3, a continuación se formaliza la aplicación del test (Gujarati, 2004: 256).

𝑌𝑌𝐷𝐷 = 𝛽𝛽1 + 𝛽𝛽2𝑋𝑋2𝐷𝐷 + 𝛽𝛽3𝑋𝑋3𝐷𝐷 + ⋯+ 𝛽𝛽𝑘𝑘𝑋𝑋𝑘𝑘𝐷𝐷 + 𝜀𝜀𝐷𝐷 (11.3)

a) Planteamiento de Hipótesis:

𝐻𝐻𝐷𝐷:𝛽𝛽2 = 𝛽𝛽3 = ⋯ = 𝛽𝛽𝑘𝑘 = 0 𝐻𝐻1: no todos los coeficientes son simultáneamente cero. (11.4)

6 Estos ingresos se encuentran compuestos principalmente por el impuesto territorial, patentes municipales y permisos de circulación, y representan el ingreso que se produce a nivel local y que las municipalidades reciben con una mayor certeza. Se propone como componente del índice de autonomía pues no considera las transferencias desde el gobierno central.

Page 90: Elementos Cuantitativos de Investigación en las Ciencias ...

90

b) Estadístico: El estadístico corresponde a 11.5, donde (𝑘𝑘 − 1) son los grados de libertad del numerador y (𝐶𝐶 − 𝑘𝑘) los grados de libertad del denominador.

𝐹𝐹 = 𝑆𝑆𝑆𝑆𝑆𝑆/(𝑘𝑘−1)

𝑆𝑆𝑅𝑅𝑆𝑆/(𝑛𝑛−𝑘𝑘) (11.5)

c) Criterio de rechazo de la nula: si 𝐹𝐹 > 𝐹𝐹𝛼𝛼(𝑘𝑘 − 1,𝐶𝐶 − 𝑘𝑘) se rechaza la hipótesis nula al nivel

de confianza determinado (𝛼𝛼). Ejemplo 1: en la Tabla 11.1 se puede observar el análisis ANOVA para el ejemplo del modelo de Mortalidad Infantil de la sección anterior. En la Tabla se observa la SEC, la SRC, y los grados de libertad. Recordar que en este caso se estiman estimando 3 parámetros (k=3), pues el modelo tiene dos variables independientes, y hay 64 observaciones; entonces 𝑆𝑆𝐸𝐸𝐶𝐶/(𝑘𝑘 − 1) = 128,681.2, y 𝑆𝑆𝑅𝑅𝐶𝐶/(𝐶𝐶 − 𝑘𝑘) =1,742.88.

Tabla 11.1. Tabla ANOVA para Mortalidad Infantil

Fuente de Variación Suma de Cuadrados gl.

Suma de Promedio de Cuadrados

Regresión (SEC) 257,362.4 2 128,681.2 Residuos (SRC) 106,315.6 61 1,742.88 Total (STC) 363,678 63

Fuente: Gujarati (2004: 247) Con estos datos, el estadístico corresponde a:

𝐹𝐹 = 128,681.21,742.88

= 73.8325 Y dado que 𝐹𝐹0.05(2, 60) = 3.15, entonces se rechaza la hipótesis nula al 5%. Por otro lado, al 1% sería 𝐹𝐹0.01(2, 60) = 4.98, por lo que también se rechaza la hipótesis nula en este caso al 1% (Ver tablas estadísticas al final del libro Levin y Levin (1999)).

11.2. Test de Significancia Global: fórmula alternativa. Dada la ecuación 11.5 es posible realizar un test de significancia global de una forma adicional, la que está relacionada a la forma de cálculo del test. Si reemplaza la ecuación 10.6 en 11.5 se tiene:

𝐹𝐹 = 𝑆𝑆𝑆𝑆𝑆𝑆/(𝑘𝑘−1)𝑆𝑆𝑅𝑅𝑆𝑆/(𝑛𝑛−𝑘𝑘)

𝐹𝐹 = 𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑅𝑅𝑆𝑆

(𝑛𝑛−𝑘𝑘)(𝑘𝑘−1)

(Se reemplaza la ecuación 10.6 en SEC)

𝐹𝐹 = 𝑆𝑆𝑆𝑆𝑇𝑇𝑥𝑥𝑅𝑅2

𝑆𝑆𝑅𝑅𝑆𝑆 (𝑛𝑛−𝑘𝑘)

(𝑘𝑘−1) (Se reemplaza la ecuación 10.6 en SRC)

𝐹𝐹 = 𝑆𝑆𝑆𝑆𝑇𝑇𝑅𝑅2

(1−𝑅𝑅2)𝑆𝑆𝑆𝑆𝑇𝑇 (𝑛𝑛−𝑘𝑘)

(𝑘𝑘−1)

𝐹𝐹 = 𝑅𝑅2

(1−𝑅𝑅2) (𝑛𝑛−𝑘𝑘)

(𝑘𝑘−1)

Page 91: Elementos Cuantitativos de Investigación en las Ciencias ...

91

Reordenando la última ecuación queda la expresión 11.6. Cabe destacar que esta expresión es bastante útil pues se puede obtener usando directamente el 𝑅𝑅2.

𝐹𝐹 = 𝑅𝑅2/(𝑘𝑘−1)(1−𝑅𝑅2)/(𝑛𝑛−𝑘𝑘)

(11.6)

Ejemplo 2: en la Tabla 11.1 se puede observar el análisis ANOVA para el ejemplo del modelo de Mortalidad Infantil de la sección anterior. De la tabla se desprende que el 𝑅𝑅2=SEC/SCT=0.7077, por lo que en este caso el test de significancia global aplicando la fórmula 11.6 es (Gujarati, 2004: 250):

𝐹𝐹 = 0.7077/(3−1)(1−0.7077)/(64−3)

= 0.35390.0048

= 73.84 En este caso nuevamente se rechaza la hipótesis nula, tanto al 5% como al 1%, dado que 𝐹𝐹0.05(2, 60) = 3.15 y 𝐹𝐹0.01(2, 60) = 4.98. Ejemplo 3: Sin embargo, al igual que los casos anteriores, el test F también se puede implementar siguiendo la técnica del p-value. En la Tabla 11.2 se observa un modelo con dos variables explicativas, 𝑥𝑥1 y 𝑥𝑥2. Desde el punto de vista de los coeficientes individuales, solo el coeficiente de 𝑥𝑥2 es significativo al 5% (p=0.024<0.05), al igual que la constante al 1%. La bondad de ajuste del modelo es SEC/SCT=6.2629/6.4771=0.9669, como se desprende de la Tabla ANOVA y como aparece confirmado en la segunda sub tabla. Al analizar la Tabla ANOVA se observan los grados de libertad, y 𝑆𝑆𝐸𝐸𝐶𝐶/(𝑘𝑘 − 1) y 𝑆𝑆𝑅𝑅𝐶𝐶/(𝐶𝐶 − 𝑘𝑘). Dado que el modelo estima 3 coeficientes (k=3), los grados de libertad del numerador son 2, y los del denominador son 7-3=4. Entonces 6.2629/(3− 1) = 3.1315 y 0.2142/(7− 3) = 0.05355, por lo que el estadístico F es igual a 3.1315/0.05355=58.47. Si bien este resultado se desprende del análisis ANOVA, también aparece en la segunda sub tabla bajo la denominación F(2, 4)=58.47, y debajo de ese valor aparece el p-value para el caso del F (ver Prob>F). En este caso, se rechaza la hipótesis nula al 1% (p=0.0011<0.01), por lo que se rechaza la hipótesis de que todos los coeficientes son simultáneamente cero.

Tabla 11.2. Modelo de Regresión.

reg y x1 x2 Source | SS df MS Number of obs = 7 -------------+------------------------------ F( 2, 4) = 58.47 Model | 6.26291845 2 3.13145923 Prob > F = 0.0011 Residual | .214223806 4 .053555951 R-squared = 0.9669 -------------+------------------------------ Adj R-squared = 0.9504 Total | 6.47714226 6 1.07952371 Root MSE = .23142 ------------------------------------------------------------------------------ y | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------- x1 | .0094754 .0094717 1.00 0.374 -.0168222 .0357729 x2 | -.3098176 .0869929 -3.56 0.024 -.5513486 -.0682866 _cons | 6.243757 .9390002 6.65 0.003 3.636675 8.85084 ------------------------------------------------------------------------------

Fuente: Elaboración propia usando el software STATA.

Page 92: Elementos Cuantitativos de Investigación en las Ciencias ...

92

11.4. Otras formas funcionales. En esta sección se revisan algunas de las formas funcionales que se usan en la estimación empírica. Tal como se dijo en la introducción de la sección anterior, esta exposición no pretende ser totalmente acabada, si no que una exposición a algunos de los temas generales del análisis de regresión. De esta forma esta sub sección revisa algunas de las formas funcionales usadas en el trabajo empírico.

A) Formas cuadráticas. El análisis econométrico es bastante flexible por lo que también se pueden estimar funciones no lineales. Recuerde las funciones cuadráticas de la sección “funciones”. En Microeconomía abundan ejemplos de no linealidades, tales como los rendimientos marginales decrecientes de la utilidad o la productividad marginal de los factores. Obsérvese la ecuación 11.7, en esta la variable Y depende no solo de 𝑋𝑋1 sino que también de 𝑋𝑋12.

𝑌𝑌𝐷𝐷 = 𝛽𝛽𝐷𝐷 + 𝛽𝛽1𝑋𝑋𝐷𝐷1 + 𝛽𝛽2𝑋𝑋𝐷𝐷12 + 𝜀𝜀𝐷𝐷 (11.7) La intuición de dicha ecuación se puede analizar recordando el Ejemplo 1 de la sección “Aplicaciones de la Derivada” (sección 3.8.1). En este se presenta la ecuación 𝑦𝑦 = 2 + 𝑥𝑥 − 𝑥𝑥2, y la figura correlativa corresponde a la Figura 11.1. Si se estima la ecuación 11.7 un resultado particular podría ser la ecuación 𝑦𝑦 = 2 + 𝑥𝑥 − 𝑥𝑥2, donde 𝛽𝛽𝐷𝐷 = 2, 𝛽𝛽1 = 1 y 𝛽𝛽2 = −1. En sentido, con formas cuadráticas es posible estimar funciones que tienen rendimientos decrecientes al factor.

Figura 11.1: Curva de Producción de un Organismo Público y A y’=0 x

B) Elasticidades. El modelo MCO se puede estimar efectuando todo tipo de transformaciones sobre las variables. En este sentido, al aplicar logaritmo natural sobre estas se tiene:

𝑌𝑌𝐷𝐷 = 𝛽𝛽𝐷𝐷 + 𝛽𝛽1𝑋𝑋𝐷𝐷 + 𝜀𝜀𝐷𝐷 (11.8) 𝑌𝑌𝐷𝐷∗ = 𝛽𝛽𝐷𝐷 + 𝛽𝛽1𝑋𝑋𝐷𝐷∗ + 𝜀𝜀𝐷𝐷 (11.9)

Donde 𝑌𝑌𝐷𝐷∗ = ln (𝑌𝑌𝐷𝐷) y 𝑋𝑋𝐷𝐷∗ = ln (𝑋𝑋𝐷𝐷). La estimación del modelo 11.9 cambia la interpretación del coeficiente 𝛽𝛽1, pues ya no corresponde al cambio en Y cuando X varía en una unidad, ahora corresponde a la elasticidad. Es decir, corresponde al cambio porcentual en la variable Y cuando la variable X aumenta en un 1%. Por ejemplo si 𝛽𝛽1 = 0.3 en 11.9, quiere decir que Y aumenta en 0.3% cuando X aumenta en 1%. Para aplicaciones particulares de este concepto se puede consultar la “Elasticidad-Precio de la Demanda” en Frank (2005: 114).

Page 93: Elementos Cuantitativos de Investigación en las Ciencias ...

93

Sin embargo, si bien el cálculo de la elasticidad requiere que las dos variables estén en logaritmo, también hay otros modelos alternativos, en los cuales solo una variable se deja en logaritmo natural y la otra en niveles, tales como el caso del modelo Log-Lin (11.10) y Lin-Log (11.11). Para el caso del primero 𝛽𝛽1 corresponde a la tasa de crecimiento de Y producto de un aumento de una unidad en X. Para el caso del segundo, 𝛽𝛽1 corresponde al cambio de unidades en Y, producto del aumento de un 1% de X.

𝑌𝑌𝐷𝐷∗ = 𝛽𝛽𝐷𝐷 + 𝛽𝛽1𝑋𝑋𝐷𝐷 + 𝜀𝜀𝐷𝐷 (11.10) 𝑌𝑌𝐷𝐷 = 𝛽𝛽𝐷𝐷 + 𝛽𝛽1𝑋𝑋𝐷𝐷∗ + 𝜀𝜀𝐷𝐷 (11.11)

El modelo 11.10 es útil para calcular las tasas de crecimiento. En la tabla 11.3 se ha llevado a cabo la estimación entre el logaritmo natural de Y y X en niveles. En este caso lny corresponde al logaritmo natural del PIB per cápita y la variable year a los años, por lo que el coeficiente estimado implica que la tasa anual de crecimiento del PIB per cápita es de 9.6%.

Tabla 11.3. Modelo de Regresión Log-Lineal. reg lny year Source | SS df MS Number of obs = 7 -------------+------------------------------ F( 1, 5) = 76.47 Model | .259568698 1 .259568698 Prob > F = 0.0003 Residual | .016971539 5 .003394308 R-squared = 0.9386 -------------+------------------------------ Adj R-squared = 0.9264 Total | .276540237 6 .046090039 Root MSE = .05826 ------------------------------------------------------------------------------ lny | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------- year | .0962825 .0110102 8.74 0.000 .0679797 .1245852 _cons | 1.154592 .0492393 23.45 0.000 1.028019 1.281166 ------------------------------------------------------------------------------

Fuente: Elaboración propia usando el software STATA.

C) Funciones de Producción.

En el ámbito de la economía es usual estimar funciones de producción, y una revisión de la teoría indica que esta se puede modelar a través de diferentes formas, entre las que se tiene la función de Leontief o de proporciones fijas, Sustitución Perfecta, y la Cobb-Douglas. Para una revisión de sus características ver la teoría de la producción en Frank (2005: 300). C.1) Función de Producción de Sustitución Perfecta: esta función se caracteriza por el supuesto de que los insumos de producción son sustitutos perfectos, por lo que se podría sustituir trabajo (L) y capital (K) sin problema, manteniendo la producción constante (Q). De esta forma, una función de producción con tales características tendría la forma:

𝑄𝑄 = 𝛼𝛼𝐾𝐾 + 𝛽𝛽𝐿𝐿 (11.12) Donde Q corresponde a la producción, K al capital, L al trabajo, y, α y β a los parámetros a estimar, que en este caso deben ser positivos. Un ejemplo de esta función se puede observar en 11.13, donde 𝛼𝛼 = 2 y 𝛽𝛽 = 1, mientras que su forma gráfica se observa en la figura 11.2.

𝑄𝑄 = 2𝐾𝐾 + 𝐿𝐿 (11.13)

Page 94: Elementos Cuantitativos de Investigación en las Ciencias ...

94

Figura 11.2: Función de Producción de Sustitutos Perfectos. Dos Perspectivas.

Fuente: Elaboración propia usando el Software MAXIMA. C.2) Función de Producción Cobb-Douglas: esta función de producción es una de las más utilizadas en la modelación de la producción tanto por su facilidad como por su versatilidad. Formalmente esta define en la ecuación 11.14 (Frank, 2005: 300).

𝑄𝑄 = 𝑚𝑚𝐾𝐾𝛼𝛼𝐿𝐿𝛽𝛽 (11.14) Donde 0 < 𝛼𝛼 < 1 y 0 < 𝛽𝛽 < 1, y 𝑚𝑚 > 0. En ese caso los valores a estimar corresponden a 𝛼𝛼, 𝛽𝛽 y 𝑚𝑚. Ejemplos de esta función se encuentran en las ecuaciones 11.15 a 11.17. En 11.15 𝛼𝛼 = 0.5, 𝛽𝛽 = 0.5 y 𝑚𝑚 = 1; en 11.16 𝛼𝛼 = 1, 𝛽𝛽 = 1 y 𝑚𝑚 = 1; mientras que en 11.17, 𝛼𝛼 = 2, 𝛽𝛽 = 1 y 𝑚𝑚 = 1.

𝑄𝑄 = √𝐾𝐾𝐿𝐿 (11.15) 𝑄𝑄 = 𝐾𝐾𝐿𝐿 (11.16) 𝑄𝑄 = 𝐾𝐾2𝐿𝐿 (11.17)

La gráfica de estas funciones se encuentra en la Figura 11.3.

Figura 11.3: Función de Producción Cobb-Douglas, Diferentes Parámetros.

(a) Ecuación 11.15.

0 2

4 6

8 10 0

2 4

6 8

10

0

5

10

15

20

25

30

z

L+2*K

L

K

z

0 2

4 6

8 10

0 2

4 6

8 10 0

5

10

15

20

25

30

z

L+2*K

LK

z

0 2

4 6

8 10 0

2 4

6 8

10

0

2

4

6

8

10

z

sqrt(K*L)

L

K

z

0 2

4 6

8 10

0 2

4 6

8 10 0

2

4

6

8

10

z

sqrt(K*L)

LK

z

Page 95: Elementos Cuantitativos de Investigación en las Ciencias ...

95

(b) Ecuación 11.16.

(c) Ecuación 11.17.

Fuente: Elaboración propia usando el Software MAXIMA. Cabe destacar que la función Cobb-Douglas se puede transformar para facilitar su estimación. Aplicando logaritmo natural sobre la ecuación 11.14, se tiene:

𝑄𝑄 = 𝑚𝑚𝐾𝐾𝛼𝛼𝐿𝐿𝛽𝛽 𝑙𝑙𝐶𝐶(𝑄𝑄) = 𝑙𝑙𝐶𝐶�𝑚𝑚𝐾𝐾𝛼𝛼𝐿𝐿𝛽𝛽� 𝑙𝑙𝐶𝐶(𝑄𝑄) = 𝑙𝑙𝐶𝐶(𝑚𝑚) + 𝑙𝑙𝐶𝐶 (𝐾𝐾𝛼𝛼) + 𝑙𝑙𝐶𝐶 (𝐿𝐿𝛽𝛽)

𝑙𝑙𝐶𝐶(𝑄𝑄) = 𝑙𝑙𝐶𝐶(𝑚𝑚) +𝛼𝛼𝑙𝑙𝐶𝐶 (𝐾𝐾) + 𝛽𝛽𝑙𝑙𝐶𝐶 (𝐿𝐿) + 𝜀𝜀 (11.18)

Por lo que el problema se limita a estimar los coeficientes 𝛼𝛼 y 𝛽𝛽 en la ecuación 11.18. Como se puede observar, el MCO es bastante flexible y se puede utilizar para estimar un sinfín de formas funcionales entre las variables en diferentes contextos de investigación.

Referencias. Frank, Robert (2005). “Microeconomía y Conducta”. 5ta Edición. Mc Graw Hill. España Gujarati, Damodar (2004). Econometría. 4ta edición. McGraw-Hill Interamericana. Levin, Jack y Levin, William C. (1999). “Fundamentos de Estadística en la Investigación Social”. Oxford University Press. Segunda Edición. Wooldridge, Jeffrey M. (2010). “Introducción a la econometría: Un enfoque moderno”. 4ta. edición. Cengage Learning Editores, S.A. de C.V. ISBN-13: 978-607-481-312-8, ISBN-10: 607-481-312-4.

0 2 4 6 8 10 0 2 4 6 8 10 0

20

40

60

80

100

z

K*L

L K

z

0 2

4 6

8 10

0 2

4 6

8 10 0

20

40

60

80

100

z

K*L

LK

z

0 2 4 6 8 10 0 2 4 6 8 10 0

200

400

600

800

1000

z

K 2*L

LK

z

0

2

4

6

8

10

0

2

4

6

8

10 0

200

400

600

800

1000

z

K 2*L

LK

z

Page 96: Elementos Cuantitativos de Investigación en las Ciencias ...

96

Ejercicios Propuestos.

7. Suponga que tiene los siguientes datos, y se le pide que modele la calificación de los alumnos en establecimientos de vulnerabilidad. Las variables son: X= Tiempo que dedican a estudiar los alumnos de colegios en vulnerabilidad a estudiar en minutos. Y= Calificación del alumno. Tabla 1

X Y 60 5 45 4.5 30 4 60 5.5 20 3.5 10 3 120 6

a. En STATA, obtenga la estadística descriptiva de cada variable (i.e. sum x) b. Realice una inspección visual para explorar respecto de una potencial relación

(scatter x y). c. Realice la modelación respectiva y calcule el R2 con la información de la suma de

cuadrados que ofrece el output de STATA. d. Interprete los coeficientes estimados, y sus test de significancia (t y F) mediante el

criterio del p-valor. e. Visualice la recta de regresión estimada usando el comando aaplot. Para instalar

digite en el cuadro de comandos: ssc inst aaplot f. Nuevamente estime el modelo y haga una predicción del error usando el comando

predict r, resid. g. Analice la normalidad de los residuos a través del test swilk. Dicho test asume

como hipótesis nula que los datos se distribuyen normalmente ¿Qué quiere decir el resultado?

h. Confirme lo anterior a través de la estadística descriptiva en detalle de los residuos (i.e. sum x, detail)

i. Estime nuevamente el modelo y haga una predicción de la variable Y, esto es Y . Luego correlacione Y e 𝑌𝑌�, y obtenga el cuadrado de la correlación ¿qué valor obtuvo?

j. Ahora, estime el modelo en logaritmos naturales, e interprete el coeficiente obtenido.

8. Usted dispone de la base de datos “muestra_casen2009” (donde la unidad de observación

son las personas). Se le pide que:

a. Realice una descripción de la base de datos (describe) b. Determine cuantos casos corresponden a cada región usando el comando tab. c. Determine cuantos casos corresponden a la zona urbana (tab) d. Haga un estudio descriptivo de la variable ingreso autonómo usando el comando

summarize.

Page 97: Elementos Cuantitativos de Investigación en las Ciencias ...

97

e. Haga el mismo estudio descriptivo, pero ahora solicite los detalles (sum x, detail) f. Haga un estudio descriptivo del ingreso por zona, sexo, y estado civil. Utilice el

comando bysort (i.e. bysort z: sum yautaj) g. Haga una inspección visual respecto del ingreso y la escolaridad utilizando el

comando scatter. h. Realice la misma inspección visual, pero restringiendo el ingreso a un millón de

pesos. i. Realice una matriz de correlaciones para las siguientes variables que pueden estar

correlacionadas con el ingreso: escolaridad y edad. Obtenga las correlaciones con su significancia usando el comando pwcorr x, sig

j. Estime un modelo donde el ingreso es función de la edad y la escolaridad, e interprete los coeficientes obtenidos. 𝐶𝐶𝐶𝐶𝑖𝑖𝑑𝑑𝐶𝐶𝑠𝑠𝐶𝐶 = 𝑓𝑓(𝐶𝐶𝑑𝑑𝑎𝑎𝑑𝑑, 𝐶𝐶𝑠𝑠𝑐𝑐𝐶𝐶𝑙𝑙𝑎𝑎𝑑𝑑𝐶𝐶𝑑𝑑𝑎𝑎𝑑𝑑)

k. Dado el bajo poder explicativo de la regresión anterior, debe estimar un nuevo modelo donde el ingreso es función de: 𝐶𝐶𝐶𝐶𝑖𝑖𝑑𝑑𝐶𝐶𝑠𝑠𝐶𝐶 = 𝑓𝑓(𝐶𝐶𝑑𝑑𝑎𝑎𝑑𝑑, 𝐶𝐶𝑑𝑑𝑎𝑎𝑑𝑑2, 𝐶𝐶𝑠𝑠𝑐𝑐𝐶𝐶𝑙𝑙𝑎𝑎𝑑𝑑𝐶𝐶𝑑𝑑𝑎𝑎𝑑𝑑,𝑅𝑅𝑀𝑀,𝐻𝐻𝐻𝐻𝑀𝑀𝐻𝐻𝑅𝑅𝐸𝐸, 𝑆𝑆𝐴𝐴𝑁𝑁𝐼𝐼𝐼𝐼𝐴𝐴𝑆𝑆𝐻𝐻,𝐻𝐻𝐶𝐶𝑈𝑈𝛽𝛽𝐴𝐴𝐷𝐷𝐻𝐻) Donde las variables en mayúscula corresponden a variables dicótomas, las que toman el valor de “uno” cuando se cumple la condición, y “cero” en otro caso. Para crear las variables dicótomas analice cada variable mediante su codebook. gen rm=(r==13) gen HOMBRE=(sexo==1) gen SANTIAGO=(comu==13101) gen OCUPADO=(activ==1)

l. Estime nuevamente el modelo propuesto restringiendo el ingreso a una cifra menor a un millón de pesos.

m. Por último, estime el coeficiente de Gini del ingreso, usando el comando ineqdeco.