Estadística con Excel

21
Contexto cierto Contexto cierto MICROECONOMIA CON EXCEL 30 CAPITULO 2 Los datos fueron obtenidos en el INDEC hasta diciembre 2002 y en la Dirección Nacional de Aduanas para el lapso enero/marzo 2003, correspondiendo a la estadística del volumen de importación por la posición 2815.11.00 (soda cáustica) del nomenclador de comercio exterior. CONTEXTO CIERTO Se analizarán las variaciones en series individuales y la correlación (simple y múltiple) entre ellas. Se estudian las medidas de posición y las de dispersión, considerando los datos como series simples. En las series individuales se estudian las series simples y las de frecuencias, para determinar sus principales medidas de posición y de dispersión (y los momentos absolutos y centrados). A continuación también se analizan esos mismos datos conformando series de frecuencias al separarlos en tramos según el peso a transportar, incluyendo las medidas de posición y de dispersión así como los momentos absolutos y momentos centrados hasta cuarto orden. Además, en las series cronológicas interesa encontrar una función de tendencia, luego de depurarlas de componentes estacionales, cíclicos y aleatorios. ANALISIS DE VARIABLES INDIVIDUALES Paralelamente se utilizan diversas funciones prediseñadas de Excel confirmando las mediciones estadísticas; y se grafican cuadros que facilitan la toma de decisiones para la empresa de transportes. SERIES SIMPLES Para el análisis de las series simples y de frecuencia se utilizará aquí como ejemplo hipotético, un supuesto estudio de mercado de fletes. Para esto se efectúa un análisis estadístico de las operaciones comerciales de importación argentina de soda cáustica, durante los doce últimos meses previos a abril 2003, analizando el mercado de transporte por camión para la firma Transportes Rutazul S. A. Los datos figuran en el siguiente cuadro (al cual se le han ocultado las filas 5 hasta 98 para simplificar esta presentación): nombre del importador y kilos importados en cada despacho en las columnas A y B. Esta empresa necesita evaluar la logística para atender el tráfico de sus clientes entre el puerto de Buenos Aires y las empresas importadoras de soda cáustica, ubicadas en el área metropolitana e interior de la provincia de Buenos Aires. La flota camionera a utilizar (cantidad de unidades chicas, medianas y/o grandes) dependería del nivel de los despachos involucrados, así como de la fluidez del movimiento y diversidad en magnitud de cada uno de estos envíos. MICROECONOMIA CON EXCEL 29

Transcript of Estadística con Excel

Page 1: Estadística con Excel

Contexto cierto Contexto cierto

MICROECONOMIA CON EXCEL 30

CAPITULO 2 Los datos fueron obtenidos en el INDEC hasta diciembre 2002 y en la Dirección Nacional de Aduanas para el lapso enero/marzo 2003, correspondiendo a la estadística del volumen de importación por la posición 2815.11.00 (soda cáustica) del nomenclador de comercio exterior.

CONTEXTO CIERTO Se analizarán las variaciones en series individuales y la correlación (simple y múltiple) entre ellas.

Se estudian las medidas de posición y las de dispersión, considerando los datos como series simples.

En las series individuales se estudian las series simples y las de frecuencias, para determinar sus principales medidas de posición y de dispersión (y los momentos absolutos y centrados).

A continuación también se analizan esos mismos datos conformando series de frecuencias al separarlos en tramos según el peso a transportar, incluyendo las medidas de posición y de dispersión así como los momentos absolutos y momentos centrados hasta cuarto orden.

Además, en las series cronológicas interesa encontrar una función de tendencia, luego de depurarlas de componentes estacionales, cíclicos y aleatorios.

ANALISIS DE VARIABLES INDIVIDUALES Paralelamente se utilizan diversas funciones prediseñadas de Excel confirmando las mediciones estadísticas; y se grafican cuadros que facilitan la toma de decisiones para la empresa de transportes.

SERIES SIMPLES Para el análisis de las series simples y de frecuencia se utilizará aquí como ejemplo hipotético, un supuesto estudio de mercado de fletes. Para esto se efectúa un análisis estadístico de las operaciones comerciales de importación argentina de soda cáustica, durante los doce últimos meses previos a abril 2003, analizando el mercado de transporte por camión para la firma Transportes Rutazul S. A.

Los datos figuran en el siguiente cuadro (al cual se le han ocultado las filas 5 hasta 98 para simplificar esta presentación): nombre del importador y kilos importados en cada despacho en las columnas A y B.

Esta empresa necesita evaluar la logística para atender el tráfico de sus clientes entre el puerto de Buenos Aires y las empresas importadoras de soda cáustica, ubicadas en el área metropolitana e interior de la provincia de Buenos Aires. La flota camionera a utilizar (cantidad de unidades chicas, medianas y/o grandes) dependería del nivel de los despachos involucrados, así como de la fluidez del movimiento y diversidad en magnitud de cada uno de estos envíos.

MICROECONOMIA CON EXCEL 29

Page 2: Estadística con Excel

Contexto cierto Contexto cierto

MICROECONOMIA CON EXCEL 32

MEDIA ARMONICA: es la recíproca de la media aritmética de los recíprocos: aquí 3 / (1/2 + 1/4 +1/8) = 3,43. Esta medida podría ser útil para comparar las medias de esta muestra con, por ejemplo, otras de años anteriores. Excel la calcula mediante la función prediseñada que muestra la solapa.

MEDIDAS DE POSICION: MEDIA ARITMETICA: sumatoria sobre n; el cursor ubicado sobre la media aritmética muestra el cálculo en la solapa superior (=suma(B3:B100) / 100 ) MEDIA GEOMETRICA: raíz enésima del producto de n números. Ante números desiguales positivos resulta un promedio inferior a la media aritmética. Por ejemplo, con los números 2, 4 y 8 sería la raíz cúbica de 64 = 4 (menor que el promedio aritmético 4,67) Calculada con logaritmos o con Excel puede ser una medida interesante en algunos problemas, no obstante que aquí carece de sentido.

MICROECONOMIA CON EXCEL 31

Page 3: Estadística con Excel

Contexto cierto Contexto cierto

MICROECONOMIA CON EXCEL 34

Otro ejemplo para PROMEDIOS Y MEDIDAS DE POSICION: Al escribir lo que aparece en B5 y anotar o pintar el rango de datos calculará la media, la moda, e igualmente para otras funciones: “=percentil(valores;percentil)” etc.

Excel tiene en incorporadas alfabéticamente funciones para calcular la moda (valor más frecuente); la mediana (el valor o frecuencia intermedia de una serie “ordenada”) y para la media aritmética (promedio).

RELACION ENTRE MEDIAS: La media geométrica de una serie de números positivos es menor o igual que su media aritmética, pero es mayor o igual que su media armónica. MEDIANA: En una serie ordenada de mayor a menor la mediana es el valor intermedio, el central (o la mitad de los dos centrales si la serie fuera par). Si por ejemplo, en otro caso fuera bueno que la serie variara uniformemente, la mediana indicaría si coincide con el valor intermedio; aunque aquí tiene poco significado. En este ejemplo hay varios valores centrales así como la mediana con 25000 kilos. Además Excel confirma esta observación con la función prediseñada =mediana(B5:B102).

La media aritmética es una medida afectada por el valor de sus datos extremos y también se utilizan otros promedios, como la media geométrica y la media armónica, siendo sus relaciones:

media armónica < media geométrica < media aritmética MODA(O): Es el valor con mayor frecuencia: en este caso 25000 aparece 23 veces, mientras que el siguiente en frecuencia es 10000, que solo aparece 20 veces. Excel confirma esta observación con su función prediseñada =moda(B3:B102)

En los casos de datos que se agrupan según una curva de frecuencia normal unimodal se cumple:

media – moda = 3(media – mediana)

MICROECONOMIA CON EXCEL 33

Page 4: Estadística con Excel

Contexto cierto Contexto cierto

MICROECONOMIA CON EXCEL 36

DESVIO ESTANDAR En una población es la raíz cuadrada de la varianza / n, o sea, la raíz de (D105 /n). Excel utiliza la función prediseñada =desvestp(B3:B102) que omite los valores lógicos y el texto. Los incluye con =desvestpa(B3:B102). Para una muestra Excel utiliza =desvest(B3:B102), que omite los valores lógicos y el texto. Para considerar estos últimos utiliza =desvesta(B3:B102), que asigna 0 a los valores lógicos y texto Falso y asigna 1 a éstos cuando tienen valor Verdadero.

MEDIDAS DE DISPERSION: VARIANZA Es el cuadrado de la diferencia entre cada dato y la media, que se calcula en la columna D (al lado, en C, se muestra el cálculo). La media aritmética se calculó en C111. La diferencia entre cada dato y esa media figura en la columna D elevada al cuadrado. La varianza es la suma, en D103. Excel tiene la función prediseñada para calcularla con =varp(B3"B102).

Si no fuera una población sino solo una muestra Excel utiliza =var(B3:B102) que omite los valores lógicos y el texto. En este ejemplo se observó que siendo la media aritmética 40986,9

hay el gran desvío por 40119. Esto orientaría a pensar que, al ser un estudio es para una empresa de transporte de soda cáustica desde el Puerto hasta los depósitos en establecimientos, se debería prever camiones muy chicos y simultáneamente otros muy grandes, a fin de optimizar su logística, ya que hay gran desvío en el tamaño de los despachos. Si hubiera sido pequeño correspondería prever camiones uniformes, para el tamaño que indicara el modo(a), ya que todos los despachos serían parecidos en tamaño.

Para incluir los valores lógicos y de texto en una muestra Excel utiliza =vara(B3:B102), que asigna 0 a los valores lógicos y el texto Falso y asigna 1 a los valores lógicos y el texto Verdadero.

MICROECONOMIA CON EXCEL 35

Page 5: Estadística con Excel

Contexto cierto Contexto cierto

MICROECONOMIA CON EXCEL 38

El coeficiente de variación expresa esto en %. La desviación media es = 4/5 de la desviación típica. El rango semicuartílico es = 2/3 de la desviación típica.

DESVIACIÓN ESTANDAR- EN UNA POBLACIÓN: Como otros ejemplos sobre dispersión de los datos, luego de calculada la media, interesa la desviación de los datos entre cuartiles. También puede interesar conocer la desviación media o promedio (sin signo, en %) de los datos luego de conocida la media.

La media y desviación típica de esta población se calculan con Excel según se lee en este cuadro:

Estas y otras funciones afines, disponibles con , también se las aplica al estudiar más adelante la "relación" entre dos o más variables.

La desviación estándar o típica “s” (kilos o unidades), cuyo cálculo es parecido en una población y en una muestra (con σ en vez de s). Se utiliza la raíz y el cuadrado: varianza “s2” (σ2 en muestras), también en kilos o unidades.

MICROECONOMIA CON EXCEL 37

Page 6: Estadística con Excel

Contexto cierto Contexto cierto

MICROECONOMIA CON EXCEL 40

0

5

10

15

20

25

30

35

40

Frecuencia absoluta

0,01 A11.440

11.441 A22880

22881 -34320

34321 -45760

45761 -57200

57201 -68640

68641 -80080

80081 -91520

91521 -102960

102961 -114400

Intervalo Kilos

Frecuencia Despachos Soda CáusticaSERIES DE FRECUENCIAS El análisis mediante series de frecuencias confirmará las observaciones con series simples. Se estudian las medidas de posición y de dispersión; también se efectúa un análisis mediante momentos absolutos y centrados. Ordenando la serie en forma creciente de kilos se pueden seleccionar intervalos de diversa amplitud, por ejemplo aquí de 11.440 kilos, para registrar en cada uno de estos deciles la cantidad de despachos, como frecuencia absoluta en (A) y en (B) la cantidad acumulada de éstos sumándolos.

MEDIA ARITMETICA: El siguiente cuadro muestra como calcular la media efectuando las operaciones con una hoja de cálculo

Ambas frecuencias pueden ser graficadas, en forma de barras unas (histograma o función de frecuencias) y en forma de curva continua o discreta pero creciente las otras (polígono de frecuencias acumuladas o función de distribución).

MICROECONOMIA CON EXCEL 39

Page 7: Estadística con Excel

Contexto cierto Contexto cierto

MICROECONOMIA CON EXCEL 42

MEDIA ARMONICA: Frecuencia Acumulada Soda Cáustica

40

60

80

100

120

Inte

rval

o

0

20

0 2 4 6 8 10 12

Intervalo Kilos (miles)

MEDIANA:

MEDIA GEOMETRICA: Igualmente, Excel muestra en la solapa el cálculo correspondiente, no obstante que en el ejemplo actual esta medida no sea significativa:

MODA(O):

MICROECONOMIA CON EXCEL 41

Page 8: Estadística con Excel

Contexto cierto Contexto cierto

MICROECONOMIA CON EXCEL 44

MEDIDAS DE ORDEN - "CUANTILES" CUARTILES: cada uno de los 4 intervalos en que fracciono la serie; se calculan como indica el cuadro:

MEDIDAS DE DISPERSION DESVIO ESTANDAR Y VARIANZA:

DECILES: Cada uno de los 10 intervalos en que divido la serie, según se indica:

ASIMETRIA Y CURTOSIS

Más adelante, al tratar funciones, se agregarán otras medidas de dispersión, como la asimetría (para indicar si una curva es o no simétrica respecto a un eje central) y la curtosis (para indicar la forma de una curva real más o menos achatada frente a una curva normal u otra función teórica)

PERCENTILES: Cada uno de los 100 intervalos en que divido la serie, según el siguiente ejemplo:

MICROECONOMIA CON EXCEL 43

Page 9: Estadística con Excel

Contexto cierto Contexto cierto

MICROECONOMIA CON EXCEL 46

MOMENTO 2: MOMENTOS ABSOLUTOS HASTA SU CUARTO GRADO: MOMENTO 0:

MOMENTO 3:

MOMENTO 1:

MOMENTO 4:

MICROECONOMIA CON EXCEL 45

Page 10: Estadística con Excel

Contexto cierto Contexto cierto

MICROECONOMIA CON EXCEL 48

MOMENTO 3: MOMENTOS CENTRADOS HASTA CUARTO ORDEN MOMENTO 1:

MOMENTO 4:

MOMENTO 2:

MICROECONOMIA CON EXCEL 47

Page 11: Estadística con Excel

Contexto cierto Contexto cierto

MICROECONOMIA CON EXCEL 50

DESVIO CUARTILICO: El estudio de cuantiles -cuartiles, deciles y percentiles- confirma la distribución atomizada en los primeros cuantiles, y gran concentración en los últimos.

Mediante el análisis de los momentos también se confirmó la gran varianza de los despachos. La atomización simultánea a una gran concentración de despachos en usuarios masivos se confirma también mediante la gran asimetría que indica el momento central tres M3. Asimismo, el momento centrado cuatro M4 muestra la elevada curtosis, indicando que la distribución leptocúrtica de estos despachos responde a una ley que difiere profundamente de una distribución campanular normal tipo de Gauss, orientando hacia la decisión de prever simultáneamente un parque de unidades de transporte de tamaño reducido adicional a otras grandes para el tráfico masivo.

VARIANZA MEDIANTE MOMENTOS:

ANALISIS DE UNA SERIE CRONOLOGICA

Series de datos históricos, empíricos (discretos, discontinuos) cuya evolución puede incluir o no componentes aleatorios, efectos coyunturales y efectos periódicos, además de una tendencia.

CONCLUSION : Es usual incluir alguna conclusión tras un análisis de las series. En este caso se podría que los valores de media y varianza también muestran con series de frecuencias la elevada dispersión del tamaño de los embarques o despachos de soda cáustica a transportar.

Una vez depurada la serie de los datos aleatorios y los efectos coyunturales y periódicos, su tendencia puede estimarse con el análisis de regresión de Excel, desarrollado más adelante.

MICROECONOMIA CON EXCEL 49

Page 12: Estadística con Excel

Contexto cierto Contexto cierto

MICROECONOMIA CON EXCEL 52

La variación periódica (horaria, semanal, estacional, etc.) suele representarse con índices base 100, dividiendo las medias periódicas por la media aritmética.

• Se divide cada valor original por el promedio móvil correspondiente.

• Se forman los promedios de los meses. No existen variaciones cíclicas o aleatorias ya que éstos se compensan.

Una variación coyuntural o cíclica es aquella que puede repetirse pero con duración y forma diferentes a la estacional; se detectan luego de dividir por los valores de tendencia y de la estacionalidad.

• Se expresan los valores obtenidos en porcentajes del promedio de los doce meses.

• Se representan los valores gráficamente de E(t) resultando la curva que expresa la variación estacional.

Puede haber además variaciones aleatorias, no explicadas por los ajustes anteriores; si no indicaran algo, podrían ser eliminables mediante una media flexible.

Método de los promedios móviles: este método es recomendable para trabajar con la estacionalidad, aunque también se lo utiliza para averiguar la tendencia. Los promedios móviles son sucesivos y pueden ser o no ponderados.

Es conveniente trabajar con una cantidad par de años. Una vez obtenida la cantidad de años se repite la operación corriendo los sumandos y se vuelve a atribuir cada valor al valor del centro.

Dada una serie y (t), con t variando en períodos mensuales de N años se escriben los valores encolumnados y se forman promedios móviles de doce meses. Luego:

Finalmente se obtienen los coeficientes de estacionalidad de cada bimestre: I=1.004; II=0,959; III=1.003; IV=0,991; V=1,102; etc.

MICROECONOMIA CON EXCEL 51

Page 13: Estadística con Excel

Contexto cierto Contexto cierto

MICROECONOMIA CON EXCEL 54

Cada onda esta compuesta por las siguientes partes: Tiene como propiedad que no existen variaciones estacionales y además que no altera los valores extremos, ya que suaviza lo central.

1°. son los tres meses centrados en el primer mínimo de la onda

5°. son los tres meses centrados en el máximo de la onda. 9°. son los tres meses centrados en el valle de la onda

2,3,4°. son sucesivos tercios del período de expansión comprendidos entre 1 y 5. CICLOS:

6,7,8°. son sucesivos tercios del período de contracción entre 5 y 9. Método de los nueve puntos: Tiene por objeto aislar la

componente cíclica de una serie de tiempo con datos mensuales cuando se trata en ciclos cortos de 3 ó 4 años.

• Los valores de la serie original se deflactan de la componente estacional por el método de los promedios móviles en doce meses.

• Los datos sin componente estacional se dibujan tratando de establecer en el dibujo las ondas cíclicas, para lo cual se señalan los puntos mínimos y máximos relativos destacados, según se van encontrando al recorrer la serie. Las ondas se delimitan tomando valores mínimos consecutivos. Se asimila a una función sinusoidal.

RELACION ENTRE VARIABLES - SIMPLE (DOS VARIABLES) AJUSTAMIENTOS

• En cada onda se expresan los valores mensuales en porcentaje del promedio correspondiente a los valores de toda la onda.

Método de los mínimos cuadrados: se lo utiliza para averiguar la tendencia obteniendo los coeficientes a y b de una recta de regresión lineal.

• Cada onda se divide en nueve partes. • En cada onda se promedian los valores correspondientes a cada

una de las nueve partes resultando nueve los resultados representativos.

Dada una serie cronológica y(t), con t=1,2,3...N, se trata de determina entre todas las rectas del plano y = at + b aquella que mejor ajuste la serie de valores empíricos. Es decir, determinar a y b de manera que se cumpla la condición.

• Se promedian los valores correspondientes a cada onda de los valores de x y de y.

• Las ondas del ciclo promedio se dibujan conjuntamente con las originales para poder comparar los datos reales con los del ciclo promedio

Φ(a,b) = Σ((y(t) – at – b))²″ mínimo • Se lo utiliza para períodos de 40 meses. Se deriva parcialmente (regla de la cadena) en función de a y de b: ∂Φ/∂a = -2Σ (y(t) - a t - b)*t = 0

MICROECONOMIA CON EXCEL 53

Page 14: Estadística con Excel

Contexto cierto Contexto cierto

MICROECONOMIA CON EXCEL 56

Dos rectas de regresión: Se obtienen utilizando el método de los mínimos cuadrados: ∂Φ/∂b = -2Σ(y(t) – a t - b) = 0 ; por lo cual a= N Σt * y(t) - Σ t * Σy(t) con a= Σ t . y(t) b= Σ y(t) N Σ t2″ - (Σ t)2″ Σ t² N b= Σ t″ *Σ y(t) - Σ ty(t) *Σ t Y= a x + b primer recta de regresión NΣ t2″ - (Σ t)2″ X= a y + b segunda recta de regresión Si se tomaran valores centrados la sumatoria de t seria igual a cero.

Entonces a y b quedaría como: Las variables cambian en las ecuaciones cuando se aplica el despeje en función de una o la otra, luego de aplicar el método

a= Σ t * y (t)

de los mínimos cuadrados. Puede ser que no ambas tengan sentido, por ejemplo para alguna relación precio-cantidad demandada; pero en otros análisis ambas lo tienen.

Σ t2″ Así, Y = at + b = Σ t * y (t) * t + Σ y (t) b= Σ y (t) Σ t″ N N COEFICIENTE DE CORRELACION Al estudiar las series de frecuencias interesa especialmente conocer su media y su dispersión, las cuales son calculables mediante momentos obsoletos, con el método largo o el método corto o abreviado, centrando las series para facilitar el cálculo y trabajar solo con valores enteros y sus potencias, lo cual es especialmente útil cuando hay mas de 100 datos.

El cociente entre la variación explicada a la variación total se llama coeficiente de DETERMINACIÓN. Si la variación explicada es igual a cero, es decir, la variación total es toda no explicada, este cociente es cero. Si la variación no explicada es cero, es decir, la variación total es toda explicada, el cociente es uno. En los demás casos el cociente se encuentra entre cero y uno; r2 es siempre no negativa y se calcula como:

Covarianza La covarianza es el momento mixto centrado de primer orden. Es la sumatoria del producto de las x menos su media multiplicado las y menos su media; es decir que es el producto de los desvíos multiplicados de las dos series.

R2 = ± variación explicada = ± Σ( y est. – my)″ variación no explicada Σ (y – my)″ Su raíz cuadrada, el coeficiente de correlación R varía entre –1 y 1, con sinos + o - que se utilizan para la correlación lineal positiva y la correlación lineal negativa respectivamente. Nótese que r es una

Σ (x - mx) (y-my) = µxy

MICROECONOMIA CON EXCEL 55

Page 15: Estadística con Excel

Contexto cierto Contexto cierto

MICROECONOMIA CON EXCEL 58

cantidad sin dimensiones, es decir no depende de las unidades empleadas.

La pendiente del ajuste es el coeficiente angular de la línea de correlación precio-cantidad durante el período (1,008 en el gráfico)

Si se supone una relación lineal entre dos variables, el coeficiente de correlación es:

CORRELACION – EN UNA POBLACIÓN

r = Σ (x – mx) (y – my) EL coeficiente r de Pearson esta incorporado en Excel; indica valores entre 0 y +1 ó –1 para medir la relación entre una variable dependiente y dos (o más) variables independientes.

(Σ(x – mx)″Σ(y – my))1\2″ Ésta fórmula da el signo adecuado de r; se llama fórmula producto-momento y muestra claramente la simetría entre x e y.

Excel calcula la matriz de correlación y (si fueran varias) permite elegir los pares que presentan la correlación más alta mediante el análisis de regresión.

Un r = 0.973 cercano a 1 permitiría decir que muestra una relación funcional perfecta directa (ambas series varían en igual sentido). Los datos representan lo que se estudia y a mediada que se cumple una de las variables la otra lo hace en el mismo sentido y proporción.

Excel dispone de varias funciones alternativas para calcular la función de ajuste que minimiza los desvíos: correlación, tendencia, proyección, regresión, accesibles mediante su ayuda F1 o con el icono .

Por ejemplo, con los datos de este cuadro: ELASTICIDAD MEDIA Herramientas >Complementos > Análisis de datos >Regresión El concepto teórico de elasticidad de la demanda tiene aplicación práctica en la empresa calculado como promedio serial.

Alternativamente, para utilizar separadamente algunas de las funciones (incorporadas en ) sería suficiente consultar ese listado y luego escribirla simplemente después del signo igual:

Teóricamente se estudia este cociente puntualmente (una cantidad y un precio), pero la toma de decisiones empresarias se basa en promedios calculados durante algún lapso razonable.

"=pendiente(rango datos)", "=interseccion.eje(...)",

"=coeficiente.R2(...)" Excel aporta aquí su ayuda: la elasticidad media se calcula estadísticamente como el producto de la pendiente de la línea de ajuste multiplicada por el cociente suma de precios /suma de cantidades: E media = b ΣP/ΣQ

para obtener los coeficientes de la línea de ajuste o correlación, que incluyen el coeficiente angular -1.008 que interesa para calcular la

MICROECONOMIA CON EXCEL 57

Page 16: Estadística con Excel

Contexto cierto Contexto cierto

MICROECONOMIA CON EXCEL 60

elasticidad media: -(-1.008 (36/35,9))=+1.01 (los rangos están indicados en la imagen sobre demanda de Y)

CORRELACION - EN MUESTRAS Cuando se estudie la correlación en una muestra con estos mismas

funciones Excel es necesario comprobar su representatividad estadística mediante la prueba "t". Véanse los ejemplos posteriores.

DEMANDA COMO CORRELACION PRECIO-CANTIDAD

Ya que los mismos instrumentos pueden ser utilizables bajo distintos contextos, en el enfoque progresivo de esta exposición se intenta explicar cada herramienta relevante presentándola conforme coincida con el ejemplo y cuadro específicos según el avance conceptual.

Obsérvese en este ejemplo de la imagen que la variable independiente (precio) figura a la izquierda de la variable dependiente (cantidad) y ello corresponde al orden de las celdas del rango (B3:B10;C3:C10), así como al gráfico con cantidades en la abscisa y precios en la ordenada, usualmente aceptado. En casos de correlación sin término independiente –por el origen- pudieran presentarse imprecisiones, por la resta del término de corrección, en el cálculo de la determinación R2.

MICROECONOMIA CON EXCEL 59

Page 17: Estadística con Excel

Contexto cierto Contexto cierto

MICROECONOMIA CON EXCEL 62

EVALUACION DE EXAMENES En la Tabla Distribución F, para 3grados de libertad horizontal (numerador) y 22 grados de libertad vertical (denominador; varianza menor) al 1% de significatividad indica 4,82, sensiblemente menor que 7,01 de la muestra.

Supónganse la siguiente cantidad de aciertos en una evaluación, clasificados en función del grado de instrucción de cada consultado:

4°grado 6°grado 3°secun Secundario -dario completo

1 5 8 9 Se concluye que las diferencias educativas son relevantes en las respuestas de los encuestados y no surgen de alguna influencia ocasional entre ellos (copia, colinealidad)

3 7 6 11 4 6 9 8 5 3 5 7

1 9 7 7 4 7 4 -

- 4 4 - - 2 - - n = 6 8 7 5 ∑n= 26 T = 18 43 43 42 ∑T=146 X = 3 5.38 6.14 8.4 ∑X2/n=1462/26= ∑x2 = 68 269 287 364 =819.85 T2 /n= 54 213.13 267.14 352.80 ∑∑x2 =988 ∑T2/n =902.07 ANALISIS DE VARIANCIA Y COVARIANZA: Sumatoria de cuadrados ∑x2 - ∑X2/n (desvío – medias) = 988 – 819.85 = 168.15 Suma de cuadrados intragrupos ∑x2 - ∑T2 /n = 988 – 902.07 = 85.93 Suma de cuadrados intergrupos ∑T2 /n - ∑x2 = 902.07 – 819.85 = 82.22 Resumen: Suma Grados Variancia F Snedecor Cuadrados libertad ................ .................... Intergrupos: 82.22 3 82.22/3=27.41 27.41 Intragrupos: 85.93 22 85.93/22=3.91 3.91

Finalmente, 27.41 / 3.91 = 7.01

MICROECONOMIA CON EXCEL 61

Page 18: Estadística con Excel

Contexto cierto Contexto cierto

MICROECONOMIA CON EXCEL 64

REGRESIÓN MULTIPLE Esos coeficientes multiplican cada variable independiente (pronósticos conocidos) según la fórmula de la celda B18 (que también se indica en F17)

ESTIMACIÓN DE DEMANDA SEGÚN CORRELACION MULTIPLE

PRONOSTICOS: \

La demanda de un bien suele tener como condicionantes a los gustos, cambios en el ingreso disponible, en el precio o en los precios de otros bienes complementarios o sustitutos. Cuando ya existen pronósticos sobre esas u otras variables independientes (calor; lluvia, turistas) es usual utilizarlos para estimar la demanda del bien en estudio (variable dependiente, venta de helados) efectuando una correlación lineal múltiple entre aquellas y la demanda que se desea estimar (véase más adelante con Estimación Lineal) DISCOS DE FRENO PARA AUTOS Igualmente con la demanda de discos de freno (Y) para autos, cuya demanda podría depender de la producción (y reparación) de autos, el nivel de los salarios y el del PBI (las X).

ANÁLISIS DE VARIANZA

¿Hay suficiente correlación entre las variables? ¿Serán todas las variables independientes suficientemente explicativas o influyentes? Una vez anotados los datos históricos en B8:E16 Excel calcula la

correlación con Herramientas >Complementos > Análisis de datos >Regresión Excel calcula el estadístico F (104,5) y también su valor crítico. En

este ejemplo el estadístico es mayor que su valor crítico, lo cual asegura que el resultado 97% implica una varianza intergrupos e intragrupos parcialmente aceptable y que el ajuste no es aleatorio o manifieste coalineación

Pide el rango para la variable Y; luego el rango para las otras variables; también pide una celda conde comenzará a emitir los resultados hacia abajo. En este ejemplo se le indicó A25 y los coeficientes del ajuste figuran en B39:B42

Por otra parte, la tabla de distribución t Student para 6 grados de libertad y 95% de aproximación (5% error) muestra el coeficiente 1,94, que es menor que el valor indicado por Excel para la variable independiente X1 (3,099), asegurando que esta variable es

MICROECONOMIA CON EXCEL 63

Page 19: Estadística con Excel

Contexto cierto Contexto cierto

MICROECONOMIA CON EXCEL 66

significativa en la formación de la demanda de discos de freno de este ejemplo.

Se busca evitar posibles errores por la existencia de eventuales vinculaciones entre algunas de las variables independientes entre sí (colinealidad).

Conviene comenzar seleccionando las regresiones entre las

variables que se sabe están más vinculadas e ir introduciendo otras

que mejoren la regresión múltiple.

ANOVA (en inglés ANÁLISIS DE VARIANZA)

Existen dificultades importantes para detectar la existencia de esa relación lineal molesta entre las variables independientes. Interesa asegurar la independencia o no asociación entre los atributos: dos grupos difieren entre sí cuando la varianza intergrupos es mayor que la varianza intragrupo (si no hay colinealidad)

El coeficiente de determinación R2 indica en las regresiones simples el % de variabilidad explicada por la variable independiente.

La proporción de estas dos medidas es la F de Snedecor .

Comparando con el valor de la tabla de F por azar se observa si el F obtenido en el ANOVA es mayor, lo que indicaría que hay una diferencia entre grupos que es adecuadamente significativa.

R2 ajustado se utiliza en las regresiones múltiples. El error típico o estándar es la raíz cuadrada del cociente entre la suma de residuos al cuadros y sus grados de libertad (T-v-1).

La tabla de la distribución F valora según los grados de libertad horizontal (numerador) y los grados de libertad vertical (denominador) para distintos % de significación; esto ya lo indican los coeficientes que calcula Excel simplificando así el análisis de varianza y covarianza.

ANÁLISIS DE REGRESION Se utiliza el análisis de regresión y de varianza-covarianza para elegir con Excel cuales de las variables independientes son más adecuadas y mejorarían la precisión del ajuste entre la ecuación y los datos empíricos.

Los estadísticos T DE STUDENT calculados por Excel demuestran el TEST DE HIPOTESIS: comparando este ejemplo con la tabla de distribución Student para 95% de confianza se observa la

MICROECONOMIA CON EXCEL 65

Page 20: Estadística con Excel

Contexto cierto Contexto cierto

MICROECONOMIA CON EXCEL 68

ESTIMACION LINEAL (MULTIPLE) significatividad del coeficiente de cada variable, conforme su “t” sea mayor que el valor de tabla, tal como se explico en este ejemplo para el 3,099 de la variable X1, aunque para otras variables es

menor, indicando dificultades.

VENTA DE HELADOS Excel incluye la función "estimacion.lineal" que también permite ajustar una serie dependiente de una o varias variables independientes. Ejemplo, pronosticar la venta de helados, dependiendo de las estimaciones de temperatura, cantidad de lluvia y arribo de ómnibus con turistas para el próximo período.

MULTICOLINEALIDAD En resumen, hemos visto varios indicadores para determinar la existencia de una alto grado perturbador de correlación entre las variables independientes. En los textos es usual la referencia a:

Se trata de encolumnar los datos históricos sobre ventas de helados y a su derecha las tres variables independientes. Luego pintar en otro lugar cuatro celdas para imprimir cada coeficiente más la constante y escribir "estimacion.lineal(rango helados; rango variables independientes)" y Ctrl+Shift+Enter.

- El método de la relación entre t y R2 , que consiste en observar las razones t y si no fueran significativas -y además el R2 es alto (mayor a 0,8)- indicarían multicolinealidad molesta. Con los cuatro coeficientes se controla o compara la aproximación

del ajuste, armando la ecuación con F4 para los coeficientes y copiándola incluso hasta el rango de pronóstico F2:F14. En la ayuda F1 incluye Excel las características de este ajuste en detalle, parecidas a la regresión múltiple anterior.

- El método de la prueba F: haciendo regresiones de cada variable con las demás y observando si la relación entre F y R2 es mayor que en la tabla indicaría multicolinealidad. - El método de la matriz de correlación, formada por los coeficientes de cada variable respecto a las demás. El valor de su determinante es entre 0 y 1; cuando se acerca 1 indica poca multicolinealidad.

- El método de los valores propios e índice de condición, que también implica fórmulas que no son necesarias en este resumen práctico, luego de la claridad y facilidad de los ejemplos aquí expuestos.

MICROECONOMIA CON EXCEL 67

Page 21: Estadística con Excel

Contexto cierto

MICROECONOMIA CON EXCEL 69