Introducción a la Estadística Económica

download Introducción a la Estadística Económica

of 173

Transcript of Introducción a la Estadística Económica

  • 8/7/2019 Introduccin a la Estadstica Econmica

    1/173

    Introduccin a la Estadstica Econmica

    Rigoberto Prez, Covadonga Caso, Mara Jess Ro y Ana Jess Lpez

    [email protected],[email protected],[email protected],[email protected],

    Dpto. de Economa Aplicada, Campus del Cristo. Universidad de Oviedo

    https://sites.google.com/a/uniovi.es/libros/iee

    Abril 2012

    https://sites.google.com/a/uniovi.es/libros/ieehttps://sites.google.com/a/uniovi.es/libros/iee
  • 8/7/2019 Introduccin a la Estadstica Econmica

    2/173

    A nuestras familias

    ISBN13 978-84-693-9868-5Depsito Legal: AS-6241-2010Edicin 2010Revisin V.1.0.2

    El contenido de este libro est sujeto a la licencia Reconocimiento-Nocomercial-Sin obras derivadas 3.0 de Creative Commons.

    2

  • 8/7/2019 Introduccin a la Estadstica Econmica

    3/173

    Breve resea de autores

    Los autores de libro son profesores del Departamento de Economa Aplicada de laUniversidad de Oviedo (Unidad de Estadstica y Econometra).

    Rigoberto Prez Surez es Catedrtico de Universidad y suamplia experiencia docente incluye asignaturas de EstadsticaEconometra y Series temporales tanto en primer y segundo ci-clo como en doctorados y msteres. Es autor de varios libros detexto (Nociones Bsicas de Estadstica, Anlisis de datos econ-micos I: Mtodos descriptivos, Anlisis de datos econmicos II:Mtodos inferenciales) y del software docente ADE+, as comode numerosas publicaciones relativas a la innovacin educativa yel e-learning.Tambin ha sido Director de Area de Innovacin de la Universi-

    dad de Oviedo (2000-2006) y Director del Campus Virtual Com-partido del grupo G9 (2004-2006).En el mbito investigador es autor de diversas publicaciones enrevistas de impacto y ha dirigido numerosas tesis doctorales yproyectos de investigacin, generalmente referidos a la predic-cin econmica y al anlisis de la desigualdad.

    Covadonga Caso Pardo es Profesora Titular de Universidady su docencia est centrada en asignaturas de Estadstica delicenciaturas y grados, y en cursos de postgrado de AnlisisMultivariante. Es una de las autoras del manual Anlisis de

    datos econmicos I: Mtodos descriptivos.

    Mara Jess Ro Fernndez es Profesora Titular de EscuelaUniversitaria y su experiencia docente incluye diversas asig-naturas de Estadstica en primer y segundo ciclo. Es autoradel manual Anlisis de datos econmicos I: Mtodos descriptivos.

    Ana Jess Lpez Menndez es Profesora Titular de Univer-sidad y su docencia abarca asignaturas de Estadstica, Econo-metra y Series temporales. Es autora de los manuales Anlisisde datos econmicos I: Mtodos descriptivos y Anlisis de da-

    tos econmicos II: Mtodos inferenciales, as como de numerosaspublicaciones relativas a la innovacin educativa y el e-learning.En el mbito investigador es autora de diversos artculos publi-cados en revistas de impacto, ha dirigido seis tesis doctorales yha participado en numerosos proyectos de investigacin.

    3

  • 8/7/2019 Introduccin a la Estadstica Econmica

    4/173

    ndice general

    1. Organizacin y presentacin de los datos. Fuentes estadsticas 91.1. Origen de la informacin: censos y muestras . . . . . . . . . . . . . . . 91.2. Tipos de informacin estadstica . . . . . . . . . . . . . . . . . . . . . 111.3. Presentacin de datos . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

    1.3.1. Tabulacin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121.3.2. Representaciones grficas . . . . . . . . . . . . . . . . . . . . . 16

    1.4. Organismos y fuentes estadsticas de informacin econmica . . . . . . 211.4.1. Organizacin estadstica oficial . . . . . . . . . . . . . . . . . . 211.4.2. Algunas estadsticas econmicas . . . . . . . . . . . . . . . . . . 24

    2. Medidas de posicin 302.1. Medidas de posicin central: promedios . . . . . . . . . . . . . . . . . . 31

    2.1.1. La media aritmtica . . . . . . . . . . . . . . . . . . . . . . . . 312.1.2. La media ponderada . . . . . . . . . . . . . . . . . . . . . . . . 332.1.3. La mediana . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 342.1.4. La moda . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 372.1.5. Otros promedios: media geomtrica y media armnica . . . . . 392.1.6. Ventajas e inconvenientes de los promedios . . . . . . . . . . . 41

    2.2. Medidas de posicin no central: cuantiles . . . . . . . . . . . . . . . . . 42

    3. Medidas de dispersin y forma 443.1. Medidas de dispersin absolutas . . . . . . . . . . . . . . . . . . . . . . 44

    3.1.1. Varianza y desviacin tpica . . . . . . . . . . . . . . . . . . . . 463.2. Medidas de dispersin relativas . . . . . . . . . . . . . . . . . . . . . . 49

    3.2.1. Coeficientes de variacin basados en desviaciones cuadrticas . 503.2.2. Coeficientes de variacin basados en desviaciones absolutas . . 513.2.3. Representatividad de los promedios . . . . . . . . . . . . . . . . 52

    3.3. Variable tipificada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 523.4. Medidas de forma . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54

    4. Desigualdad y pobreza 584.1. La desigualdad econmica . . . . . . . . . . . . . . . . . . . . . . . . . 584.2. La curva de Lorenz y el ndice de Gini . . . . . . . . . . . . . . . . . . 60

    4.2.1. La curva de Lorenz . . . . . . . . . . . . . . . . . . . . . . . . . 604.2.2. El ndice de Gini . . . . . . . . . . . . . . . . . . . . . . . . . . 62

    4.3. Medidas descomponibles . . . . . . . . . . . . . . . . . . . . . . . . . . 684.4. La pobreza y su medicin . . . . . . . . . . . . . . . . . . . . . . . . . 69

    4

  • 8/7/2019 Introduccin a la Estadstica Econmica

    5/173

    ndice general

    5. Anlisis conjunto. Asociacin y correlacin 725.1. Distribuciones bidimensionales . . . . . . . . . . . . . . . . . . . . . . 725.2. Distribuciones marginales y condicionadas . . . . . . . . . . . . . . . . 745.3. Dependencia e independencia estadstica . . . . . . . . . . . . . . . . . 78

    5.4. Medidas de asociacin . . . . . . . . . . . . . . . . . . . . . . . . . . . 815.5. La correlacin y su medida . . . . . . . . . . . . . . . . . . . . . . . . 83

    6. Regresin lineal simple 906.1. Correlacin y regresin . . . . . . . . . . . . . . . . . . . . . . . . . . . 906.2. Rectas de regresin mnimo cuadrticas . . . . . . . . . . . . . . . . . 916.3. Anlisis de la bondad de modelos . . . . . . . . . . . . . . . . . . . . . 976.4. Prediccin con modelos causales . . . . . . . . . . . . . . . . . . . . . . 102

    7. Regresin lineal mltiple 1057.1. Planteamiento de la regresin mltiple . . . . . . . . . . . . . . . . . . 1057.2. Plano de regresin mnimo cuadrtico . . . . . . . . . . . . . . . . . . 1077.3. Anlisis de la bondad de modelos mltiples . . . . . . . . . . . . . . . 109

    8. Nmeros ndices y tasas 1128.1. ndices simples y tasas . . . . . . . . . . . . . . . . . . . . . . . . . . . 1128.2. ndices sintticos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1168.3. Propiedades de los ndices . . . . . . . . . . . . . . . . . . . . . . . . . 118

    9. Nmeros ndices: Frmulas habituales, variacin y repercusin 1229.1. Frmulas habituales de precios y cantidades . . . . . . . . . . . . . . . 1229.2. ndices de valor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1289.3. Deflactacin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 129

    9.4. ndices encadenados . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1309.5. Variacin de un ndice y repercusin . . . . . . . . . . . . . . . . . . . 131

    10.El ndice de Precios de Consumo y sus aplicaciones 13410.1. El ndice de Precios de Consumo (IPC) . . . . . . . . . . . . . . . . . 13410.2. El IPC armonizado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13910.3. Aplicaciones econmicas del IPC . . . . . . . . . . . . . . . . . . . . . 140

    11.Series temporales: planteamiento y tendencia 14211.1. Evolucin temporal de magnitudes . . . . . . . . . . . . . . . . . . . . 14211.2. Componentes de una serie temporal . . . . . . . . . . . . . . . . . . . . 145

    11.3. Anlisis de la tendencia . . . . . . . . . . . . . . . . . . . . . . . . . . 15211.3.1. Mtodo de las medias mviles . . . . . . . . . . . . . . . . . . . 15311.3.2. Alisado exponencial . . . . . . . . . . . . . . . . . . . . . . . . 15511.3.3. Mtodo de a juste lineal . . . . . . . . . . . . . . . . . . . . . . 156

    12.Series temporales: estacionalidad y prediccin 15812.1. Anlisis de la estacionalidad . . . . . . . . . . . . . . . . . . . . . . . . 158

    5

  • 8/7/2019 Introduccin a la Estadstica Econmica

    6/173

    ndice general

    12.2. Desestacionalizacin . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16312.3. Prediccin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 164

    Bibliografa 170

    ndice alfabtico 171

    6

  • 8/7/2019 Introduccin a la Estadstica Econmica

    7/173

    ndice general

    Presentacin

    La elaboracin de un manual universitario es una experiencia de gran inters eintensidad que conlleva un proceso previo de reflexin sobre el papel de la asignatura,

    sus contenidos y la metodologa docente.En nuestro caso esta experiencia fue abordada hace ya casi veinte aos por unconjunto de profesores ante la puesta en marcha en la Universidad de Oviedo delas licenciaturas en Economa y Administracin y Direccin de Empresa. En aquellaocasin, afirmbamos que nuestro manual Anlisis de datos econmicos pretendaaproximar nuestros programas a las necesidades reales de nuestros alumnos, tratandode compatibilizar la exposicin amena e intuitiva de problemas con un tratamientoserio de los contenidos. Con este objetivo, el texto inclua varias novedades comola utilizacin de tres niveles diferenciados de lectura, la incorporacin de numerosasilustraciones y un disquette con ejemplos resueltos con hoja de clculo.

    Transcurrido el tiempo y agotadas varias ediciones de aquel manual, en la actualidad

    nos situamos en un nuevo contexto, caracterizado por la puesta en marcha de losnuevos grados universitarios adaptados al Espacio Europeo de Educacin Superior, enlos que se contempla un papel ms activo del estudiante, tal y como refleja la definicindel crdito europeo ECTS, que computa el nmero de horas de trabajo requeridaspara la adquisicin por los estudiantes de los conocimientos, capacidades y destrezascorrespondientes, por lo que en su asignacin debern estar comprendidas las horascorrespondientes a las clases lectivas, tericas o prcticas, las horas de estudio, lasdedicadas a la realizacin de seminarios, trabajos, prcticas o proyectos, y las exigidaspara la preparacin y realizacin de los exmenes y pruebas de evaluacin.

    Por otra parte, la constante evolucin de las Tecnologas de la Informacin y laComunicacin (TIC) abre nuevas posibilidades para la generacin y transmisin del

    Conocimiento. De ah, que en este libro, por una parte, hayamos cambiado el formatoimpreso por el digital y por otra, nos hayamos centrado en los contenidos docentes, quesern complementados con materiales online, tanto de acceso libre (en la web del libro)como restringidos a los estudiantes de nuestras asignaturas (accesibles en el campusvirtual de la Universidad de Oviedo, http://www.campusvirtual.uniovi.es)

    Con este planteamiento, presentamos Introduccin a la Estadstica Econmica,texto que se adapta a la asignatura del mismo nombre incluida en el primer cursode los grados de Economa, Administracin y Direccin de Empresas, Contabilidad yFinanzas y Relaciones Laborales y Recursos Humanos de la Universidad de Oviedo.A lo largo de doce temas presentamos de forma sencilla pero con rigor los conceptosy resultados relativos a los principales mtodos estadsticos descriptivos.

    En los temas iniciales se analiza el origen, organizacin y resumen de la informacin,presentando las principales fuentes de informacin econmica y su representacin me-diante tablas y grficos (tema 1), as como las principales medidas de posicin (tema2), dispersin y forma (tema 3) y desigualdad y pobreza (tema 4).

    A continuacin se aborda el anlisis conjunto de variables, estudiando las principalesmedidas de correlacin y asociacin (tema 5) y las tcnicas de regresin lineal tantosimple (tema 6) como mltiple (tema 7).

    7

    http://www.campusvirtual.uniovi.es/http://www.campusvirtual.uniovi.es/
  • 8/7/2019 Introduccin a la Estadstica Econmica

    8/173

    ndice general

    Los contenidos ms especficos de estadstica econmica incluyen los nmeros ndicesy tasas (tema 8), los principales ndices econmicos de precios, cantidades y valor (tema9) y el Indice de Precios de Consumo (IPC) con sus principales aplicaciones (tema10).

    Por ltimo, los temas finales estudian la evolucin temporal de las magnitudeseconmicas. El tema 11 describe las series temporales y los mtodos de aproximacinde su tendencia, mientras el tema 12 analiza la estacionalidad y la elaboracin depredicciones a partir de modelos temporales.

    Como ya hemos anticipado, este libro se publica en formato PDF y est disponibleen la Red para que cualquier persona pueda descargarlo de forma libre y gratuita. Laltima versin de este libro y material complementario se encuentra en:

    https://sites.google.com/a/uniovi.es/libros/iee

    Confiamos en que este material pueda resultar de utilidad y agradecemos de ante-

    mano vuestros comentarios y sugerencias.

    8

    https://sites.google.com/a/uniovi.es/libros/%20ieehttps://sites.google.com/a/uniovi.es/libros/%20iee
  • 8/7/2019 Introduccin a la Estadstica Econmica

    9/173

    1 Organizacin y presentacin de losdatos. Fuentes estadsticas

    El anlisis estadstico de cualquier problema econmico requiere en una primeraetapa determinar los objetivos y el colectivo informante. A modo de ilustracin, su-pongamos que se desea hacer un estudio estadstico sobre el sector sanitario en Espaa.Quin suministrar la informacin que necesitamos? Los hospitales o centros de sa-lud, el personal sanitario o la poblacin espaola en general. Las conclusiones quese obtengan, a qu colectivo afectarn? La informacin necesaria para alcanzar losobjetivos del estudio posiblemente se transmitir por un cuestionario o acudiremosa bases de datos ya elaboradas por algn organismo, pero la recogeremos de formacualitativa o cuantitativa? Una vez recabada la informacin y como fase previa a laaplicacin de las tcnicas estadsticas pertinentes se proceder a la organizacin de losdatos y se presentarn una serie de tablas y grficos con un resumen de la informacindisponible.

    A lo largo de este tema se introducirn los conceptos bsicos vinculados a estafase inicial de un estudio estadstico. Asimismo se ofrecer una panormica de losprincipales organismos y fuentes que proporcionan informacin estadstica.

    1.1. Origen de la informacin: censos y muestras

    Definicin 1.1. Se denomina poblacin o universo al conjunto de personas o cosas alas que va referida una investigacin estadstica.

    Desde el punto de vista estadstico, el trmino poblacin puede aludir tanto a per-sonas como a hogares, hospitales o empresas. Cada una de las personas o cosas queintegran la poblacin recibe el nombre de elemento y el nmero total de elementosque la integran se denomina tamao poblacional.

    La recogida de informacin se realiza, generalmente, por medio de cuestionarios,siendo el entrevistado o informador una especie de socio annimo de todo el procesoestadstico. En su sentido ms amplio, entendemos por encuesta el procedimientoglobal que se sigue para la recogida de informacin. Su extensin, es decir, el conjunto

    de elementos de la poblacin a los que se solicita informacin unidades informantesda lugar a dos tipos de encuestas: censales y muestrales.

    Definicin 1.2. Una encuesta censal o censo es aqulla que se realiza a todos loscomponentes de la poblacin.

    Los distintos pases llevan a cabo peridicamente recuentos exhaustivos de sus habi-tantes, viviendas, explotaciones agrarias, ..., conocidos como Censos de Poblacin, de

    9

  • 8/7/2019 Introduccin a la Estadstica Econmica

    10/173

    1 Organizacin y presentacin de los datos. Fuentes estadsticas

    Viviendas, Agrario, ... . Histricamente, los recuentos de poblacin son el primer tipode estadstica del que se tiene noticia. Los gobiernos de las civilizaciones antiguas yarealizaban este tipo de recuentos con el fin de recaudar tributos y de reclutar hombresaptos para la guerra.

    El anlisis exhaustivo de poblaciones no es la forma ms habitual de desarrollarencuestas. A pesar de que los avances informticos permiten procesar volmenes deinformacin que hace unos aos resultaban impensables, hay dos razones fundamen-tales para ello:

    1. La necesidad de limitar recursos -motivada por los elevados costes de los censos-

    2. La rapidez en la obtencin de resultados.

    Estos argumentos conducen a plantear estudios parciales, llevando a cabo posterior-mente una generalizacin de los resultados obtenidos. En este contexto surgen losconceptos de subpoblacin y muestra.

    El hecho de trabajar con encuestas censales no garantiza la ausencia de errores en losresultados, pues siempre pueden aparecer errores vinculados al proceso de observacin:preguntas confusas, errores de memoria por parte del entrevistado, negativas a respon-der, etc.

    Definicin 1.3. Una subpoblacin es una parte de la poblacin integrada por unconjunto de elementos que presentan alguna caracterstica comn.

    Los centros sanitarios de titularidad pblica o los hospitales ubicados en la Comuni-dad de Madrid son ejemplos de subpoblaciones en un estudio sobre el sector sanitarioen Espaa. Pueden generalizarse a toda la poblacin los resultados obtenidos a partirde la informacin proporcionada por los elementos de una subpoblacin? En principio

    la respuesta es negativa pues slo hay garantas de que representen a la subpoblacinen cuestin y no a todo el colectivo. La alternativa ser considerar estudios basadosen muestras.

    Definicin 1.4. Una muestra es una parte de la poblacin cuyos elementos se eligende modo que sean representativos de todo el colectivo. Las encuestas basadas enmuestras se denominan encuestas muestrales.

    El concepto de muestra abre algunos interrogantes importantes: qu significa re-presentativa?, cmo garantizar que una muestra sea representativa? Una muestraser representativa cuando constituya una rplica a escala de la poblacin. Cmopodramos definir nosotros la rplica? Una muestra de hospitales debera tener el mis-

    mo porcentaje que la poblacin de centros pblicos y privados, el mismo porcentajepor provincias, por nmero de empleados, por gastos, ... . En realidad, sern muchaslas caractersticas a tener en cuenta para que la muestra pueda ser calificada comouna rplica de la poblacin. La estadstica proporciona mtodos para la seleccin demuestras, en su mayor parte basados en la eleccin de sus elementos al azar, lo cualgarantizar la imparcialidad en el proceso de seleccin.

    10

  • 8/7/2019 Introduccin a la Estadstica Econmica

    11/173

    1 Organizacin y presentacin de los datos. Fuentes estadsticas

    Las encuestas muestrales presentan ciertas ventajas frente a las censales. Por una parte,hay que notar el ahorro considerable tanto monetario como de tiempo que puede supo-ner el tener que entrevistar slo a unos pocos individuos de una poblacin numerosa.Pero adems, el hecho mismo de poder trabajar con muestras de tamao relativamentepequeo permite, a su vez, afinar en la calidad de los datos y, en consecuencia, con-

    trolar la fiabilidad de los resultados. Obviamente, no todo son ventajas, pues el hechode trabajar con informacin parcial, proporcionada por una pequea parte de la po-blacin, puede generar errores en los resultados, cuya magnitud estar estrechamenterelacionada con la representatividad de la muestra.

    Ambos tipos de encuesta -censal y muestral- deben convivir en una especie de sim-biosis, complementndose mutuamente. En algunos casos es conveniente la utilizacinde muestras, en otros resulta imprescindible, y en cualquiera de ellos el censo corres-pondiente proporciona el marco de referencia.

    1.2. Tipos de informacin estadstica

    Uno de los aspectos importantes en el diseo de una encuesta es la elaboracinde un cuestionario, mediante el cual se recoger la informacin necesaria sobre losrasgos o caracteres de inters para el estudio, que pueden ser tanto cuantitativoscomo cualitativos.

    Definicin 1.5. Los caracteres cuantitativos, expresados mediante nmeros, recibenel nombre de variables y se representan habitualmente mediante maysculas X, Y, ...Los resultados de la observacin de una variable se denominan valores y se designanpor las correspondientes letras minsculas x1, x2, . . . ; y1, y2, . . . Dependiendo de losvalores que puedan presentar se distinguen a su vez dos tipos de variables:

    Discretas: Variables que slo pueden tomar cierto nmero de valores aislados o,de forma equivalente, si el nmero de valores diferentes que pueden asumir esfinito o infinito numerable.

    Continuas: Variables que pueden tomar cualquiera de los infinitos valores deuno o varios intervalos de la recta real.

    El nmero de asignaturas matriculadas en un grado o el nmero de empleados de unaempresa son ejemplos de variables discretas que pueden tomar valores 1,2,3, ... Laaltura de los estudiantes, el tiempo diario de estudio o el coste de las materias primasen una industria son ejemplos de variables continuas.

    Cuando observamos en concreto el valor de una variable continua anotaremos una seriede valores aislados; por ejemplo, la altura ser 155, 165 o 180 cm, es decir, su cuantifi-cacin tendr una precisin limitada, determinada por la unidad de medida que puedacaptar el observador segn el instrumento utilizado. Con ello queremos expresar que,desde un punto de vista emprico, las variables presentan un comportamiento discre-to, para sealar tambin inmediatamente que la distincin entre variables continuas ydiscretas es muy importante desde la perspectiva terica, esto es, el concepto de con-tinuidad garantiza el paso al lmite y como consecuencia permite aplicar una potente

    11

  • 8/7/2019 Introduccin a la Estadstica Econmica

    12/173

    1 Organizacin y presentacin de los datos. Fuentes estadsticas

    metodologa matemtica -el clculo diferencial e integral -. Por tanto, es convenientedistinguir el carcter continuo o discreto de una variable porque condicionar el modeloterico a aplicar para su estudio y para ello atenderemos a su naturaleza y no a losresultados de su observacin emprica.

    Definicin 1.6. Los caracteres cualitativos, expresados mediante palabras, recibenel nombre de atributos. Los resultados de la observacin de un atributo se denominanmodalidades o categoras.

    Ejemplos de atributos son los estudios de grado realizados (con categoras economa,derecho, medicina, ...), el sexo, el estado civil, la nacionalidad, ...; el sector de actividad,el municipio de ubicacin de una empresa, ...

    Definicin 1.7. En general, denominamos serie estadstica, o sencillamente estadsti-ca, a la informacin o coleccin de datos disponible. Estas series pueden ser clasificadasen diferentes categoras que pasamos a examinar a continuacin.

    Segn el nmero de caracteres estudiados, se distingue entre:

    Estadsticas univariantes: son aqullas que se obtienen cuando se estudiaun nico carcter.

    Estadsticas multivariantes: analizan de forma conjunta varios caracteres,opcin que resulta adecuada cuando puede existir alguna relacin en sucomportamiento.

    Segn la ptica del estudio se distingue entre:

    Estadsticas temporales o de corte longitudinal, cuando se toma el tiempocomo referencia y se analiza la evolucin temporal de una o varias variables.

    Estadsticas de corte transversal, que aparecen cuando se abandona la p-tica temporal y el estudio se efecta sobre distintos individuos o unidadesespaciales en un momento del tiempo concreto.

    Datos de panel, que se corresponden con situaciones en las que se disponede datos que combinan ambas perspectivas, longitudinal y transversal.

    1.3. Presentacin de datos

    1.3.1. Tabulacin

    Una vez recogida la informacin, debemos preocuparnos de su presentacin, procu-rando que sta sea til y manejable a efectos de su anlisis estadstico. El proceso deordenacin y agrupacin de los datos se denomina tabulacin, y su resultado ser unatabla estadstica.

    En este tema se presentarn las tablas correspondientes a estadsticas univariantes,posponiendo a los temas especficos la presentacin de las tablas para estadsticasmultivariantes.

    12

  • 8/7/2019 Introduccin a la Estadstica Econmica

    13/173

    1 Organizacin y presentacin de los datos. Fuentes estadsticas

    Tablas estadsticas univariantes (datos no agrupados)

    Sea Xuna variable que puede tomar k valores diferentes designados por x1, x2, . . . , xk,que se asumen ordenados en sentido creciente y para la que se dispone de un total deN observaciones.

    Definicin 1.8. Se definen los siguientes tipos de frecuencias asociados a cada valorxi (i = 1, . . . , k) de una variable X:

    1. Frecuencia absoluta ni: nmero de observaciones en las que se presenta el valorxi.

    2. Frecuencia relativafi: proporcin de observaciones en las que se presenta el valorxi; se obtiene como cociente entre su frecuencia absoluta y el nmero total dedatos fi =

    niN. Se expresa habitualmente en trminos porcentuales (fi 100).

    3. Frecuencia absoluta acumulada Ni: nmero de observaciones menores o iguales

    que xi; se obtiene como Ni = n1 + + ni =ij=1

    nj .

    4. Frecuencia relativa acumulada Fi: proporcin de observaciones menores o igualesque xi; se obtiene como cociente entre su frecuencia absoluta acumulada y el n-mero total de datos Fi =

    NiN . Se expresa habitualmente en trminos porcentuales

    (Fi 100).

    El conjunto de los diferentes valores asumidos por una variable junto con cualquierade las frecuencias correspondientes se denomina distribucin de frecuencias y, genri-camente, se representa por (xi, ni) o (xi, fi). Suele representarse mediante tablas deltipo siguiente:

    xi nix1 n1x2 n2...

    ...xk nk

    xi fix1 f1x2 f2...

    ...xk fk

    Las definiciones anteriores, a excepcin de las frecuencias acumuladas, son aplicablestambin para el caso de caracteres cualitativos.

    Propiedad 1.1. Propiedades de las frecuencias

    a) 0 ni N;

    ki=1 ni = N

    b) 0 fi 1;ki=1

    fi = 1

    c) 0 Ni N; Nk = N.

    Frmula de recurrencia: N1 = n1, Ni = Ni1 + ni, i = 2, . . . , k

    13

  • 8/7/2019 Introduccin a la Estadstica Econmica

    14/173

    1 Organizacin y presentacin de los datos. Fuentes estadsticas

    d) 0 Fi 1; Fk = 1; Fi =ij=1

    fj

    Demostracin. La mayor parte de las propiedades son consecuencia inmediata de lapropia definicin de las frecuencias. Nos centraremos en la demostracin de las pro-

    piedades b) y d).b) Dado que por la propiedad a) se tiene que 0 ni N y teniendo en cuenta

    que fi =niN, se deduce que 0 fi 1. Por otra parte, para demostrar que la suma

    de las frecuencias relativas es siempre la unidad (o 100 si se expresan en trminosporcentuales), basta considerar la definicin de frecuencia relativa y sacar factor comnel denominador N en el operador suma:

    ki=1

    fi =ki=1

    niN

    =

    ki=1

    ni

    N=

    N

    N= 1

    d) La primera parte es consecuencia inmediata a partir de la propiedad c). Porotra parte, las frecuencias relativas acumuladas pueden obtenerse mediante sumasacumuladas de frecuencias relativas, ya que:

    Fi =NiN

    =

    ij=1

    nj

    N=

    ij=1

    njN

    =ij=1

    fj

    Tablas estadsticas univariantes (datos agrupados en intervalos)

    En los estudios empricos se dispone habitualmente de un nmero de observacioneselevado, para las que las variables estudiadas pueden presentar muchos valores diferen-tes. En otras ocasiones, a lo anterior debe aadirse que la variable puede ser clasificadacomo continua. Estas dos razones, conjuntamente o por separado, dan lugar a que lastablas estadsticas que manejamos puedan ser de gran tamao y, por consiguiente,poco manejables. En estos casos es habitual clasificar los datos en intervalos o clases.

    Supongamos que los valores de la variable X estn agrupados en k intervalos quedenotamos por Li1 Li, donde Li1 es el extremo inferior de cada intervalo y Liel extremo superior (i = 1, . . . , k). La frecuencia absoluta ni, asociada al intervaloi-simo (i = 1, . . . , k), se obtendr como suma de las frecuencias correspondientes alos valores pertenecientes a dicho intervalo. Se obtienen as tablas de datos agrupados

    en intervalos del tipo siguiente:Li1 Li niL0 L1 n1L1 L2 n2

    ......

    Lk1 Lk nk

    14

  • 8/7/2019 Introduccin a la Estadstica Econmica

    15/173

    1 Organizacin y presentacin de los datos. Fuentes estadsticas

    La amplitud de un intervalo se denota por ai y viene dada por la diferencia entrelos valores extremos de dicho intervalo: ai = Li Li1.

    La marca de clase xi es un valor que representa al intervalo. Puesto que en lastablas agrupadas se desconocen los valores que se presentan en cada intervalo, suele

    asumirse que los valores se reparten de modo uniforme dentro del mismo y, por lotanto, quedarn bien representados por el valor situado en el centro, lo que conducea tomar como marca de clase el punto medio del intervalo: xi =

    Li1+Li2 .

    El agrupamiento de datos presenta algunos puntos de discusin acerca de los queno hay criterios unnimes; entre ellos destacaremos los referentes a:

    Nmero de intervalos.- La determinacin del nmero de intervalos suele efec-tuarse intentando buscar un equilibrio entre la prdida de informacin que sederiva de la agrupacin y la operatividad. As, la consideracin de muchos in-tervalos presenta la ventaja de respetar la informacin inicial, pero en cambiono simplifica el estudio. Por el contrario, si se opta por agrupar los datos en po-cos intervalos la ventaja sera la sntesis y operatividad conseguida pero llevaraasociado el inconveniente de una prdida excesiva de informacin.

    Amplitud de los intervalos.- La amplitud puede ser constante para todos losintervalos, lo cual simplifica el tratamiento de los datos, o bien variable segn elrecorrido, opcin que permite una mejor adecuacin a las caractersticas de lavariable en estudio.

    Extremos que se incluyen en cada intervalo.- Habitualmente se consideran inter-valos contiguos y pueden presentarse observaciones coincidentes con los extremosde los intervalos, por lo que es necesario establecer si los intervalos incluyen elextremo inferior o el superior, es decir, si son semiabiertos del tipo [Li1, Li)

    o (Li1, Li]. Por otra parte, los intervalos extremos pueden ser no acotados deltipo Menos de 150 cm o Ms de 2 metros.

    Tablas temporales

    Sea Y una variable que se observa a lo largo de distintos periodos de tiempo t (aos,meses, etc.), siendo Yt el valor observado en el periodo t. La descripcin numrica deuna variable de este tipo puede realizarse a travs de una tabla con dos columnas, unapara el tiempo (t) y otra para las observaciones (Yt). A continuacin se muestra unatabla temporal con datos (en tantos por mil) de la tasa de natalidad en Espaa en elperiodo 2000-2009:

    15

  • 8/7/2019 Introduccin a la Estadstica Econmica

    16/173

    1 Organizacin y presentacin de los datos. Fuentes estadsticas

    t Yt2000 9,852001 9,952002 10,11

    2003 10,492004 10,612005 10,712006 10,922007 10,942008 11,372009 10,73

    1.3.2. Representaciones grficas

    En un sentido amplio, entendemos por representacin grficade una serie estadsticacualquier tipo de dibujo que nos permita detectar a primera vista algunas de sus ca-ractersticas ms notables, esto es, que nos ofrezca una visin general del fenmeno enestudio. La representacin grfica es un instrumento que ayuda a resumir o desglosarla informacin que se encuentra contenida en la tabla estadstica y al mismo tiempopuede descubrir una parte de esa informacin que est oculta en la representacinnumrica.

    Aqu estudiaremos algunos de los grficos usuales para estadsticas univariantes, quesern complementados en temas posteriores con las representaciones grficas asociadasa estadsticas multivariantes.

    Grficos para informacin cualitativa

    Diagrama de sectores. El esquema bsico de esta representacin consiste en divi-dir un crculo en tantos sectores como modalidades tenga el atributo, de maneraque el rea de cada sector sea proporcional a la frecuencia de la modalidad querepresenta. El diagrama de sectores de la figura 1.1 refleja la distribucin porsectores de actividad de la poblacin ocupada en una regin.

    Diagrama de rectngulos. Sobre un par de ejes cartesianos se trazan tantos rec-tngulos como modalidades tenga el atributo, todos con idntica base, situadaen el eje de abscisas, y con altura proporcional a la frecuencia de la modalidadcorrespondiente. [Figura 1.2]

    Grficos para informacin cuantitativa

    Diagrama de barras. Es la representacin grfica de la distribucin de frecuen-cias (absolutas o relativas) de una tabla de datos no agrupados. En un planode coordenadas, se representan en el eje de abscisas los distintos valores de la

    16

  • 8/7/2019 Introduccin a la Estadstica Econmica

    17/173

    1 Organizacin y presentacin de los datos. Fuentes estadsticas

    Figura 1.1: Diagrama de sectores. Poblacin ocupada

    Figura 1.2: Diagrama de rectngulos. Poblacin ocupada

    variable y en el eje de ordenadas las frecuencias correspondientes, obtenindoselos puntos (xi, ni) o (xi, fi); para realzar la representacin se traza el segmentovertical que une cada punto con su abscisa. De esta manera el dibujo consisteen una serie de barras verticales cuya altura refleja la importancia del valor alque estn asociadas. [Figura 1.3]

    Diagrama en escalera. Es la representacin grfica de la distribucin de frecuen-cias acumuladas (absolutas o relativas) de una tabla de datos no agrupados.En un plano de coordenadas se asigna a cada observacin xi una altura iguala su frecuencia acumulada Ni, punto que se une mediante un trazo horizontala la ordenada del valor siguiente. El grfico se completa asignando el valor 0hasta llegar al primer valor de la variable (x1) y el valor N (o 1 en el caso de

    17

  • 8/7/2019 Introduccin a la Estadstica Econmica

    18/173

    1 Organizacin y presentacin de los datos. Fuentes estadsticas

    Figura 1.3: Grfico de barras

    frecuencias relativas acumuladas) a partir del ltimo valor (xk). Se obtiene asla representacin grfica de una funcin que asigna a cada nmero real su fre-cuencia acumulada, con discontinuidades en cada uno de los k valores diferentesobservados de la variable xi, siendo la altura de cada salto coincidente con sufrecuencia absoluta ni (o relativa fi). [Figura 1.4]

    Figura 1.4: Diagrama en escalera

    Histograma. Es la representacin grfica de la distribucin de frecuencias ab-solutas (o relativas) para tablas de datos agrupados en intervalos. Se obtieneconstruyendo sobre cada intervalo Li1Li, representado en el eje de abscisas,un rectngulo cuya base es igual a la amplitud del intervalo ai y cuya altura hi

    18

  • 8/7/2019 Introduccin a la Estadstica Econmica

    19/173

    1 Organizacin y presentacin de los datos. Fuentes estadsticas

    se determina de forma que el rea del rectngulo sea proporcional a su frecuen-cia ni, para lo cual bastar calcular la altura mediante la expresin: hi =

    niai

    (o

    hi =fiai

    en el caso de frecuencias relativas). [Figura 1.5]

    Figura 1.5: Histograma

    Dado que el rea de cada rectngulo coincide con la frecuencia de un intervalo,el rea total del grfico se identificar con el nmero total de datos N (o ser1 si se representan las frecuencias relativas). As, la forma del histograma nosindicar cmo se distribuyen las observaciones a lo largo de todo el recorrido dela variable:

    Figura 1.6: Curva normal

    Un histograma con forma de campana reflejar una situacin en la que lamayor parte de los datos se concentran en la parte central, con un peso

    19

  • 8/7/2019 Introduccin a la Estadstica Econmica

    20/173

    1 Organizacin y presentacin de los datos. Fuentes estadsticas

    relativo muy pequeo de los datos en los extremos y repartidos adems deforma simtrica a ambos lados. Un grfico de este tipo se identifica con laconocida distribucin normal o de Gauss, que juega un papel central en losdesarrollos de la Inferencia Estadstica. [Figura 1.6]

    Un histograma con forma de U se identificar con situaciones en las que laparte central tiene poca importancia, mientras que la mayor parte de lasobservaciones se concentran en ambos extremos del recorrido.

    Polgono de frecuencias acumuladas. Es la representacin grfica de la distribu-cin de frecuencias acumuladas en tablas de datos agrupados en intervalos. Estegrfico muestra cmo se van acumulando paulatinamente las observaciones, paralo cual se asocia al extremo superior de cada intervalo su frecuencia acumulada(absoluta o relativa) y se unen todos estos puntos mediante una lnea poligonal,teniendo en cuenta adems que la frecuencia acumulada correspondiente a cual-quier valor anterior al extremo inferior del primer intervalo (L0) es nula y que

    la correspondiente a valores superiores al extremo superior del ltimo intervalo(Lk) es N (o 1 si se trata de frecuencias relativas). [Figura 1.7]

    Figura 1.7: Polgono de frecuencias acumuladas

    Grfico temporal. Para representar grficamente una serie temporal utilizaremosun plano de coordenadas en el que a cada unidad temporal t en el eje de abscisas

    se asigna una ordenada que se identifica con el valor de la variable observadoen el periodo t, Yt. Normalmente, al objeto de hacer ms visible la evolucintemporal de la variable, se unen los puntos (t, Yt). [Figura 1.8]

    20

  • 8/7/2019 Introduccin a la Estadstica Econmica

    21/173

    1 Organizacin y presentacin de los datos. Fuentes estadsticas

    Figura 1.8: Serie temporal

    1.4. Organismos y fuentes estadsticas de informacineconmica

    El Estado, como administrador de los intereses de los ciudadanos, precisa de infor-macin estadstica para desarrollar sus funciones y planificar sus polticas en materiaeconmica y social en general (etimolgicamente el trmino estadstica deriva de lapalabra estado). El gobierno precisa de cifras estadsticas de subida de los preciospara revisar las pensiones, negociar los salarios en convenios colectivos, ..., necesita

    disponer de datos estadsticos sobre natalidad para prever la dotacin de plazas es-colares, sobre incidencia de ciertas enfermedades para planificar las infraestructurassanitarias, etc. En este apartado se ofrece una panormica de los principales orga-nismos oficiales dedicados a la elaboracin y publicacin de estadsticas, tanto en elmbito nacional como internacional. Asimismo, se presenta un resumen de las prin-cipales caractersticas de algunas de las estadsticas de uso ms generalizado en elmbito econmico.

    1.4.1. Organizacin estadstica oficial

    Sistema estadstico nacional: el INE

    Dentro de la organizacin de la Administracin General del Estado y con el finde cubrir sus propias necesidades de informacin para la toma de decisiones existenservicios dedicados a la produccin de estadsticas, que en su conjunto constituyenel Sistema Estadstico Nacional. La actividad del Sistema Estadstico Nacional estregulada por una serie de normas legales cuyo punto de partida es la ConstitucinEspaola de 1978, que en el artculo 149.1.31 establece que la Estadstica para fines

    21

  • 8/7/2019 Introduccin a la Estadstica Econmica

    22/173

    1 Organizacin y presentacin de los datos. Fuentes estadsticas

    estatales es competencia exclusiva del Estado . Sin embargo, esta competencia debeser considerada desde una perspectiva ms amplia a distintos niveles administrativos(Comunidades Autnomas y Ayuntamientos). Por otra parte, la Unin Europea tam-bin legisla en materia estadstica a travs de reglamentos, decisiones y directivas de

    cumplimiento obligatorio para los pases miembros.En la actualidad, el marco legal vigente es la Ley de la Funcin Estadstica Pblica(LFEP) de 9 de mayo de 1989. Entre los aspectos regulados por la LFEP se encuentranla recogida de datos, el secreto estadstico, la difusin y conservacin de la informacinestadstica y los Servicios Estadsticos del Estado.

    La garanta del secreto estadstico, regulada por la LFEP, resulta especialmente im-

    portante en la sociedad actual, en la que existe una preocupacin permanente por

    salvaguardar los derechos fundamentales de los individuos y, en particular, el de intimi-

    dad en lo que concierne a informacin privada de las unidades informantes (personas,

    hogares, empresas, etc.).

    La organizacin de la produccin de estadsticas para fines estatales tiene como pilarbsico el Instituto Nacional de Estadstica (INE), creado en 1945 con el fin de ser laoficina central de estadstica, y que en la actualidad es un organismo autnomo adscritoal Ministerio de Economa y Competitividad. En la LFEP de 1989 se describe todoel conjunto de funciones encomendadas al INE, y que pueden ser resumidas en lassiguientes grandes lneas de actuacin:

    Ser el principal productor de estadsticas para fines estatales

    Ocuparse de la coordinacin y planificacin del Sistema Estadstico Nacional

    Adems, el INE debe proponer normas metodolgicas (sobre conceptos, unidades es-

    tadsticas, clasificaciones, etc.), que sern de uso comn en todos los servicios esta-dsticos con el fin de garantizar la homogeneidad y comparabilidad de los resultados.Asimismo, son competencia del INE las relaciones en materia estadstica con los or-ganismos internacionales especializados y, en particular, con la Oficina de Estadsticade la Unin Europea (EUROSTAT).

    En el desarrollo del Sistema Estadstico Nacional estn tambin implicados los ser-vicios estadsticos de las distintas Administraciones del Estado, entre los que cabedestacar los correspondientes a los distintos ministerios, encargados de elaborar esta-dsticas relativas a las actividades de su competencia, y el Banco de Espaa, institucinque cuenta con servicios estadsticos responsables de la elaboracin de las estadsticasmonetarias y financieras.

    En cuanto a los servicios estadsticos de las administraciones regionales, la mayorparte de las comunidades autnomas cuentan con una regulacin y un instituto deestadstica propios, si bien en algunos casos dichos servicios estn vinculados directa-mente a la administracin regional.

    22

    http://www.ine.es/normativa/leyes/l1289.htmhttp://www.ine.es/http://www.bde.es/http://www.bde.es/http://www.bde.es/http://www.ine.es/http://www.ine.es/normativa/leyes/l1289.htm
  • 8/7/2019 Introduccin a la Estadstica Econmica

    23/173

    1 Organizacin y presentacin de los datos. Fuentes estadsticas

    Sistema estadstico europeo: EUROSTAT

    El proceso de integracin de los distintos pases en la Unin Europea ha venidoacompaado de una demanda creciente de informacin estadstica. La elaboracin depolticas comunitarias ha de estar apoyada en estadsticas que sean comparables entrelos distintos pases miembros. As, las estadsticas regionales europeas sirven paraorientar a la Comisin Europea en la asignacin de fondos regionales, las estadsticasde precios armonizados juegan un papel clave en la poltica monetaria de los BancosCentrales, etc.

    Las estadsticas europeas pueden contribuir a describir al ciudadano medio europeo 1:

    En el caso de la mujer, tendra 42 aos de edad, y podra llegar a vivir otros 41aos. Tendra unos 28 aos de edad cuando tuvo su primer hijo y tendra menosde dos nios. Trabaja en los servicios pblicos o sociales alrededor de 33 horas ala semana y ha completado al menos la educacin secundaria superior.

    El hombre tendra 39 aos de edad y una esperanza de vida de otros 39 aos.Trabaja en el sector de servicios de mercado alrededor de 40 horas a la semana y

    ha completado al menos la educacin secundaria superior.

    El pilar bsico del sistema estadstico europeo es la Oficina de Estadstica de la UninEuropea, tambin conocida como EUROSTAT. Se trata de un organismo dependientede la Comisin Europea, cuya misin fundamental es proporcionar a las institucioneseuropeas estadsticas fiables y comparables entre pases y regiones miembros de laUnin Europea, pases candidatos y pases de la Asociacin Europea de Libre Comer-cio (AELC). EUROSTAT trabaja en estrecha colaboracin con los institutos nacio-nales de estadstica con el fin de desarrollar un sistema estadstico europeo integrado,estableciendo un lenguaje comn, en cuanto a conceptos y metodologa en general,entre los sistemas estadsticos nacionales de los pases miembros y garantizar as la

    comparabilidad de los resultados.En el marco de sus competencias, Eurostat public en el ao 2005 el Cdigo de bue-nas prcticas de las estadsticas europeas, documento que constituye un instrumentofundamental de la armonizacin estadstica europea y en el que se recogen una seriede quince principios que se comprometen a respetar las autoridades estadsticas nacio-nales y comunitarias. Algunos de estos principios se refieren a aspectos institucionalesy organizativos (por ejemplo, independencia profesional, confidencialidad estadstica,imparcialidad y objetividad), un segundo bloque se refiere a aspectos metodolgicosde la elaboracin de estadsticas y, en tercer lugar, se sealan una serie de principiosrelativos a la produccin de estadsticas con el fin de garantizar que las estadsti-cas elaboradas satisfagan las necesidades de los usuarios (por ejemplo, oportunidad y

    puntualidad, coherencia y comparabilidad, accesibilidad y claridad).

    Otros organismos internacionales

    En el mbito internacional, cabe destacar el papel relevante de la Organizacin deNaciones Unidas (ONU). Su Divisin de Estadstica constituye en la actualidad la

    1Eurostat News Release 154/2010

    23

    http://epp.eurostat.ec.europa.eu/portal/page/portal/eurostat/home/http://unstats.un.org/unsd/default.htmhttp://unstats.un.org/unsd/default.htmhttp://epp.eurostat.ec.europa.eu/portal/page/portal/eurostat/home/
  • 8/7/2019 Introduccin a la Estadstica Econmica

    24/173

    1 Organizacin y presentacin de los datos. Fuentes estadsticas

    mayor autoridad en el mundo en materia de estadstica con una importante labor enmateria de coordinacin estadstica internacional. Entre sus funciones se encuentra eldesarrollo de directrices y normativas comunes de actuacin en materia estadstica,una labor de apoyo a los pases para fortalecer sus sistemas estadsticos nacionales y la

    recopilacin y difusin de informacin estadstica global. En relacin con este ltimopunto, la Divisin de Estadstica de Naciones Unidas coordina UNdata, un servicio debase de datos on-line a nivel mundial, que permite conocer cifras oficiales por pasessobre un amplio rango de temas: agricultura, poblacin, educacin, empleo, energa,medio ambiente, salud, industria, tecnologa, desarrollo humano, ...

    Adems, numerosos organismos internacionales desarrollan trabajos en materia es-tadstica y en sus pginas web ofrecen informacin estadstica de diferentes mbitos anivel mundial: la Organizacin Internacional del Trabajo (OIT), la Organizacin parala Cooperacin y el Desarrollo Econmico (OCDE) o la Organizacin Mundial de laSalud (OMS), entre otros.

    1.4.2. Algunas estadsticas econmicasPor lo general, los usuarios del mbito econmico no realizan encuestas para obte-

    ner la informacin estadstica que precisan, sino que utilizan estadsticas elaboradaspor distintos organismos: el INE, las oficinas regionales de estadstica, EUROSTAT,etc. Basta consultar INEbase, la base de datos temtica del INE, para comprobar laamplia disponibilidad de estadsticas sobre los temas ms diversos: cifras de pobla-cin, precios, costes laborales, ocupacin hotelera, hipotecas, ... Dentro del amplioabanico de estadsticas disponibles se presentan a continuacin las caractersticas fun-damentales de dos estadsticas demogrficas de tipo censal, el Padrn Municipal y losCensos Demogrficos y de dos estadsticas muestrales dirigidas a hogares, la Encuestade Poblacin Activa (EPA), que es la principal referencia para conocer la dinmica delmercado laboral a nivel nacional, y la Encuesta de Presupuestos Familiares (EPF),enfocada al estudio de los gastos de los hogares espaoles. 2

    El Padrn Municipal

    El Padrn Municipales un registro administrativo donde constan los vecinos de unmunicipio, constituyendo prueba de residencia en el municipio y del domicilio habitualen el mismo. Toda persona que viva en Espaa est obligada a inscribirse en el padrndel municipio en el que resida habitualmente (quien viva en varios municipios debeinscribirse nicamente en el que habite durante ms tiempo al ao). Se trata por tantode un registro permanentemente actualizado de los residentes en un municipio.

    La informacin recogida en los padrones es muy reducida, la estrictamente necesa-ria para la gestin municipal, y contiene como obligatorios slo los siguientes datosde cada vecino: nombre y apellidos, sexo, domicilio habitual, nacionalidad, lugar y

    2La descripcin de estas estadsticas es un resumen de las metodologas detalladas que estn dispo-nibles en la web del INE www.ine.es.

    24

    http://www.ilo.org/global/lang--es/index.htmhttp://www.oecd.org/http://www.oecd.org/http://www.who.int/research/es/http://www.who.int/research/es/http://www.ine.es/jaxi/menu.do?type=pcaxis&path=%2Ft20%2Fe245&file=inebase&L=http://www.ine.es/http://www.ine.es/http://www.ine.es/http://www.ine.es/jaxi/menu.do?type=pcaxis&path=%2Ft20%2Fe245&file=inebase&L=http://www.who.int/research/es/http://www.who.int/research/es/http://www.oecd.org/http://www.oecd.org/http://www.ilo.org/global/lang--es/index.htm
  • 8/7/2019 Introduccin a la Estadstica Econmica

    25/173

    1 Organizacin y presentacin de los datos. Fuentes estadsticas

    fecha de nacimiento y nmero de Documento Nacional de Identidad o, tratndose deextranjeros, del documento que lo sustituya.

    Todos los aspectos relativos a la elaboracin del Padrn y sus usos administrativos y

    estadsticos estn regulados por la Ley 4/1996, por la que se modifica la Ley 7/1985,

    Reguladora de las Bases del Rgimen Local.

    La elaboracin de los padrones es responsabilidad de los ayuntamientos, con la coor-dinacin y supervisin del INE. A partir de la revisin de los padrones a 1 de enero decada ao, el INE publica las cifras de poblacin declaradas oficiales por el Gobiernoy que sirven de base para aspectos tales como la toma de decisiones que afectan ala financiacin y competencia de los municipios o la determinacin del nmero dediputados por circunscripcin en los procesos electorales. Asimismo, los padrones mu-nicipales constituyen el documento base para la elaboracin del Censo Electoral.

    Los Censos Demogrficos

    Los Censos Demogrficos constituyen el proyecto estadstico de mayor envergaduraque deben acometer peridicamente los oficinas de estadstica de cualquier pas. Bajoesta denominacin se engloban realmente tres censos diferentes: el Censo de Poblacin,que es el de mayor repercusin y tradicin, el Censo de Viviendas y el Censo deEdificios.

    Los Censos Demogrficos se definen como el conjunto de operaciones estadsticasque permiten determinar el nmero de habitantes, viviendas y edificios del Estado ysus distintas reas geogrficas (comunidades autnomas, provincias y municipios).

    En particular, el Censo de Poblacin permite conocer caractersticas demogrficasy sociales de la poblacin, tales como su estructura por sexo y edad, el estado civil,

    los movimientos migratorios, los estudios, la situacin laboral, etc.El primer censo moderno de poblacin en Espaa fue realizado en 1768 por el Conde

    de Aranda, bajo el reinado de Carlos III. Tras varios censos realizados en los siglosXVIII y XIX, desde el ao 1900 vienen realizndose censos oficiales de poblacin deforma ininterrumpida con periodicidad decenal. El cuadro adjunto permite comprobar,a travs de las cifras de los censos, el importante incremento de la poblacin espaoladesde el Censo de Aranda.

    Ao Poblacin1768 9.309.8041900 18.830.6492001 40.847.371

    La informacin de los censos es de gran valor para la toma de decisiones en temas tanimportantes para la vida cotidiana como dnde construir nuevos colegios, hospitaleso residencias, cmo disear incentivos a la natalidad, cmo mejorar el transportepblico..., adems de la asignacin de recursos econmicos del Estado o la UninEuropea a Comunidades y Ayuntamientos para desarrollo rural, fomento del empleo,etc.

    25

    http://www.boe.es/boe/dias/1996/01/12/pdfs/A00813-00815.pdfhttp://www.boe.es/boe/dias/1996/01/12/pdfs/A00813-00815.pdfhttp://www.ine.es/inebmenu/mnu_cifraspob.htmhttp://www.ine.es/inebmenu/mnu_cifraspob.htmhttp://www.boe.es/boe/dias/1996/01/12/pdfs/A00813-00815.pdf
  • 8/7/2019 Introduccin a la Estadstica Econmica

    26/173

    1 Organizacin y presentacin de los datos. Fuentes estadsticas

    Los Censos en Espaa son realizados por el INE cada 10 aos, siendo las ltimascifras publicadas las correspondientes al Censo de 2001. El prximo Censo de Poblacintiene como fecha de referencia el 1 de noviembre de 2011 y en l se incluirn todas laspersonas con residencia habitual en el territorio nacional.

    Hasta el ao 2001 los censos de poblacin eran operaciones exhaustivas en las queagentes censales del INE visitaban todas las viviendas del pas para distribuir y recogerlos cuestionarios censales. Gracias a los avances metodolgicos y tecnolgicos, el Censode 2011 se basar en la combinacin de registros y encuestas por muestreo:

    En primer lugar, se elaborar un fichero precensal realizado a partir de unaprovechamiento mximo de los registros administrativos disponibles, tomandocomo base el Padrn.

    En segundo lugar, se realizar un trabajo de campo con dos grandes operaciones:

    Un Censo de Edificios exhaustivo que permita la georreferenciacin de todos

    los edificios. Una encuesta por muestreo para conocer las caractersticas de las personas

    y las viviendas. El tamao muestral ser de aproximadamente dos millo-nes y medio de viviendas y la seleccin muestral se basar en mecanismosaleatorios. Los hogares seleccionados podrn responder por Internet o porcorreo y los agentes censales nicamente acudirn a los domicilios que norespondan por alguna de las vas mencionadas.

    La nueva metodologa para la elaboracin de los Censos Demogrficos de 2011 presentanumerosas ventajas. El aprovechamiento de la informacin ya existente en mltiplesregistros administrativos y el porcentaje de respuestas que se obtendrn por canales

    diferentes al de la entrevista tradicional conllevarn una menor carga de trabajo. Estopermitir al INE trabajar con una organizacin ms reducida y por tanto mejorar suformacin y control contribuyendo as a incrementar la calidad y puntualidad de losresultados, con unos costes ms reducidos (se estima que con la nueva metodologa seprecisar un 90 % menos de personal que en el ao 2001).

    Puede sustituir el Padrn Municipal al Censo de Poblacin?

    Tanto el Padrn Municipal como el Censo de Poblacin son recuentos de habitantes yel Padrn ser el punto de partida para la elaboracin del Censo en 2011, pero no sonfuentes de informacin sustitutivas ya que difieren entre s en cuanto a su finalidad ycontenido.

    El Censo de Poblacin es un documento estadstico que se realiza cada diez aos y que

    no permite la difusin de los datos personales de los ciudadanos (nombre, apellidos,DNI), con el fin de preservar el secreto estadstico. Todo lo contrario que el Padrn, quees un documento administrativo que se actualiza permanentemente y en el que los datosnominales de los residentes en el muncipio son imprescindibles. En resumen, el Censode Poblacin es una foto fija de la poblacin que incluye muchos datos pero totalmenteannimos; en cambio, el Padrn es un registro vivo que contiene menos informacinpero perfectamente identificada.

    26

  • 8/7/2019 Introduccin a la Estadstica Econmica

    27/173

    1 Organizacin y presentacin de los datos. Fuentes estadsticas

    Una representacin grfica asociada habitualmente a los datos demogrficos de cen-sos y padrones es la pirmide de poblacin. Se trata de una representacin de tipomixto mediante la que se analizan conjuntamente la variable edad (agrupada enintervalos) y el atributo sexo, cuya construccin se basa en la consideracin de los

    histogramas de edad separadamente para las poblaciones masculina y femenina.La pirmide de poblacin se utiliza en demografa para tener una visin global dela poblacin de un pas o regin por sexos y edades, analizando las tendencias decrecimiento o estancamiento de la poblacin. La forma de la pirmide refleja tenden-cias poblacionales y as, bases amplias junto con vrtices apuntados son sntomas depoblaciones expansivas mientras que si la base es pequea en trminos relativos y lacspide achatada, la poblacin se encuentra en fase de envejecimiento. Ejemplos deambas situaciones quedan reflejados en las pirmides de la figura 1.9, correspondientesa la poblacin espaola segn la informacin de los Censos de los aos 1900 y 2001.

    Figura 1.9: Pirmides de la poblacin espaola (INE)

    La Encuesta de Poblacin Activa

    La Encuesta de Poblacin Activa (EPA) es una investigacin que viene realizandoel INE desde 1964, cuya finalidad principal es conocer la actividad econmica en lorelativo a su componente humano, proporcionando datos sobre las principales catego-ras poblacionales en relacin con el mercado de trabajo (ocupados, parados, activose inactivos).

    La EPA es una investigacin por muestreo de periodicidad trimestral, dirigida a la

    poblacin que reside en viviendas familiares. Para garantizar que la situacin laboralde las personas que integran la muestra represente adecuadamente a la de toda lapoblacin espaola de 16 y ms aos, el proceso de seleccin es aleatorio y se reali-za en dos etapas: en la primera se eligen al azar zonas geogrficas de los municipios(denominadas secciones censales 3) y, a continuacin, en la segunda etapa, se eligen

    3Las secciones censales se corresponden con las secciones electorales, se trata de reas geogrficasde un municipio con un tamao entre 500 y 2.000 electores

    27

    http://www.ine.es/jaxi/menu.do?type=pcaxis&path=/t22/e308_mnu&file=inebase&N=&L=0http://www.ine.es/jaxi/menu.do?type=pcaxis&path=/t22/e308_mnu&file=inebase&N=&L=0
  • 8/7/2019 Introduccin a la Estadstica Econmica

    28/173

    1 Organizacin y presentacin de los datos. Fuentes estadsticas

    viviendas de las zonas seleccionadas previamente. Cada trimestre se entrevistan porva telefnica 65.000 hogares, lo que supone aproximadamente 200.000 personas. Cadatrimestre se renueva una sexta parte de la muestra, de modo que los hogares seleccio-nados colaboran durante seis trimestres consecutivos.

    En la Encuesta de Poblacin Activa se clasifica en varias categoras a la poblacinde 16 y ms aos, que es la que est capacitada legalmente para poder trabajar:

    Poblacin econmicamente activa, constituida por las personas que durante lasemana de referencia suministran mano de obra para la produccin de bienes yservicios econmicos o que estn disponibles y hacen gestiones para incorporarsea dicha produccin. Comprende a las personas de al menos 16 aos que satisfacenlas condiciones necesarias para ser consideradas ocupadas o paradas:

    Se define como ocupada toda persona, de al menos 16 aos, que tiene untrabajo por cuenta ajena o ejerce actividad por cuenta propia.

    Se clasifica como parada toda persona de al menos 16 aos que cumplesimultneamente los requisitos de estar sin empleo, disponible para tra-bajar y busca activamente empleo. Siguiendo la normativa de la UninEuropea, en la actualidad se consideran mtodos activos de bsqueda deempleo, entre otros, estar en contacto con una oficina -pblica o privada-de empleo con el fin de encontrar trabajo, anunciarse o responder a anun-cios de peridicos, participar en una prueba o entrevista en el marco deun procedimiento de contratacin ... Por tanto, la mera inscripcin comodemandante de empleo en las oficinas de empleo pblicas, no supone laclasificacin de una persona como parado.

    Poblacin econmicamente inactiva, integrada por el resto de personas, excluidas

    del mercado laboral. As, por ejemplo, pertenecen a esta categora personas quese ocupan exclusivamente de su hogar, estudiantes, jubilados e incapacitadospara trabajar.

    Los principales resultados de la encuesta son estimaciones trimestrales, tanto nacio-nales como desagregadas por comunidades autnomas, del nmero total de activos,ocupados y parados, e inactivos, que son clasificados, a su vez, atendiendo a caracte-rsticas demogrficas (sexo y edad), de ndole cultural (nivel de estudios, formacinprofesional, etc.) y econmica (profesin, rama de actividad, etc.). Se calculan ademsdos indicadores adicionales, de gran trascendencia para el anlisis de la coyunturaeconmica: la tasa de actividad, definida como cociente del nmero total de activos

    entre la poblacin de 16 aos y ms, y la tasa de paro, que se define como el cocientedel nmero de parados entre el de activos.

    La Encuesta de Presupuestos Familiares

    La Encuesta de Presupuestos Familiares (EPF) es una investigacin realizada porel INE con el objetivo de proporcionar informacin sobre la naturaleza y destino de

    28

    http://www.ine.es/jaxi/menu.do?type=pcaxis&path=%2Ft25%2Fp458&file=inebase&L=0http://www.ine.es/jaxi/menu.do?type=pcaxis&path=%2Ft25%2Fp458&file=inebase&L=0
  • 8/7/2019 Introduccin a la Estadstica Econmica

    29/173

    1 Organizacin y presentacin de los datos. Fuentes estadsticas

    los gastos de consumo de los hogares para el conjunto nacional y para las comunida-des autnomas. Por tanto, la variable central de la encuesta es el gasto de consumo,entendiendo como tal tanto el flujo monetario que destina el hogar al pago de determi-nados bienes y servicios de consumo final, como el valor de determinados consumos no

    monetarios efectuados por los hogares (entre los que se incluyen el salario en especieo el alquiler estimado de la vivienda en propiedad en la que reside el hogar).La EPF es una encuesta muestral de periodicidad anual. El procedimiento de selec-

    cin muestral es similar al de la EPA, considerndose en este caso muestras de 24.000hogares, que colaboran durante un periodo de dos aos. Cada hogar seleccionado pres-ta su colaboracin durante dos semanas consecutivas al ao en las que debe informarsobre todos los bienes y servicios consumidos.

    La encuesta anual viene realizndose desde el ao 2006. Con anterioridad el INE reali-zaba con periodidad trimestral la Encuesta Continua de Presupuestos Familiares, quesirvi de referencia para la elaboracin del ndice de Precios de Consumo base 2006.

    La informacin sobre el gasto que aporta la EPF constituye el elemento bsicopara la estimacin del Consumo Privado en el Sistema de Cuentas Nacionales y paraestablecer la cesta de la compra y la estructura de ponderaciones del ndice de Preciosde Consumo. La EPF publica resultados relativos al gasto medio por hogar y porpersona segn grupos de gasto, caractersticas de los hogares (tamao y tipo de hogaro principal fuente de ingresos, por ejemplo) y del sustentador principal (sexo, edad,situacin laboral, nivel de formacin, etc.). Asimismo se proporcionan datos sobre elconsumo en cantidades fsicas de determinados bienes alimenticios, bebidas, tabaco ycombustibles.

    29

  • 8/7/2019 Introduccin a la Estadstica Econmica

    30/173

    2 Medidas de posicinLa informacin contenida en una tabla estadstica puede ser resumida mediante

    algunos valores que proporcionen una visin global del comportamiento de la variable.Estos valores sintticos son representantes de la distribucin y se denominan medidasde posicin central o promedios.

    Sin duda, el promedio ms habitual es la media aritmtica. No obstante, podemosplantear situaciones muy diversas en las que esta medida no es la idnea para resu-mir la informacin. Por ejemplo, si observamos la edad del conjunto de estudiantesmatriculados en un centro universitario, seguramente no ser aconsejable aplicar la

    media aritmtica sino determinar la edad ms frecuente. Sin embargo, si disponemosde informacin sobre el gasto semanal en ocio de los estudiantes, para resumir esteconjunto de datos sera preferible elegir aquel valor central que se sita justo en elmedio: una mitad de los estudiantes gasta menos de esa cantidad y la otra mitad gastams.

    Actualmente los valores medios relacionados con la conducta humana son habituales;sin embargo, en sus inicios no pareca que el clculo de promedios fuese un instrumentoadecuado en este tipo de anlisis. El primero en realizar este tipo de estudios fue JacquesQuetelet (1796-1874), quien introdujo el concepto de hombre medio, partiendo de quetodo hombre era el resultado de la actuacin de causas constantes.

    Quetelet desarroll numerosos estudios sobre estatura, peso, capacidad torcica, etc.,

    comprobando que, para grupos cuantiosos de personas, sus valores se hallaban dis-tribuidos de forma simtrica respecto a la media aritmtica. Estos estudios, que hoypodramos considerar como habituales, fueron duramente criticados en sus comienzos.Se crea que el estudio estadstico de la conducta humana no tena sentido, porque stase ve influenciada por alguna actuacin divina.

    Quetelet es recordado adems de por lo sealado en los prrafos anteriores, por elenorme impulso que proporcion a las estadsticas oficiales en Europa

    Las tres opciones presentadas no son las nicas a la hora de buscar un representantede la distribucin. A lo largo del tema se desarrollarn otras medidas que tambinson necesarias, bien porque ninguna de las anteriores se adapta al planteamiento delproblema, o bien porque la informacin disponible exige alguna consideracin quecualquiera de las anteriores no tiene en cuenta.

    Los promedios proporcionan valores que ocupan un lugar central en la distribucin.No obstante, resulta tambin de inters determinar otros valores que ocupan unaposicin sealada aunque no sea central, por ejemplo la renta mxima por debajode la cual se encuentra el 10 % de hogares ms pobres. En general, estos valores sedenominan medidas de posicin no central o cuantiles y sern introducidos al final deltema.

    30

  • 8/7/2019 Introduccin a la Estadstica Econmica

    31/173

    2 Medidas de posicin

    2.1. Medidas de posicin central: promedios

    2.1.1. La media aritmtica

    Definicin 2.1. Dada una variable estadstica X, que toma un conjunto de valores

    x1, x2, . . . , xk, con frecuencias absolutas n1, n2, . . . , nk, ki=1 ni = N, llamamosmedia aritmtica de X, que denotamos por x, al valor de la siguiente expresin:

    x =

    ki=1

    xini

    N(2.1.1)

    En otros trminos, la media aritmtica es el resultado de dividir la suma de todoslos valores entre el nmero total de datos.

    Dado que fi =niN, la media aritmtica puede expresarse tambin como:

    x =ki=1

    xifi

    Para calcular la media aritmtica de una distribucin con datos agrupados los va-lores de xi representan las marcas de clase de los intervalos.

    Propiedad 2.1. La suma de las desviaciones de los valores de una variable respectoa su media es cero:

    ki=1

    (xi x) ni = 0

    Demostracin. Teniendo en cuenta la definicin de la media aritmtica y operandocon el primer miembro de la ecuacin se obtiene que:

    ki=1

    (xi x)ni =ki=1

    xini xki=1

    ni = N

    ki=1

    xini

    N xN = Nx xN = 0

    Esta propiedad permite interpretar la media aritmtica como centro de gravedadde la distribucin en el sentido de que, al resumir toda la informacin en este valor,

    se compensan los errores que se puedan cometer por exceso y por defecto.

    Propiedad 2.2. Si todos los valores de una variable se incrementan en una mismacantidad c (cambio de origen), la media tambin se incrementa en esa constante, estoes:

    xi = xi + c; i = 1, 2, . . . , k x = x + c

    31

  • 8/7/2019 Introduccin a la Estadstica Econmica

    32/173

    2 Medidas de posicin

    Si todos los valores de una variable experimentan un cambio proporcional, es decir,se multiplican por una misma cantidad c (cambio de escala), la media tambin semultiplica por esa constante, esto es:

    x

    i = c xi; i = 1, 2, . . . , k x

    = c xDemostracin. Representemos por (xi, fi) la distribucin inicial y por (xi, fi) la dis-tribucin resultante de un cambio de origen. Dado que xi = xi + c se verifica que:

    x =ki=1

    xifi =ki=1

    (xi + c)fi =ki=1

    (xifi + cfi) = x + cki=1

    fi = x + c

    Anlogamente, si ahora representamos por (xi, fi) la distribucin resultante de uncambio de escala, se cumple que xi = cxi, de donde se deduce que:

    x

    =

    k

    i=1 x

    ifi =

    k

    i=1(cx

    i)fi = c

    k

    i=1 x

    ifi = cx

    Propiedad 2.3. (Propiedad de descomponibilidad) Si se divide una poblacin de ta-

    mao N en p subpoblaciones de tamaos N1, N2, . . . , N p,p

    j=1 Nj = N

    y medias

    x1, x2, . . . , xp, la media poblacional se relaciona con las medias de las subpoblacionesmediante la expresin:

    x =x1N1 + x2N2 + + xpNp

    N

    Demostracin. Efectuaremos la comprobacin para el caso de dos subpoblaciones. Pa-ra ello representemos por (xi, ni) la distribucin poblacional y designemos por ni1 y ni2la frecuencia absoluta de xi en cada subpoblacin; estas frecuencias estn relacionadasmediante la expresin ni1 + ni2 = ni.

    El tamao de las subpoblaciones ser N1 =ki=1 ni1 y N2 =

    ki=1 ni2 y las respec-

    tivas medias vendrn dadas por las expresiones:

    x1 =

    ki=1

    xini1

    N1; x2 =

    ki=1

    xini2

    N2

    En consecuencia:

    x1N1 + x2N2N

    =

    ki=1

    xini1 +ki=1

    xini2

    N=

    ki=1

    (xini1 + xini2)

    N=

    ki=1

    xi(ni1 + ni2)

    N= x

    32

  • 8/7/2019 Introduccin a la Estadstica Econmica

    33/173

    2 Medidas de posicin

    Ejemplo 2.1. Supongamos que los estudiantes matriculados en cierta asignaturaestn divididos en dos grupos. En el primer grupo se presentaron al examen final40 estudiantes siendo la nota media del grupo 6, mientras que en el otro grupo sepresentaron 60 alumnos y la nota media es 7,5. A partir de esta informacin, aplicando

    la ecuacin 2.3, podemos calcular la nota media de todos los estudiantes como sigue:

    x =x1N1 + x2N2

    N=

    6 40 + 7, 5 60

    100= 6, 9

    2.1.2. La media ponderada

    En algunas situaciones la importancia que tiene un valor dentro del conjunto vienereflejada mediante informacin complementaria, que se cuantifica a travs de ponde-raciones o pesos.

    Por ejemplo, si las materias primas de una empresa son importadas en un 20 %y nacionales en el 80 % restante, para calcular el coste medio debemos utilizar una

    media ponderada, donde las ponderaciones o pesos reflejan la importancia relativa decada tipo de procedencia geogrfica. De modo anlogo, si conocemos la estructura delpresupuesto de las familias (25 % dedicado a alimentacin, 10 % a vestido y calzado,15 % a transporte...) estas ponderaciones reflejan la importancia relativa de cada tipode gasto y debern ser tenidas en cuenta, por ejemplo, para calcular la subida mediade precios (de hecho, como veremos ms adelante, esto es lo que se hace en el Indicede Precios de Consumo, IPC) .

    Definicin 2.2. Dada una variable estadstica X, que toma un conjunto de valoresx1, x2, . . . , xk, cuya importancia es conocida y viene dada por los pesos o ponderacionesw1, w2, . . . , wk, llamamos media ponderada de X, que denotamos por xw, al valor de

    la siguiente expresin:

    xw =

    ki=1

    xiwi

    ki=1

    wi

    (2.1.2)

    En la prctica, el mayor problema a la hora de aplicar esta medida surge por las difi-cultades de conocer, en muchos casos, las ponderaciones. Estos pesos suelen obtenersea partir de encuestas o de informaciones complementarias sobre la variable.

    Ejemplo 2.2. En el ltimo semestre un estudiante se ha examinado de varias asigna-

    turas cuyo nmero de crditos es diferente. En esta situacin, dado que las asignaturasno tienen la misma importancia en el expediente acadmico, para calcular la nota me-dia se deber tener en cuenta el nmero de crditos de cada asignatura. A partir delos datos recogidos en la tabla siguiente:

    33

  • 8/7/2019 Introduccin a la Estadstica Econmica

    34/173

    2 Medidas de posicin

    Asignatura Nota (xi) N crditos (wi)Matemticas 5 6Microeconoma 9 10Introduccin al Derecho 7 4,5

    Estadstica 6 6Historia Econmica 9 9Sociologa 7 4,5

    se obtiene que la nota media del estudiante es 7,5. Este resultado es una mediaponderada de las notas, donde el peso de cada asignatura viene determinado por elnmero de crditos.

    Algunas propiedades de la media aritmtica podran ser estudiadas como casos ponde-

    rados. As, por ejemplo, al obtener la media de una poblacin a partir de las medias de

    varias subpoblaciones, la expresin de clculo no es ms que una media ponderada de

    stas donde las ponderaciones resultan ser los tamaos de las distintas subpoblaciones.

    La media aritmtica puede ser considerada como el centro de gravedad de la distri-bucin; los valores bajos llevan a la media a tomar un valor bajo y los altos la llevana valores altos, de manera que cuando el conjunto de valores es bastante uniformese compensarn las dos fuerzas y la media resultar representativa. En consecuencia,para aquellas distribuciones que presenten valores anormalmente extremos, es muyprobable que la media aritmtica supere o quede muy por debajo de la mayora de lasobservaciones. En estos casos sera conveniente buscar un representante de la distri-bucin con mayor capacidad descriptiva que la media aritmtica.

    Los promedios que estudiamos a continuacin -mediana y moda- sern complemen-

    tarios de la media aritmtica a la hora de sintetizar la informacin contenida en unadistribucin.

    2.1.3. La mediana

    Definicin 2.3. Dada una variable estadstica X, que toma un conjunto de valoresx1, x2, . . . , xk, ordenados de forma creciente (x1 < x2 < . . . < xk), con frecuenciasabsolutas n1, n2, . . . , nk, llamamos mediana, que denotamos por M e, a un valor quedivide a la distribucin en dos partes iguales, esto es, que deja tantas observaciones asu izquierda como a su derecha.

    Supongamos que las notas obtenidas por los 15 estudiantes que han aprobado un

    examen son las siguientes:

    34

  • 8/7/2019 Introduccin a la Estadstica Econmica

    35/173

    2 Medidas de posicin

    Notas N estudiantes5 16 57 3

    8 39 210 1

    Si se ordenan los datos en sentido creciente: 5, 6, 6, 6, 6, 6, 7, 7, 7, 8, 8, 8, 9, 9,10, se puede identificar que el valor 7 ocupa la posicin central dejando tanto a suizquierda como a su derecha el mismo nmero de datos. Dicho valor es la mediana dela distribucin.

    En este caso resulta inmediato localizar la mediana, pues se dispone de un nmeroimpar de datos y, una vez ordenados stos en forma creciente, se determina fcilmenteel valor que ocupa el lugar central.

    En general, dada una distribucin de datos no agrupados, si el nmero de datos N esimpar, existe un nico valor central. Sin embargo, cuando N es par se tienen dos valorescentrales; si stos no coinciden puede decirse que hay infinitos valores medianos, todoslos comprendidos entre los dos valores centrales, aunque suele tomarse como medianala media aritmtica de stos.

    Por otro lado, cuando se tiene un gran nmero de observaciones no resultar ope-rativo hacer una ordenacin como la del ejemplo, siendo pues necesario utilizar otrosistema para determinar la mediana. En consecuencia, el mtodo general de clculode la mediana de una distribucin con datos no agrupados ser como sigue:

    Si no existe ningn valor de la distribucin cuya frecuencia acumulada coincidacon N2 , la mediana ser el menor valor de la variable que presenta una frecuencia

    acumulada mayor que N2 . En particular, esta situacin se dar siempre que Nsea impar puesto que en ese caso el valor de N2 no es entero.

    Si N2 coincide con la frecuencia acumulada de un valor xi, la mediana estindeterminada entre los valores xi y xi+1. En tal caso se tomar como medianala media aritmtica de ambos, esto es, M e = (xi+xi+1)2 . Esta situacin solamentepuede aparecer si N es par.

    En general, para distribuciones con datos agrupados en intervalos, el mtodo anteriorconduce a identificar el intervalo mediano: ser aqul que presenta la primera fre-cuencia acumulada mayor o igual que N2 . En el caso de que la frecuencia acumulada

    del i-simo intervalo coincida conN

    2 , la mediana ser el extremo superior de dichointervalo, Li. En otro caso, una vez localizado este intervalo, una primera alternativasera tomar su marca de clase como mediana, sin embargo se puede obtener una mejoraproximacin aplicando el razonamiento que describimos a continuacin.

    Para determinar cul es el valor dentro del intervalo mediano que corresponde ala mediana se puede suponer que las observaciones estn uniformemente distribuidas

    35

  • 8/7/2019 Introduccin a la Estadstica Econmica

    36/173

    2 Medidas de posicin

    a lo largo del mismo. Entonces utilizando la representacin del polgono de frecuen-cias acumuladas en el tramo que corresponde al intervalo mediano y la semejanza detringulos (vase figura 2.1) se puede aproximar la mediana como:

    M e = Li1 + d

    Figura 2.1: Mediana

    Para determinar d debemos tener en cuenta la semejanza de los tringulos ABC yADE, de la que se deriva que:

    DE

    AD=

    BC

    AB

    de donde, a su vez, teniendo en cuenta la longitud de los lados, se obtiene que:

    N2 Ni1

    d=

    Ni Ni1Li Li1

    Finalmente, despejando d en la igualdad anterior y sustituyendo, se llega a la si-guiente expresin:

    M e = Li1 +N2 Ni1

    niai (2.1.3)

    Propiedad 2.4. Si la variable X experimenta un cambio de origen, la mediana de lavariable transformada (X = X + c) ser M e

    = M e + cSi la variable X se ve afectada por un cambio de escala, la mediana de la variable

    transformada (X = cX) ser M e

    = cM e.

    36

  • 8/7/2019 Introduccin a la Estadstica Econmica

    37/173

    2 Medidas de posicin

    Demostracin. Dada la distribucin inicial (xi, ni), un cambio de origen supone ni-camente una traslacin de los valores sin afectar a las respectivas frecuencias, esto es,la distribucin transformada ser (x

    i = xi+ c, ni) donde c es una constante arbitraria.En consecuencia, dicha transformacin no altera la posicin que ocupan los valores

    dentro de la distribucin y por lo tanto si M e es la mediana de la distribucin inicial,M e

    = M e + c ser la mediana de la distribucin transformada.El mismo tipo de razonamiento es aplicable a los cambios proporcionales. Ahora la

    distribucin transformada ser (x

    i = cxi, ni) y su mediana vendr dada por M e

    =cM e.

    2.1.4. La moda

    Al representar grficamente un conjunto de datos, mediante un diagrama de barras(si no estn agrupados) o mediante un histograma (si estn agrupados en intervalos),la caracterstica que ms resalta a primera vista posiblemente sea su mximo. En estesentido el valor de la variable que determina dicho mximo en la representacin grficaresume la informacin inicial.

    Definicin 2.4. Dada una variable estadstica X, que toma un conjunto de valoresx1, x2, . . . , xk, con frecuencias absolutas n1, n2, . . . , nk, se define la moda, que deno-tamos por M o, como aquel valor de la variable que ms veces se repite, esto es, quepresenta mayor frecuencia.

    Su clculo es inmediato cuando los datos estn sin agrupar, salvo que haya ms deun valor con esta frecuencia mxima, en cuyo caso se podra hablar de distribucionesbimodales, trimodales, ..., plurimodales en general.

    Para distribuciones con datos agrupados, antes de determinar el valor de la moda

    habr que localizar el intervalo que la contiene, que llamamos intervalo modal, queser aqul que presenta mayor frecuencia por unidad de amplitud, es decir, el que tiene

    mayor altura

    hi =niai

    en el histograma. En lugar de tomar como valor aproximado

    de la moda la marca de clase del intervalo modal, asumiremos que la moda se aproximams al intervalo contiguo de mayor altura (vase figura 2.2).

    Este planteamiento supone que las distancias de la moda a los intervalos contiguosson inversamente proporcionales a sus alturas. Entonces, si denotamos por a y b lasdistancias a los intervalos anterior y posterior respectivamente, se cumplir que:

    ahi1 = bhi+1

    Aplicando una propiedad de las proporciones se tiene:

    a

    hi+1=

    b

    hi1=

    a + b

    hi1 + hi+1

    de donde:

    a =hi+1(a + b)

    hi1 + hi+1=

    hi+1

    hi1 + hi+1

    ai

    37

  • 8/7/2019 Introduccin a la Estadstica Econmica

    38/173

    2 Medidas de posicin

    Figura 2.2: Moda

    Finalmente, dado que M o = Li1 + a, se tiene:

    M o = Li1 +hi+1

    hi1 + hi+1ai (2.1.4)

    Si los datos estn agrupados en intervalos de la misma amplitud, el intervalo o clasemodal coincide con el que presenta mayor frecuencia y el valor de la moda puede sercalculado a partir de las frecuencias absolutas por medio de la siguiente expresin:

    M o = Li1 + ni+1ni1 + ni+1

    ai

    Propiedad 2.5. Si la variable X experimenta un cambio de origen, la moda de lavariable transformada (X = X + c) ser M o

    = M o + cSi la variable X se ve afectada por un cambio de escala, la moda de la variable

    transformada (X = cX) ser M o

    = c M o

    Demostracin. La demostracin resulta evidente sin ms que tener en cuenta que enambos casos las frecuencias de los valores no se modifican. As pues, si xi es el valormodal de la distribucin inicial (xi, ni), xi + c lo ser de la distribucin resultantetras un cambio de origen, cumplindose que M o = M o + c. Anlogamente, cxi ser

    el valor modal de la distribucin transformada tras un cambio de escala.

    Ejemplo 2.3. Se ha observado la produccin de leche de vaca obtenida el ltimo mesen 100 explotaciones ganaderas, obteniendo la siguiente distribucin:

    38

  • 8/7/2019 Introduccin a la Estadstica Econmica

    39/173

    2 Medidas de posicin

    Produccin de leche(miles de litros)

    N de explotaciones

    5-10 510-15 1015-20 15

    20-30 1530-50 3550-70 1570-80 5

    Dado que se trata de una distribucin con datos agrupados, para calcular la me-diana debemos localizar en primer lugar el intervalo mediano, es decir, la clase cuyafrecuencia acumulada supera por primera vez a N2 .

    En este caso N2 = 50; si observamos las frecuencias acumuladas recogidas en latercera columna de la tabla siguiente podemos concluir que el intervalo mediano es elquinto (30-50):

    Produccin de leche(miles de litros)

    N de explotaciones Ni hi

    5-10 5 5 110-15 10 15 215-20 15 30 320-30 15 45 1,530-50 35 80 1,7550-70 15 95 0,7570-80 5 100 0,5

    Tabla 2.1: Produccin de leche

    Finalmente, aplicando la frmula propuesta anteriormente para el clculo de lamediana con datos agrupados obtenemos que M e = 32, 857. Este resultado nos indicaque la mitad de las explotaciones han producido el mes pasado 32.857 litros o menos.

    Calculemos ahora la moda de la distribucin, para lo cual debemos identificar pre-viamente el intervalo modal, esto es, la clase que presenta mayor altura. Observandolas alturas recogidas en la ltima columna de la tabla anterior podemos comprobarque el intervalo modal es el tercero (15-20). A su vez, aplicando la frmula propuestaanteriormente para el clculo de la moda con datos agrupados, se llega al siguienteresultado: M o = 17, 143, que indica que la produccin lctea mas frecuente es de

    17.143 litros.

    2.1.5. Otros promedios: media geomtrica y media armnica

    Aunque los promedios definidos hasta aqu (media aritmtica, mediana y moda)son las medidas aplicadas habitualmente para resumir un conjunto de datos, existen

    39

  • 8/7/2019 Introduccin a la Estadstica Econmica

    40/173

    2 Medidas de posicin

    situaciones en que la propia naturaleza de la informacin conduce a otro tipo demedidas como son la media geomtrica y la media armnica.

    Definicin 2.5. Dada una variable estadstica X, que toma un conjunto de valoresx1, x2, . . . , xk, con frecuencias absolutas n1, n2, . . . , nk, se define la media geomtrica,que denotamos por G, como el valor dado por la siguiente expresin:

    G = N

    xn11 xn22 x

    nkk (2.1.5)

    En otros trminos, la media geomtrica es la raz N-sima del producto de todas lasobservaciones.

    Para situaciones en que la variable de inters presente variaciones acumulativas, lamedia geomtrica ser el promedio adecuado para resumir su comportamiento. As, enel tema 8, aplicaremos esta medida para calcular ndices o tasas medias de variacinde una magnitud econmica (precios, salarios, ...) en un periodo temporal dado.

    Si la variable presenta valores positivos y negativos, no tiene sentido calcular lamedia geomtrica; tampoco si alguna observacin es nula.

    Definicin 2.6. Dada una variable estadstica X, que toma un conjunto de valoresx1, x2, . . . , xk, con frecuencias absolutas n1, n2, . . . , nk, se define la media armnica,que denotamos por H, como el valor dado por la siguiente expresin:

    H =N

    n1x1

    + +nkxk

    (2.1.6)

    La media armnica no se puede calcular si la variable presenta algn valor nulo.

    Ejemplo 2.4. Un automovilista hizo el recorrido entre dos ciudades en 4 etapas; en latabla siguiente se indica la distancia recorrida y la velocidad empleada en cada etapa:

    Etapa V elocidad(km/h)

    Distancia(km)

    1 60 452 80 703 100 2004 70 85

    A partir de estos datos podemos plantearnos calcular la velocidad media v del reco-

    rrido total. Teniendo en cuenta el concepto de velocidad (espacio/tiempo), el tiempoempleado en cada etapa lo obtendremos a partir de los datos anteriores como cocien-te de la distancia reccorrida y la velocidad correspondientes y, en consecuencia, lavelocidad media vendr dada por la siguiente expresin:

    v =espacio

    tiempo=

    40045

    60+

    70

    80+

    200

    100+

    85

    70

    = 82, 66

    40

  • 8/7/2019 Introduccin a la Estadstica Econmica

    41/173

    2 Medidas de posicin

    As pues para calcular la velocidad media hemos aplicado el concepto de mediaarmnica.

    La media armnica de una variable X coincide con la inversa de la media arimtica de la

    variable inversa de X, 1X .Las medias armnica, geomtrica y aritmtica estn relacionadas por las siguientes desigual-dades: H G x. La demostracin puede consultarse en [2] pp. 76-77.

    2.1.6. Ventajas e inconvenientes de los promedios

    Con el fin de resumir un conjunto de datos hemos definido distintas medidas detendencia central o promedios, lo que nos indica que no existe una que sea idneaen todas las situaciones. Cada promedio presenta ventajas e inconvenientes que harnaconsejable o no su aplicacin como representante segn el tipo