Modulo 100105 Estadística Descriptiva UNAD

178
1 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERÍA CONTENIDO DIDÁCTICO DEL CURSO: 100105 Estadística Descriptiva UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERÍA UNIDAD DE CIENCIAS BÁSICAS AUTOR MILTON FERNANDO ORTEGON PAVA 100105 ESTADÍSTICA DESCRIPTIVA Segunda versión MILTON FERNANDO ORTEGON PAVA (Director Nacional) FRANCISCO CABRERA (Acreditador) IBAGUÉ JULIO 2010

description

Estadística Descriptiva

Transcript of Modulo 100105 Estadística Descriptiva UNAD

  • 1

    UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

    UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA

    ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA

    UNIDAD DE CIENCIAS BSICAS

    AUTOR

    MILTON FERNANDO ORTEGON PAVA

    100105 ESTADSTICA DESCRIPTIVA

    Segunda versin

    MILTON FERNANDO ORTEGON PAVA

    (Director Nacional)

    FRANCISCO CABRERA

    (Acreditador)

    IBAGU

    JULIO 2010

  • 2

    UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

    ASPECTOS DE PROPIEDAD INTELECTUAL Y VERSIONAMIENTO El presente mdulo fue diseado en el ao 2005 por MONICA A. SANTA ESCOBAR (Primera versin) El documento tiene como antecedentes: Estadstica bsica aplicada (Ciro Martinez Bencardino) Curso de Estadstica Elemental para las ciencias aplicadas (Smith A Stanley). Estadstica Descriptiva (Hernan Bejarano Barrera) .Probabilidad y Estadstica (Triola Mario F) Estadstica y Probabilidad (Juan de Jesus Romero-santillana) Como novedades de este material es la presentacin por unidades, captulos y lecciones, que permite una fcil ubicacin de temticas especficas, segn el inters del estudiante. Adems, el componente prctico para los cursos tericos de Matemticas al final de cada unidad. Este documento se puede copiar, distribuir y comunicar pblicamente bajo las condiciones siguientes:

    Reconocimiento. Debe reconocer los crditos de la obra de la manera especificada por el autor o el licenciador (pero no de una manera que sugiera que tiene su apoyo o apoyan el uso que hace de su obra).

    No comercial. No puede utilizar esta obra para fines comerciales.

    Sin obras derivadas. No se puede alterar, transformar o generar una obra derivada a partir de esta obra.

    Al reutilizar o distribuir la obra, tiene que dejar bien claro los trminos de la licencia de esta obra.

    Alguna de estas condiciones puede no aplicarse si se obtiene el permiso del titular de los derechos de autor

    Nada en esta menoscaba o restringe los derechos morales del autor.

  • 3

    UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

    INTRODUCCIN El presente modulo est dirigido a estudiantes de programas de pregrado que oferta la UNAD, bajo la modalidad de educacin superior a distancia. El material est estructurado en (Dos unidades) que son las temticas macro del curso acadmico. . El contenido de cada una de las partes fue seleccionado, teniendo en cuenta los saberes mnimos que se esperara debe alcanzar un estudiante de la Universidad Nacional Abierta y a Distancia en el campo la (Estadstica descriptiva). La propuesta permite que los estudiantes reconozcan los conocimientos mnimos del curso en mencin, que le permita resolver situaciones propias del mismo y adems, abordar posteriores temticas que requieran de stos conocimientos. Para el mejor aprovechamiento de este material, se recomienda que el estudiante posea como conocimientos previos: Matemtica Bsica El modulo se caracteriza porque en cada leccin se presentar ejemplos modelos del tema en estudio, al final de cada captulo se exponen ejercicios; con respuesta, que permite a los estudiantes contextualizarse en diversas reas del conocimiento, con el fin de fortalecer las temticas propias del curso. Al final de cada unidad se presenta una Autoevaluacin de un nivel medio-alto, las cuales permiten verificar los alcances de los estudiantes en las temticas analizadas y detectar las debilidades y as centrarse en stas, con el fin de alcanzar las metas propuestas. Finalmente, el Material pretende servir como gua de aprendizaje autnomo, se recomienda apoyar este proceso por medio de lecturas especializadas, ayudas audiovisuales, visitas a sitios Web y prcticas de laboratorio; entre otros, as lograr una efectiva comprensin, interiorizacin y aplicacin de las temticas estudiadas.

  • 4

    UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

    CONTENIDO

    Pg. INTRODUCCIN 11 UNIDAD DIDCTICA 1 Conceptos Preliminares Y Medidas De Tendencia Central 14 INTRODUCCIN A LA UNIDAD 16 OBJETIVOS ESPECFICOS 17 1. CONCEPTOS PRELIMINARES Y MEDIDAS DE TENDENCIA CENTRAL 18

    1.1. CONCEPTUALIZACIN DE TRMINOS ESTADSTICOS 18 1.1.1. QU ES LA ESTADSTICA? 18

    1.1.2. CONCEPTOS BSICOS 19

    1.1.2.1 Aleatoriedad Y Representatividad de la muestra 21 1.1.2.2 Muestra aleatoria simple 21 1.1.2.3 Muestra Aleatoria sistemtica 21 1.1.2.4 Muestra Aleatoria Estratificada 22 1.1.2.5 Muestra Aleatoria de conglomerados 22 1.1.2.6.Deter. Poblacin, muestra y tipo de muestreo a utilizar 22 1.1.3. VARIABLES ESTADSTICAS 23 1.1.3.1 variables cualitativas 24 1.1.3.2 variables cuantitativas 24 1.1.3.3 escala de medida de variables 24

    1.1.4 CARACTERIZACIN DE UNA VARIABLE CUALITATIVA 26 1.1.4.1 tablas de frecuencias: 26 1.1.4.2 representaciones graficas: 27

    1.1.4.2.1 diagramas de barras 27 1.1.4.2.2 diagrama circular: 28 1.1.4.3 moda 29 1.1.5. TABLAS DE CONTINGENCIA: 30

    32 1.2 INVESTIGACION ESTADISTICA

    1.2.1 PLANEACION 32

    1.2.1.1 Definicin del objeto de investigacin 32

    1.2.1.2.Unidad de investigacin 33

    1.2.1.3.Clase de investigacin 33

    1.2.1.4 Las fuentes de informacin 33

  • 5

    UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

    1.2.2. RECOLECCIN 34 1.2.2.1 Segn la cobertura 34 1.2.2.2 Segn la forma de observacin 34

    1.2.3. ORGANIZACIN DE LA INFORMACIN 35 1.2.3.1 Combinacin o arreglo ordenado 35 1.2.3.2 Arreglo de tallo y hojas 36 1.2.3.3 Tabulacin de la informacin 38

    1.2.4 TABLAS DE DISTRIBUCION DE FRECUENCIAS 41 1.2.4.1 Distribuciones de frecuencias 41 1.2.5 PRESENTACIN DE LA INFORMACIN 48

    1.2.5.1 Componentes de una grfica 48 1.2.5.2 Diagrama de frecuencias 49 1.2.5.3 Histograma de frecuencias 51 1.2.5.4 Polgono de frecuencias 52 1.2.5.5 Ojiva 53

    1.2.5.6 Grficos de lnea 55 1.2.5.7 Diagramas de barras 56 1.2.5.8 Diagrama circular 59 1.2.5.9 Pictogramas 60 1.2.5.10 Mapas estadsticos o cartogramas 61 1.3 MEDIDAS DE TENDENCIA CENTRAL O DE POSICION 61 1.3.1 ESTADIGRAFOS 61 1.3.2 MEDIA ARITMTICA 62

    1.3.3 MEDIANA 65 1.3.4 MODA 69 1.3.5 OTRAS MEDIDAS DE TENDENCIA CENTRAL 72

    ACTIVIDADES DE AUTOEVALUACIN DE LA UNIDAD 1 LABORATORIO EN EXCEL (PRCTICA: DIAGRAMAS ESTADSTICOS)

    82 97

    BIBLIOGRAFA DE LA UNIDAD 108

    UNIDAD DIDACTICA 2

    MEDIDAS DE DISPERSIN Y ESTADSTICAS BIVARIANTES 110

    INTRODUCCION A LA UNIDAD 111

    OBJETIVOS ESPECIFICOS 112

    2. MEDIDAS DE DISPERSIN Y ESTADSTICAS BIVARIANTES 114 2.1 MEDIDAS DE DISPERSIN Y ASIMETRIA 115

    2.1.1 RANGO O RECORRIDO 115

    2.1.2. VARIANZA Y DESVIACIN ESTNDAR 116 2.1.2.1 Desviacin tpica o estndar 118 2.1.3 COEFICIENTE DE VARIACIN Y DESVIACIN MEDIA 119

    2.1.3.1. Desviacin media 120

  • 6

    UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

    2.1.4 PUNTAJE TPICO O ESTANDARIZADO 122

    2.1.5 MEDIDAS DE ASIMETRA Y APUNTAMIENTO 124 2.1.5.1 Asimetra 124

    2.1.5.2.Apuntamiento o curtosis 125 2.1.5.3 Lgica Matemtica 127 2.1.5.4 Competencias Comunicativas 128 2.1.5.5 Cultura Poltica 130 2.1.5.6 Estadstica Descriptiva 131 2.1.5.7 Herramientas Informticas 132 2.2 MEDIDAS ESTADSTICAS BIVARIANTES 132 2.2.1 REGRESIN Y CORRELACIN 132 2.2.2 DIAGRAMA DE DISPERSIN 133 2.2.3 REGRESIN LINEAL SIMPLE 134 2.2.4.CORRELACIN 138 2.2.5.REGRESIN MLTIPLE 141

    2.3 NMEROS INDICE 144

    2.3.1 CONSTRUCCIN DE NMEROS NDICE 145 2.3.2. TIPOS DE NMEROS NDICES 146 2.3.3. NDICES SIMPLES 146

    2.3.4 NDICES COMPUESTOS 147 2.3.5. USOS DE LOS NMEROS NDICES 151 2.3.5.1. Calculo del salario y del ingreso 152

    2.3.5.2 Poder de compra o poder adquisitivo o valor del dinero 152

    2.3.5.3. Porcentaje de desvalorizacin 153

    2.3.5.4. porcentaje de variacin y de devaluacin 154 ACTIVIDADES DE AUTOEVALUACION UNIDAD 2 LABORATORIO EN EXCEL PRCTICA: (REGRESIN Y CORRELACIN)

    155

    165

    BIBLIOGRAFA DE LA UNIDAD 172 ANEXOA 174

  • 7

    UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

    LISTA DE TABLAS Pg.

    UNIDAD DIDCTICA 1 Conceptos Preliminares Y Medidas De Tendencia Central

    Tabla 1.1 Tablas de contingencia 30 Tabla 1.2 Tabla de Contingencia de Frecuencia Relativas 31 Tabla 1.3 Tabla de Contingencia de porcentajes 31 Tabla 2.1 Nmero de egresados de la UNAD en el perodo 1994- 2004

    39

    Tabla 2.2. Clasificacin de estudiantes por CEAD en la Zona Occidente durante el primer semestre de 2005

    39

    Tabla 2.3. Clasificacin de empleados por cargo 40 Tabla 2.4. Clasificacin de la estatura de los estudiantes de un grupo de quinto grado

    40

    Tabla 2.5. Distribucin de frecuencias simple de latidos cardiacos de 30 personas

    42

    Tabla 2.6. Nmero de intervalos de clases sugerido en funcin del tamao de la muestra

    46

    Tabla 2.7. Distribucin de frecuencias agrupadas de la velocidad de pulsaciones

    47

    Tabla 2.8. Distribucin de frecuencias absolutas, relativas y acumuladas ascendentes de la velocidad de pulsaciones

    47

    Tabla 2.9. Distribucin de frecuencias simple de visita al odontlogo de nios entre los 6 y 12 aos

    50

    Tabla 2.10. Egresados de la UNAD en el perodo 2000-2004 55 Tabla 2.11. Ventas por departamento al contado y a crdito en marzo de 2005

    57

    Tabla 3.1. Distribucin de frecuencias agrupadas 64 Tabla 3.2. Distribucin de frecuencias agrupadas 66 Tabla 3.3. Distribucin de frecuencias de la asistencia a cine 70 Tabla 3.4. Distribucin de frecuencias agrupadas de la asistencia a cine

    70

    Tabla 3.5. Comparacin de la media, mediana y moda 72 Tabla 3.6. Distribucin de frecuencias agrupadas 73 Tabla 3.7. Distribucin de frecuencias agrupadas 77 Tabla 3.8. Resumen de clculos, ejemplo 15.4. 78 UNIDAD 2 Medidas De Dispersin Y Estadsticas Bivariantes Tabla 4.1. Distribucin de frecuencias de las calificaciones de estudiantes de Estadstica

    118

    Tabla 4.2. Distribucin de frecuencias de las calificaciones de estudiantes de Estadstica

    118

  • 8

    UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

    Tabla 4.3. Distribucin de frecuencias de las calificaciones de primer semestre en Valledupar

    127

    Tabla 4.4. Clculo de Z para la distribucin de frecuencias de las calificaciones de Competencias Comunicativas

    129

    Tabla 4.5. Clculo de Z para la distribucin de frecuencias de las calificaciones de Estadstica Descriptiva

    131

    Tabla 5.1. Relacin de ventas de un producto y la emisin del comercial en televisin

    136

    Tabla 5.2. Grado de correlacin lineal 140 Tabla 5.3. Gastos indirectos de produccin 143 Tabla 5.4. Precios y cantidades vendidas en una farmacia en 2003 y 2004

    150

  • 9

    UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

    LISTA DE FIGURAS Pg.

    UNIDAD DIDCTICA 1 Conceptos Preliminares Y Medidas De Tendencia Central Figura 1.1. Diagrama de Barras Medios de Informacin 28 Figura 1.2 Diagrama Circular medios Comunicacin 29 Figura 2.1. Diagrama de tallo y hojas para los datos de pulsaciones del ejemplo 8.1.

    37

    Figura 2.2. Diagrama de doble tallo y hojas para los datos de pulsaciones del ejemplo 8.1.

    38

    Figura 2.3. Diagrama de frecuencias absolutas de visita al odontlogo de nios entre los 6 y 12 aos

    50

    Figura 2.4. Diagrama de frecuencias absolutas acumuladas de visita al odontlogo de nios entre los 6 y 12 aos

    51

    Figura 2.5. Histograma de frecuencias absolutas de la velocidad de pulsaciones

    52

    Figura 2.6. Polgono de frecuencias absolutas de la velocidad de pulsaciones

    53

    Figura 2.7. Ojiva ascendente de la velocidad de pulsaciones 54 Figura 2.8. Ojiva descendente de la velocidad de pulsaciones 54 Figura 2.9. Ojiva ascendente y descendente de la velocidad de pulsaciones

    55

    Figura 2.10. Diagrama de lneas. Egresados de la UNAD en el perodo 2000-2004

    56

    Figura 2.11. Diagrama de barras agrupadas de las ventas por departamento al contado y a crdito en marzo de 2005

    58

    Figura 2.12. Diagrama de barras segmentadas de las ventas por departamento al contado y a crdito en marzo de 2005

    58

    Figura 2.13. Diagrama circular para el estado civil de 1250 aspirantes a empleo

    59

    Figura 2.14. Pictograma para el nmero de rboles talados en Argentina, Bolivia y Colombia

    60

    UNIDAD 2 Medidas De Dispersin Y Estadsticas Bivariantes Figura 3.1. Distribuciones sesgadas. (a) Sesgada a la derecha; (b) Sesgada a la izquierda; (c) Simtrica

    71

    Figura 3.2. Ojiva porcentual ascendente 78 Figura 3.3. Diagrama de flujo para el K-simo percentil 79 Figura 4.1. Curva normal o campana de Gauss 122 Figura 4.2. Curva asimtrica positiva. Polgono de frecuencias de calificaciones de Lgica Matemtica

    128

  • 10

    UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

    Figura 4.3. Curva simtrica platicrtica. Polgono de frecuencias de calificaciones de Competencias Comunicativas

    129

    Figura 4.4. Curva asimtrica negativa. Polgono de frecuencias de calificaciones de Cultura Poltica

    130

    Figura 4.5. Curva simtrica leptocrtica. Polgono de frecuencias de calificaciones de Estadstica Descriptiva

    132

    Figura 5.1. Grficas de dispersin. (a) lineal; (b) curvilnea; (c) sin relacin

    134

    Figura 5.2. Diagrama de dispersin de ventas de un producto y la emisin del comercial en televisin

    136

    Figura 5.3. Grficas de dispersin lineal. (a) positiva; (b) negativa 138

  • 11

    UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

    INTRODUCCIN

    La Estadstica es una disciplina que se aplica en muchos campos de la actividad del ser humano. Es muy frecuente encontrarse en las diferentes disciplinas del saber con incertidumbres como el pronosticar el crecimiento poblacional de un pas, el crecimiento econmico de una empresa o el crecimiento de produccin y venta de un producto especfico, el conocer la efectividad de diferentes abonos en el campo agrario, el determinar la tendencia de contaminacin del agua o el aire, la clasificacin de personal en una empresa para efectos de una buena y sana poltica laboral, etc.

    Habitualmente, el propsito de la Estadstica Aplicada es el de sacar conclusiones de una poblacin en estudio, examinando solamente una parte de ella denominada muestra. Este proceso, llamado Inferencia Estadstica, suele venir precedido de otro: la Estadstica Descriptiva, en el que los datos son ordenados, resumidos y clasificados con objeto de tener una visin ms precisa y conjunta de las observaciones, intentando descubrir de esta manera posibles relaciones entre los datos, viendo cules toman valores parecidos, cules difieren grandemente del resto, destacando hechos de posible inters, entre otros.

    En todos los campos de la investigacin se requiere a menudo el uso racional de los Mtodos Estadsticos. Los procesos de planeacin, control y toma de decisiones econmicas, administrativas y financieras se basan en resultados obtenidos mediante el anlisis estadstico de los fenmenos en ellos involucrados. El acelerado desarrollo de mtodos, tcnicas y tecnologas para el ptimo anlisis de datos justifica que un profesional disponga de una slida fundamentacin conceptual para que realice apropiadamente su evaluacin y aporte sustentaciones a su decisin. Las interpretaciones que generan los datos pudieran ser errneas para aquellas personas que no cuentan con criterios vlidos para captar la informacin. Es por ello que con este mdulo se pretende que el estudiante se adentre a los conocimientos bsicos de la Estadstica Descriptiva.

    Enfrentarse con datos de muy diversa ndole es cosa de todos los das en

    cualquier prctica del ser humano. Sin embargo, dado la cantidad innumerable de estos, no siempre se comprende el real alcance de lo que dicen. Como parte de una base cultural necesaria para desempearse en el mundo de hoy, es requisito desarrollar una capacidad personal para extraer y describir informacin presente en un conjunto de datos. Y es precisamente all donde resalta la importancia de la Estadstica Descriptiva como primer paso en la determinacin de decisiones e inferencias que pueden concluirse de la variada informacin que nos llega en forma de datos numricos.

  • 12

    UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

    Con el presente mdulo, se busca que el estudiante se encuentre en

    capacidad de interpretar, discriminar y relacionar los fundamentos bsicos de la Estadstica Descriptiva, a travs del anlisis de datos tomados de un fenmeno propio de su disciplina y que describa, examine y sintetice adecuadamente la informacin mediante mtodos estadsticos sencillos.

    El curso acadmico de Estadstica Descriptiva hace parte de la formacin bsica disciplinar de los programas que oferta la Universidad Nacional Abierta y a Distancia UNAD. Consta de dos (2) crditos acadmicos, el sistema adoptado por la UNAD como estndar curricular en la formacin universitaria, y es de tipo terico, en tanto que busca la identificacin y el reconocimiento de las problemticas, perspectivas tericas, conceptos, categoras, mtodos y tcnicas indispensables para la formacin profesional.

    Este texto contiene dos unidades didcticas1, correlacionadas directamente con el nmero de crditos acadmicos asignados al curso acadmico. La primera de ellas, considera los Conceptos Bsicos necesarios para el cumplimiento de los propsitos y objetivos del curso. En esta unidad se identifican algunos conceptos estadsticos como poblacin, muestra, variable, dato, etc.; y se reconocen cada uno de los pasos a seguir para una correcta y acertada investigacin estadstica como son la planeacin, la recoleccin de la informacin, su organizacin y su presentacin grfica. En la segunda unidad didctica se reconocen algunas de las medidas estadsticas ms comunes, tanto univariantes como bivariantes. Entre las primeras se contemplan las medidas de tendencia central, las medidas de dispersin y las de asimetra y apuntamiento y, como medidas estadsticas bivariantes, se trabaja la regresin lineal (simple, ponderada y mltiple), la correlacin y los nmeros ndice. Como Anexo y complemento a esta segunda unidad, se incluyen algunos elementos bsicos de la matemtica: la sumatoria y productoria. Al final de cada tema, encontrar ejercicios de aplicacin que buscan evaluar el grado de conocimiento adquirido, esta evaluacin ser retroalimentada en la informacin de retorno que encontrar al final de cada unidad didctica.

    Este texto busca aportar las herramientas tericas y prcticas a los estudiantes para que logren, mediante anlisis cuantitativos, la interpretacin de diferentes fenmenos propios de su disciplina de formacin y del entorno social, econmico y poltico. Apunta al manejo estadstico de datos, dar las pautas en la recoleccin planeada de los mismos y proporcionar un conjunto de tcnicas a

    1 Conjunto de conocimientos seleccionados, organizados y desarrollados a partir de palabras clave

    tomados como conceptos que los tipifican, en articulacin con las intencionalidades formativas, destinadas a potenciar y hacer efectivo el aprendizaje mediante el desarrollo de operaciones, modificaciones y actualizaciones cognitivas y nuevas actuaciones o competencias por parte del estudiante. EL MATERIAL DIDCTICO. Roberto J. Salazar Ramos. UNAD, Bogot D.C. 2004.

  • 13

    UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

    partir de las cuales se logra presentar, resumir e interpretar datos que pueden corresponder a una muestra o a un grupo total.

    El mdulo no pretende reemplazar las diferentes referencias bibliogrficas

    clsicas de la Estadstica, busca entregar los conceptos de un modo ms didctico, enfocado en el autoaprendizaje y en relacin directa con la Gua de Actividades referenciada en el protocolo del presente curso. Al final de cada unidad, el estudiante encontrar las referencias bibliogrficas bsicas, pero no nicas, para que con ellas refuerce en conceptos y definiciones. Adems, encontrar una serie de pginas web recomendadas que amplan los temas tratados. Se trata pues de un material didctico de apoyo para el curso de Estadstica Descriptiva de la UNAD, como parte de las diferentes y diversas herramientas didcticas en las que se apoya el aprendizaje autnomo.

  • 14

    UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

    Unidad Didctica Uno

    CONCEPTOS PRELIMINARES Y MEDIDAS DE TENDENCIA CENTRAL

  • 15

    UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

    UNIDAD 1.

    CONCEPTOS PRELIMINARES Y

    MEDIDAS DE TENDENCIA CENTRAL

    Leccin 1 Que es la estadstica?

    Leccin 2 Conceptos Bsicos

    Leccin 3 Variables estadsticas

    Leccin 4 Caracterizacin de una

    variable cualitativa

    Leccin 5 Tablas de contingencia

    Leccin 6 Planeacin

    Leccin 7 Recoleccin.

    Leccin 8 Organizacin de la

    informacin.

    Leccin 9 Tablas de distribucin de

    frecuencias.

    Leccin 10 Presentacin de la

    informacin.

    Leccin 11 Estadgrafos.

    Leccin 12 Media Aritmtica

    Leccin 13 Mediana.

    Leccin 14 Moda

    Leccin 15 Otras medidas de

    tendencia central.

    CAPITULO 1.

    GENERALIDADES Y VARIABLES

    ESTADSTICAS

    CAPITULO 2.

    INVESTIGACIN ESTADSTICA

    CAPITULO 3.

    MEDIDAS DE TENDENCIA CENTRAL O

    DE POSICIN

  • 16

    UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

    INTRODUCCIN A LA UNIDAD

    La investigacin estadstica es necesaria para cualquier individuo en el mundo de hoy, cualquiera que sean sus actividades siempre hay aplicaciones estadsticas en ellas. Pero cualquier investigacin estadstica requiere seguir unos pasos y procedimientos establecidos para que esta tenga validez. En esta unidad se desarrollarn en forma introductoria y general algunos conceptos preliminares con el fin de utilizar un mismo lenguaje en cuanto se refiere a esta disciplina. De igual manera, se presentan los elementos iniciales bsicos y necesarios para la comprensin y aplicacin de la estadstica en cualquier campo. En el captulo uno se ampliarn algunas definiciones de trminos bsicos de la estadstica como poblacin, muestra, variable, dato, etc., buscando que el estudiante los identifique en ejemplos sencillos de la vida diaria. En el captulo dos se reconocern cada uno de los pasos a seguir para una correcta y acertada investigacin estadstica como son la planeacin, la recoleccin de la informacin, su organizacin y su presentacin grfica y en el capitulo III se mencionaran las medidas de tendencia central y de posicin para lo cual se hace indispensable recordar algunas nociones aritmticas y algebraicas bsicas en estadstica, es por esto que se recomienda al lector iniciar el captulo repasando la sumatoria como propiedad aritmtica fundamental para entender las medidas estadsticas de una poblacin o muestra. Todo cuanto tiene que ver con sumatoria y productoria puede ser repasado y consultado en el anexo A, que se encuentra al final del texto.

  • 17

    UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

    OBJETIVOS ESPECFICOS

    Conocer el significado de la palabra estadstica.

    Diferenciar entre los conceptos de Estadstica Descriptiva y Estadstica Inferencial.

    Establecer los conceptos de poblacin, muestra, variable, dato y parmetro.

    Identificar las etapas que sugiere una investigacin estadstica.

    Manejar los diferentes mtodos de recoleccin de informacin para la investigacin estadstica.

    Advertir la importancia de las distribuciones de frecuencias para la descripcin de datos.

    Aplicar los conceptos de frecuencia, marca de clase y distribucin de frecuencias a un conjunto de datos estadsticos.

    Construir diferentes tipos de distribuciones de frecuencias para conjuntos de datos.

    Reconocer algunas caractersticas que debe tener una grfica para que represente mejor una situacin.

    Representar grficamente distribuciones de frecuencias dadas o calculadas.

  • 18

    UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

    1. UNIDAD CONCEPTOS PRELIMINARES Y MEDIDAS DE TENDENCIA

    CENTRAL

    1.1. CAPITULO 1. GENERALIDADES Y VARIABLES ESTADSTICAS En un principio se consideraba que la funcin de la estadstica era la descripcin de las caractersticas de grupo, actividad que la hacia confundir con el papel que cumple la historia de observar y describir el hecho. En su origen las estadsticas era histricas ; hoy en da, la estadstica, adems de ser descriptiva, es analtica, considerndose esta ultima como la funcin mas importante que realiza, ya que permite obtener conclusiones para un grupo mayor, denominado poblacin, partiendo de una investigacin realizada en un grupo menor, denominado muestra cuyos elementos se seleccionan aleatoriamente o al azar. 1.1.1. LECCION 1. Qu es la Estadstica?

    Antes de dar a conocer los conceptos de los trminos estadsticos que lleven a entablar el lenguaje comn que se utilizar en adelante, es necesario saber qu es la Estadstica y en qu consiste la Estadstica Descriptiva.

    Empricamente se sabe que la Estadstica tiene que ver con datos y la manera en que estos son agrupados. Esto se reconoce en muchos casos de la vida cotidiana que involucran informacin numrica y el contexto en que esta informacin es dada a conocer. Aunque tambin puede darse en muchos casos que, si bien estn relacionados con la estadstica, obedecen a otros fenmenos de disciplinas relacionadas con pero que no conforman la Estadstica propiamente dicha.

    La Estadstica es un mtodo cientfico de operar con un grupo de datos y de interpretarlos.

    Si bien esta definicin parece un poco ambigua, se ver ms adelante el marco en que ste mtodo se desarrolla y las leyes que lo rigen. Pero, por ahora, se deja abierta al cuestionamiento del estudiante la gama de posibilidades que abarca esta definicin.

    La Estadstica, o el mtodo de la estadstica, se divide en dos ramas: la

    Estadstica Descriptiva o deductiva y la Inferencia Estadstica o estadstica

  • 19

    UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

    inductiva. Este curso se dedica a la Estadstica Descriptiva, por lo que se hace necesario dar a conocer, en trminos generales, en qu consiste la Inferencia Estadstica.

    La Inferencia Estadstica comprende en un todo articulado el mtodo y las tcnicas necesarias para explicar el comportamiento de un grupo de datos en un nivel superior de lo que estos datos pueden dar a conocer por s mismos. Es decir, se puede concluir sobre el grupo de datos sobrepasando los lmites del conocimiento inicial que estos suministran, examinando solamente una parte de la poblacin denominada muestra. Es por ello que a la Inferencia Estadstica tambin se le conoce como Estadstica Analtica.

    Si esto es as, qu le corresponde entonces a la Estadstica Descriptiva? Esta tiene por fin elevar los aspectos caractersticos del grupo de datos pero sin intentar obtener ms conocimiento del que pueda adquirirse por s mismos. Es por ello que la Estadstica Descriptiva es el punto de partida del anlisis de un grupo de datos que involucran una cierta complejidad, o bien puede ser el todo de un anlisis bsico y limitado del grupo de datos. 1.1.2. LECCIN 2. CONCEPTOS BSICOS

    Poblacin es el conjunto de medidas, individuos u objetos que comparten una caracterstica en comn. La poblacin se basa en cuatro caractersticas: contenido, tipo de unidades y elementos, ubicacin espacial y ubicacin temporal. De la poblacin es extrada la muestra..

    Muestra es un conjunto de elementos extrados de la poblacin. Los resultados obtenidos en la muestra sirven para estimar los resultados que se obtendran con el estudio completo de la poblacin. Para que los resultados de la muestra puedan generalizarse a la poblacin, es necesario que la muestra sea seleccionada adecuadamente, es decir, de modo que cualquiera de los elementos de la poblacin tengan la misma posibilidad de ser seleccionados. A este tipo de muestra se le denomina muestra aleatoria.

    La unidad estadstica es el elemento de la poblacin que reporta la informacin y sobre el cul se realiza un determinado anlisis.

    Los datos son todas aquellas caractersticas o valores susceptibles de ser observados, clasificados y contados. Estos pueden ser experimentales, cuando se le aplica un tratamiento especial a las unidades muestreadas; de encuesta, cuando son tomadas sin ningn tratamiento; clasificados, cuando estn

  • 20

    UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

    agrupados segn una caracterstica determinada; originales, informacin que no ha recibido ningn tratamiento estadstico; primarios, cuando son recogidos, anotados u observados por primera vez; o secundarios, cuando son recopilados por otra persona o entidad diferente al investigador.

    Variable es una caracterstica susceptible de tener distintos valores en los elementos de un grupo o conjunto. Si la variable tiene la capacidad de tomar cualquier valor que exista entre dos magnitudes dadas, entonces esta variable ser continua. Si por el contrario, slo puede tener un valor de entre cierta cantidad de valores dados, entonces ser discreta.

    Parmetro son aquellos valores que caracterizan numricamente a la poblacin como tal. El parmetro poblacional de inters es nico (media, varianza, etc.), pero una poblacin puede tener muchas caractersticas o parmetros de inters. Por el contrario, un estadstico es una magnitud correspondiente a una muestra aleatoria extrada de la poblacin, por lo que cambiando la muestra cambiar entonces el estadstico (media muestral, varianza muestral, etc.). En pocas palabras se puede decir que parmetro es a poblacin como estadstico es a muestra. Es comn designar los parmetros con letras minsculas del alfabeto griego y los estadsticos con letras de nuestro alfabeto. En la Unidad Didctica Dos, se ampliar ms estos dos conceptos.

    La Universidad Nacional Abierta y a Distancia UNAD desea establecer cuntos estudiantes hacen uso de la biblioteca en el CEAD de San Juan de Pasto. El coordinador zonal de biblioteca es designado para este trabajo y decide hacer la investigacin el da 14 de mayo de 2005.

    En esta investigacin se considera que el total de estudiantes del CEAD que hacen uso de la biblioteca es la poblacin en estudio.

    Cada uno de los estudiantes seleccionados para la observacin representa la unidad estadstica de estudio de la poblacin.

    El da 14 de mayo de 2005 indica la ubicacin temporal. El CEAD de San Juan de Pasto, identifica la ubicacin espacial. Como el coordinador zonal de biblioteca no puede revisar todo el da

    quienes acceden a la biblioteca, decide entonces establecer perodos de tiempo para realizar el conteo. En otras palabras, selecciona una muestra.

    Identificada la poblacin y la muestra, se ubica la unidad estadstica, en este caso el objeto de medicin es cada uno de los estudiantes seleccionados de la muestra.

    EEJJEEMMPPLLOO 22..11..

  • 21

    UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

    Y la variable ser el nmero de estudiantes seleccionados de la muestra, como se puede ver, una variable discreta.

    Despus de esto el coordinador selecciona los datos necesarios para el estudio, en este caso especfico slo requerir del nmero de estudiantes que acceden a la biblioteca. Sin embargo, el coordinador zonal puede adems, tomar otro tipo de datos como sexo, edad, razn por la cual visita la biblioteca, libros ms consultados, etc.

    1.1.2.1 Aleatoriedad Y Representatividad de la muestra La muestra asociada a un estudio debe ser representativa y aleatoria. Representativa, pues debe estar formada por un nmero razonable de elementos y aleatoria porque debe ser escogida al azar, de tal manera que quien realiza el estudio no pueda influir en la eleccin de los individuos por encuestar.

    Cada elemento de la poblacin debe tener la misma oportunidad de ser seleccionado. El muestre aleatorio puede ser:

    1.1.2.2 Muestra aleatoria simple Si cada posible muestra de la poblacin, del mismo tamao, tiene igual probabilidad de ser seleccionada. 1.1.2.3 Muestra Aleatoria sistemtica Cuando los elementos son seleccionados de una manera ordenada. En este caso, la poblacin se encuentra organizada por algn cdigo ya sea por fecha, hora, orden de llegada o algn otro aspecto.

  • 22

    UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

    La manera en que se realiza la seleccin depende del nmero de elementos en la poblacin y el tamao de la muestra. 1.1.2.4 Muestra Aleatoria Estratificada Cuando la seleccin tiene en cuenta los diferentes grupos o estratos que conforman la poblacin. Los elementos de la muestra se seleccionan de cada grupo en forma aleatoria o por un mtodo sistemtico. Los estudios de la poblacin, basados en muestras estratificadas usualmente, tienen mayor precisin (o menor error muestral) que cuando se seleccionan por muestreo aleatorio simple. 1.1.2.5 Muestra Aleatoria de conglomerados Si para su seleccin se tiene en cuenta el siguiente procedimiento: En primer lugar, se divide la poblacin en grupos que sea conveniente para el muestreo. Luego, se selecciona una parte de los grupos al azar o por un mtodo sistemtico; por ltimo, se toman todos los elementos, o parte de ellos al azar o por un mtodo sistemtico, de los grupos seleccionados para conformar la muestra. Una muestra de conglomerados usualmente, produce un mayor error muestral que una muestra aleatoria simple del mismo tamao. Si la poblacin no tiene ninguna organizacin interna, entonces se dice que la muestra puede tomarse de forma aleatoria simple y todos los individuos de la poblacin tienen la misma probabilidad de ser seleccionados en la muestra.

    El comit cientfico de una reconocida multinacional de medicamentos desea promover un producto que ha sido efectivo en el tratamiento de la malaria en varios pases. Para esto dicho comit decide realizar una campaa en seis hospitales que estn ubicados en tres de las zonas colombianas donde se ha detectado la enfermedad. 1.1.2.6. Determinar: poblacin, muestra y tipo de muestreo a utilizar

    La poblacin est formada por todas las personas que habitan en Colombia

    EEJJEEMMPPLLOO 22..22..

  • 23

    UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

    y que han contrado la malaria. La muestra estar formada por los pacientes seleccionados en los seis hospitales y que adems tienen la enfermedad.

    Las zonas de mayor registro de contagio en Colombia son la costa pacifica, la costa atlntica y la Amazona. Dado que la poblacin est dividida en tres grandes zonas, es posible seleccionar dos hospitales por zona y luego en forma aleatoria, se puede seleccionar la muestra. Por ello, la muestra ser tomada de forma estratificada.

    Para mejorar el servicio a los usuarios, el director de un hospital realizar un estudio relacionado con el tipo de sangre que ellos tienen Dada la gran cantidad de pacientes a los cuales se les presta el servicio, decide encuestar a 400 de los usuarios que normalmente acuden al hospital en un mes.

    Determinar: poblacin, muestra y tipo de muestreo a utilizar

    La poblacin incluye a todos los usuarios que normalmente acuden al hospital en un periodo de un mes. La muestra estar formada por los 400 usuarios encuestados.

    En este caso, la caracterstica fundamental del estudio (el tipo de sangre) hace que no haya una distincin especial en la poblacin, lo cual indica que no se requiere de una estratificacin. Por ello, la muestra ser tomada de forma aleatoria simple.

    1.1.3. LECCIN 3. VARIABLES ESTADSTICAS Una variable es una caracterstica que va a sr estudiada en una poblacin. Una variable es estadstica, si se puede escribir como una pregunta cuyas respuestas pueden ser tabuladas o clasificadas en determinados rangos, o si pertenecen a una pregunta cuya respuesta tiene un valor correspondiente a una escala numrica. Las variables estadsticas se clasifican en cualitativas y cuantitativas

    EEJJEEMMPPLLOO 22..33..

  • 24

    UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

    1.1.3.1 VARIABLES CUALITATIVAS Una variable es cualitativa si en la caracterstica que se va a estudiar se busca conocer gustos, preferencias u opiniones, etc.; por ejemplo: tipo de sangre, gaseosa preferida, color de cabello. Una variable cualitativa es estadstica cuando es posible clasificar los datos obtenidos de la muestra en clases bien definidas, en las cuales el individuo que suministra la informacin pueda elegir una de ellas. Cuando una variable es cualitativa es necesario determinar las posibles respuestas. 1.1.3.2 VARIABLES CUANTITATIVAS Una variable es cuantitativa si la caracterstica que se va a estudiar se pude medir en una escala numrica.

    Si la variable tiene la capacidad de tomar cualquier valor que exista entre dos magnitudes dadas, entonces esta variable ser continua.

    Si por el contrario, slo puede tener una valor de entre cierta cantidad de valores dados, entonces ser discreta.

    1.1.3.3 ESCALA DE MEDIDA DE VARIABLES Una escala es la relacin numrica entre la longitud real y la longitud que se asigna en el plano en el cual se va a representar su grfica. Las variables cuantitativas pueden ser consideradas en diferentes escalas teniendo en cuenta las unidades asociadas a la poblacin que se encuentra en estudio. Los datos asociados a un estudio deben estar en las mismas unidades, de tal manera que sea posible asignarles una escala a todos. La notacin de una escala es de la forma 1 : n, lo cual indica que n unidades de medida estn representadas en el grfico e una sola.

  • 25

    UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

    Los profesores de Educacin Fsica de un colegio medirn la estatura de los nios de secundaria en cada uno de los grados. En este caso, la variable estatura es cuantitativa y continua ya que los datos que resultan son nmeros reales; es posible considerar las mediciones en centmetros o en metros. El profesor de educacin fsica puede usar un escala de 1 : 10 en la cual cada 10 centimetros de ltura estn representados en 1 cm del grfico. Suponiendo que los estudiantes de primaria tienen alturas entre 100 cm y 140 cm la representacin grfica de la escala 1:10 es la siguiente:

    _

    En cada una de las siguientes situaciones, identificar la variable de estudio. Determinar si es cualitativa o cuantitativa. 1. En un barrio de la ciudad se aplic una encuesta para conocer el consumo, en centmetros cbicos, del servicio de gas natural. 2. El alcalde de la ciudad quiere revisar la situacin de violencia intrafamiliar en las familias de estrato 3, 4, 5. 3. El nmero de hermanos de cada jugador del equipo de futboll. 4. En un caf gourmet, se decidi preguntar por el tipo de variedad que ms consumen sus clientes. Solucin 1. La variable es consumo de gas. Es cuantitativa y continua 2. La variable es situacin de violencia. Es cualitativa 3. La variable es nmero de hermanos. Es cuantitativa y discreta 4. La variable es variedad de caf. Es cualitativa.

    EEJJEEMMPPLLOO 33..22..

    EEJJEEMMPPLLOO 33..11..

  • 26

    UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

    1.1.4. LECCIN 4. CARACTERIZACIN DE UNA VARIABLE CUALITATIVA Caracterizar una variable significa describir su comportamiento en la poblacin, segn algunos parmetros establecidos. De acuerdo con el tipo de variable estadstica que se desee estudiar existen distintas tcnicas para caracterizarla.

    Una agencia de noticias quiere saber cul es el medio de comunicacin por el cul se informan las personas, sobe las noticias del pas. Para ello, realiz un estudio a cuarenta personas a quienes se les pregunt por su medio de informacin de noticias preferido. Se obtuvo la siguiente lista de datos.

    El tipo de variable que se registra en este estudio es cualitativa, puesto que pregunta por el medio de informacin. El estudio de una variable cualitativa requiere de la incorporacin de algunos criterios, de tal manera que al obtener una lista de preferencias, cualidades o gustos, se pueda analizar su comportamiento en la poblacin. Para caracterizar una variable cualitativa se utilizan tres herramientas:

    Tablas de frecuencias Representaciones grficas La moda

    1.1.4.1 TABLAS DE FRECUENCIAS: Una distribucin o tablas de frecuencias es un resumen de los datos en el cual, cada opcin de respuesta de la variable se relaciona con el nmero de datos correspondiente. Una tabla de frecuencias contiene:

    EEJJEEMMPPLLOO 44..11..

  • 27

    UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

    Clases: que corresponde a opiniones, gustos, preferencias, cualidades o caractersticas. Frecuencia: es el nmero de datos que pertenece a cada clase. La frecuencia se simboliza con f . El conteo de la frecuencia de cada clase se puede registrar mediante marcas en grupos. Frecuencia Relativa: es el cociente entre la frecuencia y el nmero total de datos, se simboliza fr . La frecuencia relativa representa un porcentaje, que se haya multiplicando por 100 al cociente indicado de la frecuencia relativa. La siguiente tabla de frecuencias corresponde a los datos de la variable medio de comunicacin del ejemplo 4.1

    Es necesario interpretar la informacin contenida en las tablas de frecuencia, para deducir cuales son las principales caractersticas de la variable en estudio. Por ejemplo, en la tabla anterior se puede apreciar que:

    La mayora de personas el 37.5% se informan de las noticias por medio de la televisin y la menor cantidad un 10,8% se informa haciendo uso de la internet.

    Hay un 52,5% de personas que se informan de las noticias haciendo uso de la radio o de la prensa.

    1.1.4.2 REPRESENTACIONES GRAFICAS: Un grfico estadstico es un resumen visual de la tabla de frecuencias. Hay varios tipos de representaciones grficas para las variables cualitativas: los diagramas de barras, los diagramas circulares, entre otros. 1.1.4.2.1 Diagramas de barras: un diagrama de barras es una representacin grfica de los datos asociados a una variable cualitativa.

  • 28

    UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

    La grfica se realiza en sistema de coordenadas cartesianas, en el eje horizontal se representan las clases correspondientes a la variable y en eje vertical se representan las frecuencias correspondientes a cada clase. El diagrama de barras (figura 1.1) correspondiente a la variable medios de comunicacin de nuestro ejemplo es el siguiente: FIGURA 1.1

    1.1.4.2.2 Diagrama Circular: un diagrama circular es la representacin grfica de los datos en un crculo. El diagrama circular presenta los porcentajes correspondientes a cada clase. En un diagrama circular, la informacin correspondiente a cada clase se representa usando sectores circulares, por lo cual es necesario hallar el ngulo correspondiente a cada frecuencia, (ver figura 1.2)

  • 29

    UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

    FIGURA 1.2

    1.1.4.3 MODA La moda es el dato que tiene mayor frecuencia, es decir, el dato que mas se repite. Para el ejemplo 4.1, la moda corresponde a informarse de las noticias por medio de la televisin; es decir, si se encuesta a una persona al azar la probabilidad que se informe por las noticas es alta, ya que corresponde al 37.5% del total. Hay estudios en los cuales no existe la moda, ya que todas las clases tiene una misma frecuencia, y hay casos en los cuales existen varias modas, pues varias clases pueden tener la misma frecuencia. 1.1.5. LECCIN 5. TABLAS DE CONTINGENCIA: En una tabla de contingencia o tabla cruzada las filas corresponden a las clases de una variable cualitativa y las columnas corresponden a las clases de la otra variable cualitativa. La tabla de contingencia, tambin es una tabla de frecuencias, ya que la informacin contenida en cada una de las casillas corresponde a la cantidad de personas o individuos que poseen ambas caractersticas. En general, la tabla de contingencia ofrece una completa distribucin de la informacin, ya que tiene en cuenta las diferentes clases que se pueden establecer para cada una de las variables en estudio.

  • 30

    UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

    Con el fin de determinar que materias opcionales, en deportes, se podran proponer a los estudiantes de una universidad, se hizo necesario hacer un estudio acerca de la actividad fsica que ellos realizan en su tiempo libre, para ello, hizo una encuesta entre 156 estudiantes de varias carreras y se les pregunt acerca de su deporte preferido para practicar en tiempo libre. Los resultados se muestran en la siguiente tabla de contingencia. (ver tabla 1.1)

    TABLA 1.1 TABLAS DE CONTINGENCIA

    En la tabla de contingencia se observa:

    Hay dos variables cualitativas que son gnero y deporte favorito

    Para la variable gnero hay dos clases hombre y mujer En la variable deporte preferido hay 5 clases: futbol, baloncesto, voleibol,

    atletismo y otros. correspondiente, al cruce de las clases de las dos variables en estudio. Por

    ejemplo el nmero 38 corresponde al nmero de mujeres que prefieren el baloncesto.

    Las sumas de filas corresponde a la cantidad de hombres y a la cantidad de mujeres que participaron en la encuesta, sin discriminar el deporte preferido. Se puede decir que participaron 72 hombres y 82 mujeres en el estudio.

    Las sumas de columnas corresponde a la cantidad de personas que prefieren cada uno de los deportes sin distinguir el gnero. Por ejemplo: hay 38 personas que prefieren futbol, 52 personas prefieren baloncesto, 29 personas prefieren el voleibol, 19 el atletismo y 18 personas prefieren otros deportes.

    El nmero total de personas que participaron en el estudio debe ser igual tanto en la suma correspondiente a la variable gnero (vertical), como en la suma correspondiente a la variable deporte preferido (horizontal). En ambos casos, la suma es 156 personas.

    A partir de la informacin de la tabla anterior se puede construir la tabla de

    EEJJEEMMPPLLOO 55..11..

  • 31

    UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

    contingencia de frecuencias relativas , en este caso se debe escribir un cociente entre la informacin contenida en cada celda y el nmero total de personas que participaron en la encuesta.

    TABLA 1.2 TABLA DE CONTINGENCIA DE FRECUENCIA RELATIVAS

    Ya que cada uno de los cocientes mostrados tiene su equivalencia en porcentaje, se puede construir la tabla de contingencias de porcentajes como se muestra en la tabla 1.3

    TABLA 1.3 TABLA DE CONTINGENCIA DE PORCENTAJES

    Un buen anlisis incluye la descripcin de los porcentajes ms altos, los mas bajos y aquellos que tiene mayor representacin.

    El 24.36% de la personas que fueron encuestadas fueron mujeres que prefieren practicar el baloncesto

    El 3,85% de los hombres se inclinan por el atletismo y el 1,92% de las mujeres prefieren el futbol, el cual es el porcentaje mas bajo de la muestra

    El deporte que mas practican independientemente del gnero, es el baloncesto con un 33.33%.

  • 32

    UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

    1.2. CAPITULO 2 .INVESTIGACIN ESTADSTICA La investigacin estadstica, por sencilla que sea, es una operacin compleja, que requiere atender mltiples aspectos, y que genera muy variadas funciones. El resultado depende en gran parte de la finalidad que se persiga, de la naturaleza de los fenmenos que se desean estudiar y de la facilidad que se tenga para observar los elementos. 1.2.1. LECCION 6. PLANEACIN

    La planeacin de una investigacin estadstica debe abarcar el conjunto de lineamientos, procedimientos y acciones que conlleven a la resolucin satisfactoria para la cual se estableci la investigacin. Es por ello que el plan de investigacin debe fijar concretamente su objeto, el fin que persigue, la fuente o fuentes de informacin, los procedimientos a seguir y resolver los aspectos logsticos, fsicos y humanos siguiendo un presupuesto de costos establecido.

    La investigacin estadstica puede ser tan sencilla y poco compleja como la recopilacin ordenada y coherente de datos que se encuentren en instituciones estatales o privadas que las suministren, o bien pueden ser tan elaboradas y complejas como lo son los censos poblacionales, los censos agrcolas o industriales que tengan importancia estratgica para una regin, o inclusive para un pas. Pero, sea como fuere, la investigacin debe seguir una orientacin en su planteamiento y resolucin.

    A continuacin se presentan algunos aspectos bsicos que se deben seguir para desarrollar un trabajo as. 1.2.1.1. Definicin del objeto de investigacin

    Debe responder el qu, el cmo y establecer el momento correcto para hacerse, debe tambin restringir el espacio fsico o geogrfico donde se llevar a cabo. Es este punto el ncleo de la investigacin, es por ello que no puede haber ambigedad en sus planteamientos y alcances.

  • 33

    UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

    1.2.1.2. Unidad de investigacin

    Se trata del elemento de la poblacin que origina la informacin. La unidad o elemento de investigacin debe ser clara, adecuada, mesurable y comparable.

    Debe determinarse la naturaleza cuantitativa o cualitativa de esta unidad, es

    decir, definir qu aspectos de la unidad de investigacin son cuantitativos (registrados por medio de nmeros) o cualitativos (recogidos mediante anotaciones literarias). Tambin ha de considerarse la posibilidad o viabilidad de la investigacin y si estos aspectos pueden ser conocidos con precisin. De igual manera, es necesario delimitar esta unidad en el tiempo y en el espacio, y a veces en el nmero. 1.2.1.3 Clase de investigacin

    En la planeacin, debe tambin tenerse en cuenta el tipo de investigacin que se va a realizar. sta puede ser descriptiva, que consiste en obtener informacin con respecto a grupos; experimental o controlada, provocada por el investigador en condiciones controladas, en la que se busca conocer por qu causa se produce un caso particular; o bien, explicada o analtica, que permite establecer comparaciones y verificar hiptesis. 1.2.1.4 Las fuentes de informacin

    Despus de determinar el qu y el por qu de la investigacin estadstica, se debe preguntar el dnde conseguir la informacin requerida. Se trata entonces de definir las fuentes de informacin. Estas pueden ser directas o indirectas.

    Una fuente de informacin estadstica directa es aquella en donde el hecho

    se produce. Este tipo de fuentes son las mejores, pero no siempre son posibles. Cuando no sea posible, se emplea una fuente de informacin estadstica indirecta, aquella donde el hecho se refleja. En muchos casos este tipo de fuentes son complementarias de las primeras.

    Cuando los datos son primarios, ellos pueden provenir de muchas fuentes

    como: hechos, informacin cotidiana y fcil de identificar; opiniones, referidos a lo que la gente piensa respecto a algo; motivos, razones que explican por qu se acta de una manera u otra. Cuando son secundarios ellos provienen de una fuente interna, cuando los datos son recopilados por la misma entidad en los registros bsicos de la misma organizacin, o bien pueden provenir de una fuente

  • 34

    UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

    externa, cuando los datos se recopilan por otra entidad diferente a la que hace la investigacin. 1.2.2. LECCION 7 RECOLECCIN

    Despus de planeada la investigacin, comienza la recoleccin de los datos. Esta consiste en un conjunto de operaciones de toma de datos que puede ser por observacin, por encuesta o tomada de publicaciones y/o fuentes confiables que han efectuado investigaciones estadsticas. Para esto se selecciona el mtodo de recoleccin de la informacin acorde a las necesidades de la investigacin, que se clasifican segn su cobertura y segn su forma de observacin. 1.2.2.3 Segn la cobertura

    Se trata de decidir si se va a estudiar a la poblacin en su totalidad o slo una parte de ella. Si lo que se desea es atender a una cobertura total, es decir contar con todos los elementos de las fuentes de informacin, se usa el censo. Si, en cambio, se hace una enumeracin parcial de las fuentes de informacin, se usa el muestreo.

    Por su menor costo, mayor rapidez y menor nmero de personas que

    intervienen en la investigacin, el muestreo es el mtodo ms utilizado. El muestreo puede ser de dos tipos: muestreo probabilstico o al azar, cuando cada uno de los elementos tiene la misma probabilidad de ser escogido obteniendo as una muestra aleatoria; y muestreo no probabilstico, cuando el investigador selecciona los datos a su propio criterio, de manera caprichosa, por conveniencia o por cuotas, de manera que las muestras no son seleccionadas aleatoriamente y los resultados no ofrecen confiabilidad alguna.

    1.2.2.4 Segn la forma de observacin

    En este mtodo se tiene en cuenta la forma de medicin del dato. Si se hace de manera que la fuente de informacin se da cuenta de la medicin que efecta, se dice que se toman los datos por encuesta. stas se pueden realizar por correo, entrega personal de cuestionario, entrevista, motivacin, telfono, etc.

    El otro mtodo de recoleccin de informacin es por observacin, en

    donde la medicin se realiza sin que la fuente de informacin se d cuenta del hecho. Este mtodo se basa en el registro de los eventos que ocurren, por ejemplo cuando se examina el nmero de estudiantes que entran a la biblioteca

  • 35

    UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

    con el fin de hacer una consulta referida a las Ciencias Sociales, simplemente se observa la accin del estudiante al entrar a la biblioteca: si hace o no la consulta que se investiga. Este mtodo puede ser tambin indirecto cuando la recoleccin consiste en corroborar los datos que otros han observado. 1.2.3. LECCION 8 ORGANIZACIN DE LA INFORMACIN

    Luego de tomar la informacin necesaria en la investigacin que se sigue, se obtiene una gran cantidad de datos que requieren ser interpretados y sobre los cuales se busca concluir algo especfico. Para esto se debe depurar y clasificar la informacin aplicando tcnicas adecuadas.

    La organizacin y el resumen de la informacin son dos procesos distintos

    que se desarrollan por separado. La organizacin hace referencia al arreglo de los datos en un formato lgico para su interpretacin. En cambio, el resumen implica la condensacin de varias mediciones en una forma compacta, ya sea grfica o numricamente. De ah que se tome primero la forma de organizar la informacin tomada en una investigacin estadstica.

    La informacin estadstica puede organizarse de diversas maneras:

    ordenando el conjunto de datos como una combinacin ordenada o en un arreglo denominado tallo y hojas, otro de los mtodos usados es el uso de tablas y ms especficamente la tabla de frecuencias. A continuacin se hace un acercamiento a las diferentes formas de organizar los datos estadsticos tomados en el proceso de recoleccin de una investigacin estadstica.

    1.2.4.1 Combinacin o arreglo ordenado

    El slo hecho de tener ordenado un conjunto de datos en forma ascendente o descendente, permite un rpido anlisis e interpretacin de estos.

    Los siguientes datos representan la evaluacin de los latidos cardacos de un grupo de 30 personas despus de cierta actividad fsica.

    82 95 92 62 85 92 82 95 70 85 84 95 91 82 94 76 88 91 87 80 68 58 76 85 110 60 75 88 64 74

    EEJJEEMMPPLLOO 88..11..

  • 36

    UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

    Es muy poca la informacin que arroja este conjunto de datos cuando se encuentran sin un tratamiento. A continuacin estos datos son presentados como una combinacin ordenada en forma ascendente (de menor a mayor):

    58 70 80 85 88 94 60 74 82 85 91 95 62 75 82 85 91 95 64 76 82 87 92 95 68 76 84 88 92 110

    A partir de esta lista ordenada se pueden concluir varias cosas:

    La ms alta evaluacin de latidos es 110

    La ms baja evaluacin de latidos es 58

    La mitad de la combinacin se encuentra entre 82 y 85

    Hay una predominancia en los latidos con una evaluacin entre 80 y 95

    Hay un vaco entre el valor 95 y el valor 110, es decir hay una cierta continuidad en los valores entre 58 y 95, pero 110 se encuentra ms alejado del grupo de datos.

    Hay una evaluacin atpica dentro del grupo de 30 personas, el que registra el valor 110. Es posible que esta persona tenga perturbaciones cardacas. Sin embargo, es necesario ampliar la informacin antes de lanzar un juicio apresurado.

    1.2.4.2 Arreglo de tallo y hojas El arreglo de tallo y hojas es una tcnica que resume de manera simultnea los datos en forma numrica y presenta una ilustracin grfica de la distribucin. Se trata de organizar los datos numricos en dos columnas divididas por una lnea vertical. La primera, denominada tallo, corresponder a las decenas, centenas o unidades que representan el grupo de datos y en la segunda, llamada hojas, irn las correspondientes decenas, unidades o dcimas. Para una mejor ilustracin, en el siguiente ejemplo se continuar con los datos del ejemplo 8.1. Para construir el correspondiente arreglo de tallo y hojas.

    Tomando la serie de datos del ejemplo 8.1., se puede observar que stos tienen un rango desde los cincuentas hasta los ciento diez. Ellos se pueden presentar como un arreglo de tallo y hojas en una columna de nmeros del 5 al 11 y trazando una lnea vertical a su derecha. Estos nmeros representarn el tallo. En

    EEJJEEMMPPLLOO 88..22..

  • 37

    UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

    la columna de las hojas, se enlistan las unidades (de manera ordenada) de cada uno de los datos registrados y correspondientes con su respectiva decena.

    Figura 2.1. Diagrama de tallo y hojas para los datos de pulsaciones del ejemplo 8.1.

    Tallo Hojas

    5 8 6 0 2 4 8 7 0 4 5 6 6 8 0 2 2 2 4 5 5 5 7 8 8 9 1 1 2 2 4 5 5 5 10 11 0

    Observe que el diagrama de tallo y hojas al mismo tiempo que ordena los datos de forma ascendente, permite una visualizacin del comportamiento de estos. Con este se pueden confirmar muchas de las afirmaciones que se hacan en el ejemplo 8.1.

    La mayora de los registros de latidos cardiacos del grupo de 30 personas se encuentra entre los ochentas.

    La forma general del conjunto de mediciones es asimtrico.

    Se ve ms claramente el vaco que existe entre los valores 95 y 110, y se resalta cmo el valor de 110 se encuentra aislado del resto de conjunto de datos.

    Si se quisiera clasificar ms ampliamente los datos, se usa un diagrama de doble tallo. Que consiste en dividir en dos cada posicin del tallo, en grupos de cinco hojas. La primera posicin del tallo dispone las hojas 0, 1, 2, 3, 4; y la segunda posicin dispone las hojas 5, 6, 7, 8, 9.

  • 38

    UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

    Figura 2.2. Diagrama de doble tallo y hojas para los datos

    de pulsaciones del ejemplo 8.1.

    Tallo Hojas

    5 5 8 6 0 2 4 6 8 7 0 4 7 5 6 6 8 0 2 2 2 4 8 5 5 5 7 8 8 9 1 1 2 2 4 9 5 5 5 10 10 11 0

    Observe ahora que esta subdivisin ms fina entrega ms detalles del conjunto de datos. Qu puede concluir usted? 1.2.4.3 Tabulacin de la informacin

    Una de las mejores tcnicas usadas en la estadstica es la elaboracin de tablas o cuadros. En ellos se plasman las series estadsticas, una sucesin de datos referentes a un fenmeno observado a travs del tiempo y del espacio.

    Una serie cronolgica es aquella donde se analiza un fenmeno a travs

    del tiempo en un espacio determinado. Por ejemplo, el nmero de egresados de la UNAD en el perodo 1994-2004 (ver tabla 2.1.)

  • 39

    UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

    Tabla 2.1. Nmero de egresados de la UNAD en el perodo 1994-2004

    Ao Nmero de egresados

    1994 338

    1995 424

    1996 556

    1997 971

    1998 1358

    1999 2119

    2000 3328

    2001 4357

    2002 3400

    2003 3697

    2004 4774

    Total 25322

    Una serie espacial es aquella donde se estudia un fenmeno a travs del espacio en un tiempo determinado. Por ejemplo, el total de estudiantes de la UNAD en la Zona Occidente en el primer semestre de 2005.

    Tabla 2.2. Clasificacin de estudiantes por CEAD en la Zona Occidente

    durante el primer semestre de 2005

    CEAD Nmero de estudiantes

    Medelln 1507

    Pereira 1850

    La Dorada 350

    Turbo 371

    Total 4078

  • 40

    UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

    Una serie cualitativa es aquella donde se estudia un atributo o caracterstica de la poblacin investigada, independiente del tiempo y del espacio. Por ejemplo, los empleados de una empresa clasificados por cargo.

    Tabla 2.3. Clasificacin de empleados por cargo

    Cargo Cantidad

    Administrador 1

    Jefe de produccin 1

    Contador 1

    Secretaria 2

    Supervisor 5

    Operario 45

    Vigilante 3

    Total 58

    Una serie cuantitativa es aquella donde se expresa numricamente un atributo o caracterstica de la poblacin en estudio, independiente del tiempo y del espacio. Por ejemplo, la estatura en centmetros de un grupo de estudiantes de quinto grado.

    Tabla 2.4. Clasificacin de la estatura de los estudiantes de un grupo de quinto grado

    Estatura (en centmetros)

    Nmero de estudiantes

    125 129 1

    129 133 4

    133 137 9

    137 141 24

    141 145 28

    145 149 22

    149 153 12

    Total 100

  • 41

    UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

    1.2.5 LECCIN 9 TABLAS DE DISTRIBUCION DE FRECUENCIAS

    1.2.4.1 Distribuciones de frecuencias

    Una tabla de frecuencias es otro de los formatos que se usan para organizar y resumir los datos. Para comprender la tcnica de la distribucin de frecuencias y dominar sus aplicaciones, es necesario manejar algunos conceptos con suficiente claridad. Y para ello se parte del concepto bsico en la distribucin de frecuencias: el nmero de veces que un dato se repite de un conjunto de datos se le denomina frecuencia.

    Un conjunto de datos puede organizarse de diferentes maneras. Una de

    ellas es construir una distribucin de frecuencias simple, que indica las frecuencias con que aparecen los datos. Es este el tipo de distribucin de frecuencias ms utilizado en estadstica, pues permite conocer el comportamiento de un conjunto determinado de datos y no se ocupa de detalles individuales que, en muchos casos, poco puede ayudar en la toma de decisiones.

    Continuando con la serie de datos del ejemplo 8.1., organice los datos en una distribucin de frecuencias simple.

    EEJJEEMMPPLLOO 99..11..

  • 42

    UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

    Tabla 2.5. Distribucin de frecuencias simple de latidos cardiacos de 30 personas

    Velocidad de pulsaciones

    Fre-cuencia

    Velocidad de pulsaciones

    Fre-cuencia

    Velocidad de pulsaciones

    Fre-cuencia

    58 1 76 2 94 1

    59 0 77 0 95 3

    60 1 78 0 96 0

    61 0 79 0 97 0

    62 1 80 1 98 0

    63 0 81 0 99 0

    64 1 82 3 100 0

    65 0 83 0 101 0

    66 0 84 1 102 0

    67 0 85 3 103 0

    68 1 86 0 104 0

    69 0 87 1 105 0

    70 1 88 2 106 0

    71 0 89 0 107 0

    72 0 90 0 108 0

    73 0 91 2 109 0

    74 1 92 2 110 1

    75 1 93 0 TOTAL 30

    Observe que esta manera de agrupar se vuelve engorrosa cuando se tienen

    muchsimos datos. Otra forma de organizar un conjunto de datos es construir una distribucin de frecuencias agrupadas, que indica las frecuencias con que aparecen los datos agrupados en lo que se denomina intervalos de clase. Cada intervalo de clase est limitado por dos valores, llamados lmites de clase (lmite inferior y lmite superior). La diferencia entre estos lmites en cada intervalo de clase se denomina ancho, tamao o amplitud del intervalo de clase.

    Clase es, entonces, un grupo que presenta una caracterstica comn

    cuantificable del conjunto de datos. El valor correspondiente al punto medio de un intervalo de clase es la marca de clase y su valor es igual a la mitad de la suma de los lmites de clase del intervalo de clase. Y se interpreta como el valor que corresponde asignar a cada uno de los elementos del intervalo de clase.

    El rango o recorrido es la diferencia entre los valores extremos de todo el

    conjunto de datos; en l se encuentran distribuidos todos los datos.

  • 43

    UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

    En la construccin de la distribucin de frecuencias se deben responder a estos interrogantes fundamentales: Cuntos intervalos de clase crear?, Cul debe ser el tamao de cada intervalo?, Qu propiedades posee cada intervalo? Las siguientes pautas resuelven estas inquietudes.

    Hallar el rango (R) o recorrido del conjunto de datos.

    Seleccionar el nmero de intervalos de clase (k). Este nmero depende de la cantidad de datos disponibles. Una de las tcnicas usadas es la Regla de Sturges (desarrollada por H. A. Sturges en 1926). Esta regla afirma que el

    nmero de intervalos de clase (k), viene dado por:

    nk log322.31

    donde n es el tamao de la muestra. Si de este clculo resulta un nmero decimal, ste de redondearse al entero superior. Esta frmula ha sido usada para obtener los nmeros de intervalos de clase que aparecen en la tabla 2.6. y que permite sugerir el nmero de intervalos de clase que debe usarse de acuerdo al tamao de la muestra. De esta manera, el clculo del nmero de intervalos de acuerdo al tamao de la muestra, puede determinarse bien por la Regla de Sturges o bien por la tabla 2.6.

    Hallar el ancho o amplitud del intervalo de clase (A). Los intervalos de clase tienen por lo general el mismo ancho, de modo que al fijarse el nmero de clases se obtiene ste por una operacin aritmtica simple:

    k

    RA

    donde R es el rango o recorrido y k es el nmero de clases. Si este cociente no es un entero, conviene redondear al entero superior. De manera que el rango es alterado y requiere, por tanto, efectuar un ajuste:

    ))((* kAR

    Con este nuevo rango, se tendr entonces un exceso que deber distribuirse entre el lmite superior y el lmite inferior. Este exceso es calculado restando el rango del nuevo rango.

    *RRExceso

  • 44

    UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

    Este valor debe distribuirse lo ms equitativo posible, esto no quiere decir que sea repartido en partes iguales a los datos extremos, se trata de distribuir el exceso entre el lmite inferior y el lmite superior de modo que sea considerado la tendencia general de los datos.

    Formar los intervalos de clase. Se agrega 1A al lmite inferior de cada clase, iniciando por el lmite inferior del rango.

    Fijar los lmites reales de cada intervalo de clase. Dado que los intervalos de clase son mutuamente excluyentes, es decir, no permiten ambigedad en los lmites cuando estos se repiten como inferior de un intervalo y como superior en el siguiente intervalo, se determinan los lmites reales de clase. Estos corresponden al punto medio entre el lmite superior de una clase y el lmite inferior de la clase siguiente. En muchos casos se permite que se repita el lmite superior de una clase y el lmite inferior de la clase siguiente, haciendo la salvedad de cul clase ser tomada por dicho lmite. En general, es considerado el lmite superior de la clase como valor de esta.

    Determinar la frecuencia de clase. Contando el nmero de observaciones que cae dentro de cada intervalo de clase.

    Construir la tabla de distribucin de frecuencias agrupadas.

    Tabla 2.6. Nmero de intervalos de clases sugerido en funcin del tamao de la muestra

    Tamao muestral Nmero de intervalos de clase

    Menos de 16 Datos insuficientes 16 31 5 32 63 6 64 127 7 128 255 8 256 511 9 512 1023 10 1024 2047 11 2048 4095 12 4096 8190 13

  • 45

    UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

    Para los datos del ejemplo 8.1. Elabore una tabla de distribucin de frecuencias agrupada. Para esto, se seguirn los pasos propuestos:

    Rango = 110 58 = 52

    Nmero de clases. Aplicando la Regla de Sturges:

    691.530log322.31 k

    Si se usa la tabla 2.6., esta indica que deben usarse 5 clases. Queda a criterio del investigador la decisin. En este caso se trabajar con el resultado que arroja la Regla de Sturges.

    Amplitud de los intervalos de clase.

    967.86

    52A

    Como se ha redondeado, debe hallarse el nuevo rango:

    54)6)(9(* R

    Existe pues un exceso de 2, [54 52 = 2]. Este exceso debe distribuirse quitando 1 al lmite inferior y agregando 1 al lmite superior:

    1111110

    57158

    mx

    mn

    X

    X

    Si en el clculo del exceso, este hubiera sido un nmero impar, la distribucin entre los lmites se calculara considerando hacia dnde se agrupan ms los datos. En este caso, los datos tienen una mayor tendencia hacia el lmite inferior de modo que el exceso mayor se repartira en l.

    Intervalos de clase. Se agrega 8191 A al lmite inferior de cada clase, iniciando por el lmite inferior del rango. As: 57 + 8 = 65 66 + 8 = 74 75 + 8 = 83 84 + 8 = 92 93 + 8 =101 102+8 =110

    EEJJEEMMPPLLOO 99..22..

  • 46

    UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

    Lmites reales. 56.5, 65.5, 74.5,, 110.5. Que se obtiene de calcular la suma de cada lmite y dividirlo entre dos. As:

    ...5.742

    75745.65

    2

    66655.56

    2

    5756

    Frecuencias de clase en cada intervalo.

    Tabla 2.7. Distribucin de frecuencias agrupadas de la velocidad de pulsaciones

    Intervalos de clase (Velocidad de pulsaciones)

    Frecuencia (Nmero de personas)

    56.5 65.5 4

    65.5 74.5 3

    74.5 83.5 7

    83.5 92.5 11

    92.5 101.5 4

    101.5 110.5 1

    Total 30

    Al obtener la tabla de distribucin agrupada como en el ejemplo 9.2., son

    muchos los interrogantes que continan sin responderse como: Qu porcentaje del grupo de personas evaluadas presentan pulsaciones entre 74.5 y 83.5? La tabla 2.7. indica que son 7 personas pero Qu porcentaje es ese? Y, ms an Qu porcentaje de la muestra presentan, por ejemplo, pulsaciones menores de 92.5?

    Cuando se habla de la frecuencia de una clase, se refiere a la frecuencia absoluta, pero si sta se da en trminos del total de frecuencias se tiene entonces la frecuencia relativa. Esta se obtiene en porcentaje al dividir la frecuencia de clase entre el nmero total de frecuencias (o tamao de la muestra).

    100n

    ffr

    donde fr es la frecuencia relativa de clase, f es la frecuencia absoluta de clase y n es el tamao de la muestra. En la tabla 2.8. de distribucin de frecuencias

  • 47

    UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

    agrupadas de los datos del ejemplo 8.1., se calculan las correspondientes frecuencias relativas de cada intervalo de clase.

    Tabla 2.8. Distribucin de frecuencias absolutas, relativas y

    acumuladas ascendentes de la velocidad de pulsaciones

    Intervalos de clase (Velocidad de pulsaciones)

    Frecuencia (Nmero de personas)

    Frecuencia relativa (%)

    Frecuencia absoluta acumulada Ascendente

    Frecuencia relativa acumulada Ascendente

    56.5 65.5 4 13.3% 4 13.3%

    65.5 74.5 3 10% 7 23.3%

    74.5 83.5 7 23.4% 14 46.7%

    83.5 92.5 11 36.7% 25 83.4%

    92.5 101.5 4 13.3% 29 96.7%

    101.5 110.5 1 3.3% 30 100%

    Total 30 100%

    La distribucin de frecuencias acumuladas se construye con el clculo de la frecuencia absoluta acumulada y la frecuencia relativa acumulada. La primera es la acumulacin sucesiva en forma descendente o ascendente de las frecuencias absolutas. Si la frecuencia absoluta acumulada es ascendente, la primera frecuencia absoluta corresponder a la primera frecuencia absoluta acumulada. La segunda acumulada se obtiene sumando las dos primeras absolutas, y as sucesivamente. La ltima frecuencia absoluta acumulada corresponder al nmero total de frecuencias.

    De la misma manera, la frecuencia relativa acumulada es una acumulacin

    sucesiva en forma ascendente o descendente de frecuencias relativas. Si es ascendente, la ltima frecuencia relativa acumulada tendr un valor del 100%. En la tabla 2.8. se expresan estos tipos de frecuencia tomando los datos del ejemplo 8.1.

    Esta tabla arroja informacin tan completa que permite concluir afirmaciones tales como:

    El 36.7% de las personas evaluadas registran pulsaciones entre el 83.5 y 92.5 y slo el 3.3% registran valores altos, entre 101.5 y 110.5.

  • 48

    UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

    De las 30 personas, 25 de ellas no superan registros de 92.5 pulsaciones; esto corresponde al 83.4% del total. Construya la distribucin de frecuencias absoluta acumulada descendente y

    relativa acumuladas descendente con los datos de la velocidad de pulsaciones. Qu porcentaje de la muestra registra valores superiores a 92.5? A cuntas personas corresponde? Qu porcentaje registra valores de ms de 75? 1.2.5 LECCIN 10 PRESENTACIN DE LA INFORMACIN

    Anteriormente se mencion que la organizacin y el resumen de la informacin son dos procesos distintos que se ejecutan en forma independiente. Ya se ha desarrollado todo cuanto tiene que ver con la organizacin de la informacin, se ver ahora lo que implica el resumen o presentacin de la informacin. Se trata pues de conocer algunas tcnicas de construccin de grficas, que es la mejor manera para resumir una investigacin estadstica.

    A continuacin, se tratarn las partes ms fundamentales de una grfica y

    los aspectos a tener en cuenta para su construccin, luego se presentarn los distintos tipos de grficas usadas ms comnmente en estadstica entre las cuales se encuentran el histograma, el polgono de frecuencias, la ojiva, los grficos de puntos, lineales, de barras y circulares y los pictogramas. 1.2.5.6 Componentes de una grfica

    Cuando se disea una grfica, sea esta cual fuere, deben tenerse en cuenta ciertos aspectos con el fin de mejorar su apariencia y mostrar con claridad lo que se quiera que ella refleje.

    Una grfica siempre debe poseer un ttulo que indique la descripcin del contenido de ella. En muchas ocasiones, es importante indicar la escala con la que se trabaja. Es decir, identificar los ejes coordenados (X y Y) e indicar sus magnitudes correspondientes. La escala se aplica para saber la dimensin del fenmeno graficado. Otro aspecto importante a tener en cuenta es la fuente de informacin, que indique de dnde han sido tomados los datos incluyendo el tipo de publicacin, el ao del registro y otros indicadores que resulten importantes para la investigacin.

    La forma y el tipo de la grfica que se seleccione depende en gran parte del investigador o de quien la elabora, sin embargo debe tenerse en cuenta para

  • 49

    UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

    quin va dirigida sta, el lugar de exposicin y otros factores de logstica que intervienen en la decisin del mejor diseo. Existen ciertos principios generales que se deben tener en cuenta en el logro de una buena grfica:

    Si en la investigacin se tienen varias grficas, estas deben estar enumeradas en forma consecutiva.

    Toda grfica debe tener un ttulo que aclare su contenido.

    En los diagramas, las lneas de la ordenada y la abscisa que llevan escala, deben ser ms gruesas que las dems.

    La mejor grfica es la ms sencilla. Evite saturar la grfica de datos o textos innecesarios. Haga uso de slo lo estrictamente necesario.

    La grfica no sustituye el cuadro o la tabla, debe ser el complemento.

    Toda grfica debe ir acompaada de convenciones para identificar las caractersticas que se grafican.

    La lectura de la escala del eje horizontal se hace de izquierda a derecha y la del eje vertical se hace de abajo hacia arriba.

    La representacin del hecho debe variar slo en una dimensin.

    En toda grfica se debe explicar la fuente de donde fueron obtenidos los datos, aclarar las escalas, leyendas, notas, llamadas y convenciones que ayuden a identificar e interpretar las caractersticas presentadas.

    Las grficas nunca preceden al texto. 1.2.5.7 Diagrama de frecuencias

    Los diagramas de frecuencia se representan por medio de lneas verticales, cuya altura est dada por los valores de las frecuencias, ya sean absolutas o relativas. Si la representacin se refiere a las frecuencias acumuladas (absolutas o relativas), esta se har por medio de lneas horizontales, ubicando en el eje vertical los valores de la frecuencia acumulada. Este ltimo diagrama, denominado diagrama de frecuencias acumuladas, genera una serie de lneas horizontales que dan la sensacin de los peldaos de una escalera.

  • 50

    UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

    Tabla 2.9. Distribucin de frecuencias simple

    de visita al odontlogo de nios entre los 6 y 12 aos

    Edad del nio (Aos)

    Frecuencia absoluta (Nmero de visitas)

    Frecuencia absoluta acumulada

    2 3 3

    3 1 4

    4 2 6

    5 3 9

    6 7 16

    7 9 25

    8 4 29

    9 0 29

    10 1 30

    11 0 30

    12 0 30

    Total 30

    Esta tabla de frecuencias indica las veces que un grupo de 30 nios de 6 a 12 aos de edad visit en los ltimos 6 meses al odontlogo. Construya un diagrama de frecuencias absolutas y un diagrama de frecuencias absolutas acumuladas.

    Figura 2.3. Diagrama de frecuencias absolutas

    de visita al odontlogo de nios entre los 6 y 12 aos

    EEJJEEMMPPLLOO 1100..11

    111100..111100..11

    0

    1

    2

    3

    4

    5

    6

    7

    8

    9

    10

    0 2 4 6 8 10 12 140

    1

    2

    3

    4

    5

    6

    7

    8

    9

    10

    0 2 4 6 8 10 12 14Edad

    Frecuencia

  • 51

    UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

    Figura 2.4. Diagrama de frecuencias absolutas acumuladas

    de visita al odontlogo de nios entre los 6 y 12 aos

    En las figuras 2.3. y 2.4. se reflejan los diagramas de frecuencia absoluta y frecuencia absoluta acumulada, respectivamente. Obsrvese que a partir de la figura 2.3. rpidamente se puede concluir que los nios de 7 aos de edad son los que ms han asistido al odontlogo en los ltimos seis meses de la muestra tomada. De igual manera se percibe un agrupamiento a la izquierda de los datos, es decir no es simtrica la grfica. Este tipo de grficos suelen llamarse asimtricos sesgados a la izquierda. En la figura 2.4. las dos ltimas lneas horizontales son de mayor tamao que las dems, esto se debe a que no hay registro de nios que asisten al odontlogo con edades de 9, 11 y 12 aos. Se puede ver tambin que estas dos ltimas lneas estn menos separadas que las otras, pues el salto se debe a que existe un nio de la muestra de 10 aos que s ha asistido al odontlogo. En cambio, existe un gran salto a los 7 aos, sabe usted por qu? 1.2.5.8 Histograma de frecuencias

    En el caso de las distribuciones de frecuencia agrupada, la forma de representacin grfica ms comn, se conoce con el nombre de histograma de frecuencias. Estos se construyen representando los intervalos de clase en la

    0

    5

    10

    15

    20

    25

    30

    35

    0 1 2 3 4 5 6 7 8 9 10 11 12 130

    5

    10

    15

    20

    25

    30

    35

    0 1 2 3 4 5 6 7 8 9 10 11 12 13Edad

    Frecuencia

  • 52

    UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

    escala horizontal y las frecuencias de clase (absolutas o relativas) en la escala vertical y trazando rectngulos cuyas bases equivalen a la amplitud de los intervalos de clase y sus alturas corresponden a las frecuencias de cada clase.

    En la figura siguiente se registra el diagrama de frecuencias absolutas del

    grupo de datos del ejemplo 8.1. Ntese el origen o punto de partida de la variable es cero y luego aparece un corte o puente, de manera que permite acortar la distancia entre el origen y el primer valor de la variable. Esta convencin tambin puede usarse en el eje vertical u ordenada.

    Figura 2.5. Histograma de frecuencias absolutas de la velocidad de pulsaciones

    1.2.5.9 Polgono de frecuencias

    Describe tambin la informacin de la distribucin de frecuencias absolutas o relativas. Pero se grafican las marcas de clase de