Módulo Estadística I

download Módulo Estadística I

of 84

description

Contiene los elementos mínimos para desarrollar el curso de Estadísitica I.

Transcript of Módulo Estadística I

TABLA DE CONTENIDO

Estadstica I

Programas de Estudio a Distancia

www.unipamplona.edu.co

Esperanza Paredes HernndezRectoraMara Eugenia Velasco EspitiaESTADISTICA I_________________________________________________________________________Decana Facultad de Estudios a Distancia_________________________________________________________________________UNIVERSIDAD DE PAMPLONA-.Facultad de Estudios a Distancia

Tabla de Contenido

PresentacinIntroduccin

UNIDAD 1: Generalidades de la EstadsticaNcleos Temticos y ProblemticosProceso de Informacin1.1.DEFINICIN1.1.1Importancia1.1.2Poblacin1.1.3Muestra1.1.4Mtodos de Seleccin de una Muestra al Azar1.1.5Unidad Estadstica1.2ESTADSTICA DESCRIPTIVA DISTRIBUCIN DE FRECUENCIAS 1.2.1Recoleccin de Datos1.2.2 Intervalos1.2.3 Amplitud1.2.4 Frecuencia de Clase o Frecuencia Absoluta1.2.5 Marca de Clase (X)1.2.6 Frecuencia Relativa (Fr)1.2.7 Frecuencia Acumulada (Fa)1.2.8 Frecuencia Relativa Acumulada (Fra)Proceso de Comprensin y Anlisis

UNIDAD 2: Medidas de Tendencia CentralNcleos Temticos y ProblemticosProceso de Informacin2.1PRIMER CASO: CUANDO LOS DATOS NO ESTN AGRUPADOS2.1.1 Media Aritmtica2.1.2 Mediana2.1.3 Moda2.2 SEGUNDO CASO: CUANDO LOS DATOS ESTN AGRUPADOS2.2.1 Media Aritmtica2.2.2 Mediana2.2.3 ModaProceso de Comprensin y AnlisisUNIDAD 3: Medidas de DispersinNcleos Temticos y ProblemticosProceso de Informacin3.1DESVIACIN ESTNDAR O TPICA3.2VARIANZA3.3COEFICIENTE DE VARIACINProceso de Comprensin y Anlisis

UNIDAD 4:Medidas de UbicacinNcleos Temticos y ProblemticosProceso de Informacin4.1 CUARTILES, PERCENTILES Y DECILES4.2 DIAGRAMAS DE CAJAProceso de Comprensin y Anlisis

UNIDAD 5: Presentacin de la InformacinNcleos Temticos y ProblemticosProceso de Informacin5.1HISTOGRAMA5.2POLGONOS DE FRECUENCIA5.3OJIVAS5.4BARRAS5.4.1Barras Verticales5.4.2Barras HorizontalesProceso de Comprensin y Anlisis

ANEXO: Tablas

BIBLIOGRAFA GENERAL

Presentacin

La educacin superior se ha convertido hoy da en prioridad para el gobierno Nacional y para las universidades pblicas, brindando oportunidades de superacin y desarrollo personal y social, sin que la poblacin tenga que abandonar su regin para merecer de este servicio educativo; prueba de ello es el espritu de las actuales polticas educativas que se refleja en el proyecto de decreto Estndares de Calidad en Programas Acadmicos de Educacin Superior a Distancia de la Presidencia de la Repblica, el cual define: Que la Educacin Superior a Distancia es aquella que se caracteriza por disear ambientes de aprendizaje en los cuales se hace uso de mediaciones pedaggicas que permiten crear una ruptura espacio temporal en las relaciones inmediatas entre la institucin de Educacin Superior y el estudiante, el profesor y el estudiante, y los estudiantes entre s.

La Educacin Superior a Distancia ofrece esta cobertura y oportunidad educativa ya que su modelo est pensado para satisfacer las necesidades de toda nuestra poblacin, en especial de los sectores menos favorecidos y para quienes las oportunidades se ven disminuidas por su situacin econmica y social, con actividades flexibles acordes a las posibilidades de los estudiantes.

La Universidad de Pamplona gestora de la educacin y promotora de llevar servicios con calidad a las diferentes regiones, y el Centro de Educacin Virtual y a Distancia de la Universidad de Pamplona, presentan los siguientes materiales de apoyo con los contenidos esperados para cada programa y les saluda como parte integral de nuestra comunidad universitaria e invita a su participacin activa para trabajar en equipo en pro del aseguramiento de la calidad de la educacin superior y el fortalecimiento permanente de nuestra Universidad, para contribuir colectivamente a la construccin del pas que queremos; apuntando siempre hacia el cumplimiento de nuestra visin y misin como reza en el nuevo Estatuto Orgnico:

Misin: Formar profesionales integrales que sean agentes generadores de cambios, promotores de la paz, la dignidad humana y el desarrollo nacional.

Visin: La Universidad de Pamplona al finalizar la primera dcada del siglo XXI, deber ser el primer centro de Educacin Superior del Oriente Colombiano.Maria Eugenia Velasco Espitia Directora CEDUP

Introduccin

La importancia que tiene la matemtica en el desarrollo de los procesos intelectuales del hombre es notoria a travs de su historia. Fue as como en la antigedad el pensamiento matemtico contribuy a resolver problemas en tareas econmicas y constructoras de diferentes pueblos, dio la base para revelar tos misterios del mundo, es decir, dar explicaciones razonables para alcanzar la verdad de los fenmenos que lo suceden. Contrariamente a los griegos, los hombres de la edad media utilizaron el contenido matemtico como una simple rutina para disciplinar la mente. Sin embargo, a partir de los trabajos de Galileo, la matemtica en la edad moderna ayud a buscar explicaciones concretas de problemas que se daban en ingeniera, construccin y otras actividades prcticas del hombre.

Por tal motivo, gracias al medio, las personas estn rodeadas constantemente por un conjunto de experiencias, que manejan y manipulan de una manera sorprendente. Es decir, en cierta forma se est efectuando una serie de operaciones: recoge, organiza, analiza e interpreta esas informaciones mediante unas representaciones significativas para l y as se obtiene una serie de conclusiones razonables.

Esta informacin que de cierta manera se manipula, se debe matematizar. Es decir, seguir un procedimiento para poder tabular la informacin, presentarla y as hacer el anlisis respectivo para dar las conclusiones pertinentes al estudio que se est realizando.

La Estadstica es utilizada en casi todas las ramas de la ciencia moderna, as como en muchos otros campos de la actividad humana. Como dijo Salomn Fabricant todo el mundo parece hoy coincidir en que la Estadstica puede ser til para comprender, evaluar y controlar el funcionamiento de la sociedad. En nuestra sociedad, el progreso puede medirse mediante diversos ndices numricos, la estadstica se utiliza para describir, manipular e interpretar estos nmeros.

An cuando los tipos de problemas a los cuales puede aplicarse la Estadstica como herramienta fundamental para el anlisis e interpretacin de resultados son bastante heterogneos, en muchos casos los pasos de una investigacin estadstica son los siguientes:Primera etapa: formulacin del problema. Para investigar con xito un problema dado, primero se tienen que crear conceptos precisos, formular preguntas claras e imponer limitaciones adecuadas al problema, tomando en cuenta el tiempo, dinero disponible y la habilidad de los investigadores.Segunda etapa: diseo del experimento. Nuestro deseo es obtener un mximo de informacin empleando un mnimo de costo y tiempo. Esto implica, entre otras cosas, que se debe determinar el tamao de la muestra o la cantidad y tipo de datos que resolvern ms eficientemente el problema. A la vez este tamao ser afectado por el mtodo empleado para la seleccin de la muestra representativa.

Con respecto a la representatividad de la muestra, se debe observar que no es fcil obtener selecciones que sean completamente aleatorias. Existe el peligro de que una seleccin pueda ser preferida en alguna forma. Se han propuesto varios mtodos para vencer esta dificultad y se han usado en la prctica. Se considera este punto dentro del desarrollo del mdulo.

Tercera etapa: experimentacin o recoleccin de datos. En general, sta es la parte que ms tiempo consume en toda investigacin que sea realizada, sta debe sujetarse a reglas estrictas. De hecho, cuanto menos opiniones impongamos, sern mejores los resultados.

Cuarta etapa: tabulacin y formulacin de la respuesta. Al aplicar el mtodo estadstico antes mencionado, se obtienen conclusiones a partir de la muestra, acerca de la poblacin correspondiente. Es decir, se va a inferir sobre la muestra y se trata de sacar conclusiones para la poblacin. Es esta etapa la que le da el objetivo final a la estadstica, puesto que se van a tomar decisiones con base en los resultados obtenidos en el estudio descriptivo de la muestra.

No existe una frmula mgica ni nica en estadstica que tome en cuenta todas las situaciones prcticas concebibles. Por lo cual es necesario adquirir conocimientos generales de los mtodos ms importantes para hacer inferencias. En cada caso prctico debe situarse con cuidado la naturaleza del problema especfico, para estar seguros de que ser escogido el mtodo ms apropiado.

Con el apoyo del computador los clculos matemticos se hacen ms fciles, por lo tanto se recomienda utilizar e integrar un software apropiado para tal fin. En la actualidad existen varios paquetes estadsticos sencillos de manejar, tales como el Statgraphics, Sas, Minitab, Spss.

De comn acuerdo con su Tutor se pueden desarrollar los ejercicios propuestos al final de cada tema, se puede utilizar calculadora y computador para facilidad de los clculos.84

ESTADISTICA BASICA

UNIVERSIDAD DE PAMPLONA Facultad de Estudios a Distancia

UNIDAD 1: Generalidades de la Estadstica

Ncleos Temticos y Problemticos

Definicin Estadstica Descriptiva Distribucin de Frecuencias

Proceso de Informacin

1.1 DEFINICIN

Al evolucionar las ciencias, pierden sus rasgos primitivos, se transforman, dividen y an cambian de nombre. Como ciencia que es, la estadstica ha sufrido igual proceso y para comprender su estado actual y su campo de actividades se necesita conocer algo de su historia. Se considera fundador de la estadstica a Godofredo AchenwalL profesor y economista alemn (1719 - 1772) quien, siendo profesor de la universidad de Leipzig, escribi sobre el descubrimiento de una nueva ciencia que lamo estadstica (palabra derivada de Staat que significa gobierno) y que defini como el conocimiento profundo de la situacin respectiva y comparativa de cada estado Achenwa y sus seguidores estructuraron los mtodos estadsticos que se orientaron a investigar, medir y comparar las riquezas de las naciones Lo anterior no significa que antes de los estudios de Godofredo Achenwa, los estados no hubiesen efectuado inventarios de sus riquezas; estos invntanos o censos se efectuaron desde la antigedad. Se sabe que 2000 a 2500 aos antes de Cristo, los chinos y los egipcios efectuaron censos que eran simples inventarios elementales Desde su creacin la estadstica se ha enriquecido continuamente con los aportes de matemticos, filsofos y cientficos.

Adems, en un principio se consideraba que la funcin de a estadstica era la descripcin de las caractersticas de un grupo, de observar y describir el hecho En su origen la estadstica era histrica: hoy en da, la estadstica, adems de ser descriptiva, es analtica, considerndose esta ltima como la funcin ms importante que realiza, ya que permite obtener conclusiones para un grupo mayor, denominado poblacin, partiendo de una investigacin realizada en un grupo menor, denominado muestra.

Las siguientes son unas definiciones que ayudan a determinar el sentido de la estadstica:

Dicaonano de Webster una rama de las matemticas que trata de la recopilacin, el anlisis, la interpretacin y la presentacin de una gran cantidad de datos numricos.'

Kendall y Stuart la estadstica es la rama del mtodo cientfico que traa de los datos reunidos al contar o medir las propiedades de alguna poblacin.

Fraser la estadstica trata con mtodos para obtener conclusiones a partir de los resultados de los experimentos o procesos."

Al unir estas definiciones, se puede notar que a partir de la recopilacin de datos se pueden hacer inferencias con respecto a resultados de experimentos. Es decir a partir de un conjunto de mtodos, normas, reglas y de principios para observar, agrupar, describir, cuantificar y analizar el comportamiento de un grupo.

Es entonces, un campo parcial de la Matemtica aplicada a un conjunto de objetos que se asignan valores numricos y luego estos se siguen elaborando matemticamente.

Matemticamente los procedimientos estadsticos estn muy desarrollados y asegurados en el plano de la teora, por ejemplo, mediante la indicacin de mbitos dentro de los cuales puede suponerse o rechazarse una hiptesis. Se acostumbran a distinguir dos clases de Estadstica, la descriptiva y la de inferencia.

1.1.1Importancia

La teora general de la estadstica es aplicable a cualquier campo cientfico en el cual se hacen observaciones el estudio y aplicacin de los mtodos estadsticos son necesarios en todos (los campos del saber, sean estos de nivel tcnico o cientfico). Es obvio que en cada campo se aplican o desarrollan procedimientos especficos, como aplicaciones particulares a variantes de la teora general. Las primeras aplicaciones de la estadstica fueron los asuntos de gobierno, luego las utilizaron las compaas de seguros y los empresarios de juegos de azar, despus siguieron los comerciantes, los industriales, los educadores, etc.

Es por tanto que las tcnicas estadsticas se utilizan en casi todos los aspectos de la vida:

Se disean encuestas para recoger informacin y as poder predecir algn suceso. Los experimentos que se hacen para determinar el mtodo apropiado paracurar cierta enfermedad. La duracin, intensidad, extensin de las lluvias, tormentas o granizos, las Temperaturas, la intensidad y direccin del viento son variables aleatorias.

1.1.2Poblacin

Es el conjunto de elementos que se toma de referencia para el estudio que se desea investigar la ocurrencia de una caracterstica o propiedad. Los elementos que integran la poblacin pueden pertenecer a personas, objetos o cosas. Segn sea el tamao, la poblacin puede considerarse como finita o infinita.

Es poblacin finita cuando el nmero de elementos que la componen es limitado; infinita cuando consta de infinitos elementos.

Ejemplo

La poblacin consistente en todas las tuercas producidas por una fbrica en un da especfico, los estudiantes matriculados en un colegio, son poblaciones finitas; mientras que la determinada por todos los posibles resultados (caras, cruces) de sucesivas tiradas de una moneda, las personas que hoy y en el futuro subscriban un seguro de vida, las piezas fabricadas por una mquina, son poblaciones infinitas, cantidad de carros que transitan por un peaje en un tiempo determinado es finita pero si no se especifica este tiempo es entonces infinita.

1.1.3Muestra

Se considera como muestra el subconjunto de elementos que pertenecen a la poblacin objetivo sobre los cuales se recoger la informacin necesaria, para tomar una decisin vlida relativa a la poblacin de estudio. Si una muestra es representativa de una poblacin es posible inferir importantes conclusiones sobre la poblacin a partir del anlisis de la muestra.

Las muestras pueden ser de dos tipos: probabilstica o al azar, cuando cada uno de los elementos tiene la misma probabilidad de ser escogido y no probalstica cuando se seleccionan los datos con determinado criterio o conveniencia del investigador; en estos casos, algunas unidades tienen mayor posibilidad que otras de ser seleccionadas, por tal razn no se puede determina la validez, ni la confianza que merecen dichos resultados.

1.1.4 Mtodos de Seleccin de una Muestra al Azar

La clave de un procedimiento de muestreo es garantizar que la muestra sea representativa de la poblacin, este muestreo puede ser probabilstica o intencional Es probabilstica cuando todos los elementos de la poblacin tienen la misma posibilidad de ser elegidos. En cambio, intencional, es cuando el investigador selecciona bajo un criterio la muestra.

La seleccin de esta muestra probabilstica se puede realizar por medio de los siguientes mtodos:

Azar Simple

Este mtodo de seleccin permite que todos los elementos que constituyen la poblacin tengan la misma posibilidad de ser incluidos en la muestra. Este mtodo es de gran importancia cuando la poblacin no es grande o siendo grande, este se concentra en un rea pequea. Tambin cuando las caractersticas que se investiga presentan poca variabilidad o cuando la poblacin facilita su enumeracin para su seleccin.

Ejemplo: en la fabrica T&T hay mil personas trabajando, 600 de las cuales son obreros, 250 son tcnicos y 150 son profesionales Si se quiere seleccionar una muestra aleatoria simple de 200 personas, en este caso, la probabilidad de seleccin de cada persona es:nN2001000==0.2P =

Lo cual indica que el 20% de los obreros corresponden a 120 de los tcnicos 50 y 30 profesionales.

Por Estratos

Para el muestreo estratificado se divide la poblacin en vanos grupos o estratos con el fin de dar representatividad a los distintos factores que integran la poblacin del estudio, la condicin de la estratificacin es la presencia en cada estrato de las caractersticas que conforman la poblacin.

Este proces de estratificacin requiere que la poblacin sea dividida en grupos homogneos donde cada elemento tiene una caracterstica tal que no le permite pertenecer a otro estrato.

Para la seleccin de los elementos o unidades representantes de cada estrato se utiliza el mtodo del muestreo aleatorio o al azar. Dentro de este muestreo encontramos casos tres especiales:

Muestras de igual tamao. En este tipo de muestreo debe seleccionarse un nmero igual de elementos en cada grupo mediante procedimiento al azar. Muestreo proporcional. En este tipo el tamao de muestra por estrato se escoge de tal forma que sea proporcional al tamao poblacional del mismo. Afinacin ptima. Este mtodo utiliza la mejor subdivisin posible de una muestra total, reparticin en todos los estratos, considerando tanto la variacin como el tamao de cada estrato adems se tiene en cuota el costo de la investigacin.

Ejemplo: en el caso de la fabrica T&T se puede argumentar que obreros, tcnicos y profesionales son importantes para establecer comparaciones y se decide escoger 80 de cada estrato. En este caso las probabilidades de seleccin seran, por estrato, las siguientes:

Obreros80/600= 0,133Tcnicos80/250= 0,32Profesionales80/150= 0,53

Donde se puede apreciar que la probabilidad de seleccin no es igual para todas las personas, sino que depende del estrato en que stas se encuentran y as un obrero tiene menor posibilidad de ser seleccionado que un profesional, simplemente porque estos ltimos son menores.

Por Conglomerado

Existen situaciones donde ni el muestreo aleatorio simple ni el estratificado son aplicables, ya que no se dispone de una lista con el numero de elementos de la poblacin ni en los posibles estratos. En estos casos tpicamente los elementos de la poblacin se encuentran de manera natural agrupados en conglomerados, cuyo nmero si se conoce.

Por ejemplo la poblacin se distribuye en provincias, los habitantes de una ciudad en barrios, etc. Si se supone que cada uno de estos conglomerados es una muestra representativa de la poblacin total respecto a la variable que se estudia, se puede seleccionar algunos de estos conglomerados al azar y dentro de ellos, analizar todos sus elementos o una muestra aleatoria simple.

Ejemplo: se desea tomar una muestra de la poblacin colombiana para estudiar la proporcin de personas que estn de acuerdo con la relaciones prematrimoniales; si se supone que la edad y el sexo pueden influir en la opinin, se debera tomar una muestra donde estas caractersticas sean las mismas que en la poblacin base, lo que implica una muestra estratificada.

Sistematizada

Una forma prctica para seleccionar la muestra es hacerla en forma sistemtica, escogiendo una muestra de cada intervalo, donde el intervalo se calcula as: K= N/n; donde N es el tamao de la poblacin y n el de la muestra.

Ejemplo: si se quiere tomar una muestra de 500 viviendas en un barrio que tiene 2000 viviendas, el intervalo de seleccin ser: K= 2000 / 500 = 4.

Para iniciar el proceso de seleccin sistemtica se escoge al azar un nmero entre 1 y 4, a partir del nmero seleccionado y cada 4 viviendas se hace una escogencia, hasta completar la muestra.

1.1.5Unidad Estadstica

Una vez identificada la poblacin y la muestra, se ubica la unidad estadstica, o sea el objeto de la medicin. La unidad estadstica es el elemento del universo que reporta la informacin (observacin) y sobre el cual se realiza un determinado estudio (anlisis).

Dato

Hace referencia a la observacin particular, es decir, la informacin relacionada con las caractersticas de cosas existentes que pueden ser recogidos, anotados u observados

Variables

Es una dimensin o una caracterstica de una unidad de anlisis, dimensin que adopta la forma de una clasificacin. Una variable se puede representar por un smbolo X, Y, Z, V, x, h etc. que puede tomar un conjunto prefijado de valores; dichas variables pueden ser: Nominal: a veces conviene extender la nocin de variable a entidades no numricas: es decir que relacionan un carcter, un nombre, una cualidad. Por ejemplo, el color C de un arco iris es una variable que puede tomar los valores rojo, anaranjado, amarillo, verde, azul, violeta y rosado. Puede ser posible sustituir tales variables por entidades numricas de la siguiente manera: denotando el rojo como 1, el anaranjado como 2 etc.

Ordinal: le asigna valores numricos a los sujetos, de tal forma que los valores ms altos se le asignan a los individuos que tienen ms de la caracterstica que se mide. Esto hace que necesariamente satisfaga la caracterstica de diferenciacin pero en adicin introduce la posibilidad de ordenamiento.

Por ejemplo, en una competencia ciclstica se tiene en cuenta los cinco primeros puestos para la premiacin.

Intervalo: en adicin a la clasificacin y ordenamiento se introduce la posibilidad de establecer el ordenamiento con intervalos iguales.

Por ejemplo, la medicin de la temperatura la cual se puede hacer por medio de un termmetro en grados Fahrenheit.

Variable Continua: es la variable que puede tomar cualquier valor entre dos valores dados. La estatura H de una persona que puede ser 1.62 cm, 1.65 cm, 1.80.

Variable Discreta: es la variable que solo puede tomar un determinado nmero de valores enteros. El nmero N de hijos en una familia puede ser O, 1, 2, 3.

1.2ESTADSTICA DESCRIPTIVA - DISTRIBUCIN DE FRECUENCIAS

La distribucin de frecuencias o tabla de frecuencia, es la disposicin tabular de los datos por clases junto con las correspondientes frecuencias de clase. Para la elaboracin de esta distribucin si los datos son cuantitativos, hay que tener en cuenta los siguientes pasos:

1.2.1 Recoleccin de Datos

Es la base para cualquier estudio estadstico, es la toma de datos u observaciones; estos se llevan a cabo mediante la recopilacin de los mismos sin ninguna ordenacin de acuerdo a lo que se est investigando.

Por ejemplo la empresa Cuero Lindo recopil la informacin resultante de encuestar 60 establecimientos pequeos, para estudiar sus ventas semanales en miles de pesos, los resultados son:

401726102621182716382233242028143025293728283322252929292132193523282215341316262420312918191123202428113439102517213418

Despus de tener dicha informacin, se procede a ordenarla; es decir, colocar los datos numricos en orden creciente o decreciente. Existe un tipo de ordenacin y se hacen generalmente en una tabla de distribucin de frecuencias. Para ello se debe encontrar inicialmente el rango de la distribucin; que es la diferencia entre el mayor y el menor dato obtenido. As:

R = Dm - dm, donde R = rangoDm = dato mayordm = dato menorR= 40 - 10 = 30

1.2.2 Intervalos

Al resumir grandes colecciones de datos es til distribuidos en clases o categoras; en cuanto al nmero de clases el investigador es autnomo para escoger el nmero de intervalos para trabajar, sin embargo existe una frmula que se utiliza como base o gua para indicar la cantidad de intervalos que se van a crear en la tabla de frecuencias. Esta frmula esta determinada por:

m = 1 + 3.33 log n;donde m = nmero de intervalosm = 1 + 3.33 log 60 = 6.92n = tamao de la muestra

Lo cual indica que se puede aproximar a 6 o 7 intervalos. En este caso se toman 6 intervalos, pero se agregan dos ms que son: el intervalo menor que el dato menor y el intervalo mayor que el dato mayor; esto cuando se utiliza un programa de computador.

1.2.3 Amplitud

El rango nos ayuda a determinar la amplitud o el tamao de cada clase, siendo esta una constante para cada intervalo. La amplitud indica la distancia que debe tener cada clase.

La amplitud se puede determinar como el cociente entre el rango y el nmero de intervalos.

A = R / m; dondeA = amplitud A = 30 / 6 = 5 miles de pesos

Para formar los intervalos de clase, si es utilizando un programa estadstico, se parte del dato menor 10 y se le suma la amplitud, as, 10 + 5=15. Entonces el primer grupo esta comprendido entre 10 y 15 miles de pesos.

El siguiente grupo ser: 15 + 5 = 20, donde el intervalo estar entre 15 y 20 miles de pesos. En forma similar se crean los dems intervalos, incluyendo los intervalos menores a 10 miles de pesos y mayores a 40 miles de pesos.

NMERO DE CLASESINTERVALOS

- 10

110 - 15

215 - 20

320 - 25

425 - 30

530 - 35

635 - 40

40 -

Otra manera de formar los intervalos de clase es tomar un dato como medida de referencia, por ejemplo 5 (que indica $5000) o el dato menor y sumarle el valor de la amplitud:NMERO DE INTERVALOSINTERVALOS

15 - 10

210 - 15

315 - 20

420 - 25

525 - 30

630 - 35

735 - 40

1.2.4 Frecuencia de Clase o Frecuencia Absoluta

Se determina el nmero de individuos que pertenecen a cada clase. Como cada clase est formada por un intervalo, entonces se debe tomar como un intervalo abierto a izquierda y cerrado a derecha. Esto quiere decir, por ejemplo: que para hacer el conteo para determinar las frecuencias correspondientes al intervalo 20 - 25, van a estar los valores 21, 22, 23, 24 y 25. De igual manera los valores que van a estar entre 25 - 30 son 26, 27, 28, 29 y 30.

Teniendo esto en cuenta, podemos utilizar el siguiente cuadro para realizar el conteo:

IntervalosNmero de EstablecimientosF

5 - 10/2

10 - 15/////5

15 - 20////////////12

20 - 25/////////////14

25 - 30//////////////15

30 - 35////////8

35 - 40////4

TOTAL60

Esta frecuencia significa; por ejemplo: que 12 establecimientos tienen ventas semanales entre $15000 y $20000; las mayores ventas estn entre $25000 y $30000, las menores ventas presentadas son de $10000, etc.

1.2.5 Marca de Clase (X)

Es el punto medio del intervalo de clase y se obtiene promediando el limite inferior y superior de cada clase.

IntervalosX

5 - 107,5

10 - 1512,5

15 - 2017,5

20 - 2522,5

25 - 3027,5

30 - 3532,5

35 - 4037,5

X =5+102= 7,5

Miles de pesos; esto quiere decir que el promedio del primer intervalo es de $7500.

Otra manera de hallar la amplitud de un intervalo es encontrar la diferencia comn entre marcas de clase sucesivas. Por ejemplo: 32,5 - 27,5 = 5 miles de pesos.

1.2.6 Frecuencia Relativa (Fr)

Es su frecuencia dividida por la frecuencia total de todas las clases y se expresa generalmente como un porcentaje.FFr = n

La frecuencia relativa del primer intervalo es 0.0333. Este valor se obtuvo de la relacin entre 2/60 = 0.0333; significa que el 3.33% de los establecimientos tienen ventas menores de $10000. Este porcentaje se obtiene al multiplicar por 100 el resultado obtenido.

De igual manera, la frecuencia relativa del segundo intervalo es de 0.0833, que significa que el 8.33% de los establecimientos tienen ventas entre $10000 a $15000.

1.2.7 Frecuencia Acumulada (Fa)

Es la acumulacin ascendente o descendente (de la primera a la ltima clase o viceversa) de frecuencias absolutas. La frecuencia acumulada descendente se obtiene de la siguiente manera:

La primera frecuencia acumulada corresponde a la primera frecuencia absoluta. La segunda acumulada se obtiene sumando las dos primeras absolutas, es decir, 2+5 = 7. La tercera acumulada se obtiene de sumar 7 + 12 = 19 y as sucesivamente.

La frecuencia acumulada ascendente se obtiene as: se inicia por la frecuencia absoluta del ltimo intervalo; en este caso 4. La siguiente es sumar esta frecuencia acumulada con la anterior: 4+8 = 12. La que sigue sera 4 + 8 = 12 y as sucesivamente.

IntervalosFFa

5 - 102260

10 - 155758

15 - 20121953

20 - 25143341

25 - 30154827

30 - 3585612

35 - 404604

El significado de este cuadro es el siguiente: si tomamos el tercer grupo descendente, su frecuencia acumulada, significa que 19 establecimientos tienen ventas semanales entre $10000 y $20000 o inferiores a $20000. Y si tomamos el segundo grupo ascendente, quiere decir que 12 establecimientos tienen ventas semanales entre $30000 y $40000 o mayores a $30000.

1.2.8 Frecuencia Relativa Acumulada (Fra)

Es la acumulacin sucesiva en forma ascendente o descendente de frecuencias relativas. La primera frecuencia relativa acumulada corresponde a la primera frecuencia relativa. La segunda, se obtiene sumando las dos primeras frecuencias relativas, es decir, 0,0333 + 0,0833 = 0,1167 y as sucesivamente. La frecuencia relativa acumulada ascendente se obtiene as: se inicia por la frecuencia relativa del ltimo intervalo; en este caso 0,0667. La siguiente es sumar esta frecuencia acumulada con la anterior 0,0667 + 0,1333 = 0,2 y as sucesivamente.

IntervaloFrFra

5 100.03330.03331

10 - 150.08330.11670.9666

15 - 200.20.31670.8833

20 - 250.23330.550.6833

25 - 300.250.80.45

30 - 350.13330.93330.2

35 - 400.066710.0667

Si tomamos el grupo 5 descendente su acumulado es de 0.8, cuyo significado es que el 80% de los establecimientos tienen ventas semanales menores a $30000; si tomamos el grupo 4 ascendente su acumulado ser del 0,6833, esto significa que el 68.33% de los establecimientos tienen ventas mayores a $20000 mil pesos.

IntervaloFFrFaFra

5 - 1020,03332600,03331

10 - 1550,08337580,11670,9666

15 - 20120,219530,31670,8833

20 - 25140,233333410,550,6833

25 - 30150,2548270,80,45

30 - 3580,133356120,93330,2

35 - 4040,066760410,0667

Total601,00

La tabla presenta el resumen de la clasificacin de los 60 establecimientos analizados por los investigadores de la empresa Cuero Lindo, esto significa que se ha organizado la informacin.

Proceso de Comprensin y Anlisis

Decir de las siguientes variables cules son continuas y cules son discretas

La altura de las personas La medida de la cantidad de lluvia cada en una localidad en un mes La edad de las personas, en aos cumplidos El nmero de alumnos de cada curso de un colegio

Por qu es til la estadstica en el campo para el cual se est preparando.

La Estadstica estudia el comportamiento de fenmenos colectivos y nunca de una observacin individual comentar este principio.

Clasificar a que tipo de estadstica pertenecen los siguientes tems:

Realizar un inventario Determinar la demanda de un producto La posibilidad que llueva en una ciudad determinada El porcentaje de desempleo en una ciudad especfica El promedio de las acciones vendidas en la bolsa de valores en una empresa en un mes determinado El aumento del ndice de precios al consumidor en un mes especfico El aumento del costo de vida en un mes especfico El nmero de accidentes ocurridos en una ciudad determinada Las ventas de un almacn en un mes determinado El aumento de costos de produccin con respecto al mismo mes del ao anterior.

Dar un ejemplo donde se aplique la estadstica en los siguientes campos:

Agricultura Biologa Negocios Qumica Comunicaciones Finanzas Economa Educacin Electrnica Educacin Electrnica Medicina Fsica Mercadeo Ciencias polticas Psicologa Medicina Fsica Mercadeo Ciencias polticas Psicologa Ingeniera Administracin Produccin Sociologa

Responder a los siguientes enunciados:

Qu significan las variaciones en los precios de los artculos al consumidor? Cree que cualquier investigacin requiere informacin estadstica? Cules son las funciones del Departamento Administrativo Nacional de Estadstica (DANE)?

Las calificaciones finales de 80 estudiantes son:

68 93 71 78 82 79 83 57 88 7784 60 59 66 75 60 71 73 78 8575 73 85 72 94 95 79 80 62 7582 88 75 63 77 75 62 65 76 7668 79 61 78 69 61 67 75 53 6390 73 65 95 74 89 97 71 74 7262 93 75 62 68 78 78 65 86 8188 76 87 74 60 96 85 76 67 73

Hallar:

La calificacin ms alta La calificacin ms baja El rango Las cinco notas ms altas Las cinco notas ms bajas La dcima nota de mayor a menor La tabla de frecuencias utilizando 7 intervalos Comprobar que la amplitud de los intervalos es de 6.29 El nmero de estudiantes de 79 o ms El nmero de estudiantes con calificaciones por debajo de 71 El porcentaje de estudiantes con calificaciones mayores de 65 pero no superiores a 85. Cul es el significado del 91.25%? Cul es el significado del 33.75%?

En una empresa se investig una muestra de 56 empleados para determinar su salario mensual en miles de pesos. Los resultados fueron los siguientes:

987117612331248944110512431109117312339851093131082411851157133010241079169012629568161220133110001032122913851252972138112409321358614102214041415130398412341324918106712038271209105511041343120275910249051490

Crear la tabla de frecuencias con siete intervalos y comprobar que su amplitud es de 153.71 e interpretar cada uno de los siguientes valores en la clasificacin:

X4F5Fa 3Fr6Fra 4Fra 5Fa2nFr 2

Responder:

Cuntos empleados tienen un salario inferior a $1'382.000? Qu porcentaje de empleados tienen un salario superior a $1'228.000? Cuntos empleados tienen un salario entre $921.000 y $1'075.000? Qu porcentaje de empleados tienen un salario entre $1'228.000 y $1'382.000?

En la tabla que sigue se recogen los pesos de 40 estudiantes varones de una universidad con precisin de 1 Kilo, construir una distribucin de frecuencias con 5 intervalos y establecer las conclusiones ms importantes.

69726274787379707368828463698881997782747573867173677670677666807267717578726472 La siguiente tabla muestra una distribucin de frecuencia de los salarios semanales de 65 empleados de la empresa P & R.

SALARIOSNMERO DE EMPLEADOS

$250.000 - $260.0008

$260.000 - $270.00010

$270.00 - $280.00016

$280.000 - $290.00014

$290.000 - $300.00010

$300.000 - $310.0005

$310.000 - $320.0002

Total65

Determinar de la tabla de frecuencias:

El lmite inferior de la sexta clase. El lmite superior de la cuarta clase. La marca de clase o punto medio de la tercera clase. La anchura del quinto intervalo de clase. La frecuencia de la tercera clase. El intervalo de clase con mxima frecuencia. El porcentaje de empleados que cobran menos o igual de $280.000 a la semana. El porcentaje de empleados que cobran igual o menos de $300.000 pero al menos $260.000 por semana.

Si las marcas de clase en una distribucin de frecuencias de pesos de estudiantes son 128, 137, 146, 155, 164, 173 y 182 libras. Hallar:

La anchura del intervalo de clase. Los lmites de clase, suponiendo que los pesos se midieron con 1 libra de precisin.

La menor de 150 medidas es 5,18 m y la mayor 7.44 m.

Determinar un conjunto apropiado de intervalos de clase. Marcas de clase que puedan usarse para formar la distribucin de frecuencia de esas medidas.

La siguiente tabla muestra una distribucin de frecuencias de las vidas medias de 400 vlvulas de radio probadas en la empresa L & M.

VIDA MEDIA (Horas)NMERO DE TUBOS

300 - 40014

400 - 50046

500 - 60058

600 - 70076

700 - 80068

800 - 90062

900 - 100048

1000 - 110022

1100 - 12006

Total400

Determinar de la tabla de frecuencias:

El lmite superior de la quinta clase. El lmite inferior de la octava clase. La marca de clase de la sptima clase. La anchura de intervalos de clase. La frecuencia de la cuarta clase. La frecuencia relativa de la sexta clase. Porcentaje de tubos cuya vida media no pasa de 600 horas. Porcentaje de tubos cuya vida media es mayor de 900 horas. Porcentaje de tubos cuya vida media es de al menos 501 horas, pero menor o igual que 1000 horas.

Los dimetros internos de los tubos fabricados por una empresa se miden con precisin de milsima de pulgada. Si las marcas de clase de una distribucin de frecuencias de esos dimetros vienen dadas por 0.321, 0.324, 0.327, 0.33, 0.333 y 0.336. Hallar la anchura del intervalo de clase y los lmites de clase.

La tabla adjunta muestra los dimetros en centmetros de una muestra de 60 bolas de cojinete manufacturadas por una fbrica. Construir una distribucin de frecuencias con intervalos de clase apropiados y establecer las conclusiones respectivas.1.7381.7291.7431.7401.7361.741

1.7351.7311.7261.7371.7281.737

1.7361.7351.7241.7331.7421.736

1.7391.7351.7451.7361.7421.740

1.7281.7381.7251.7331.7341.732

1.7331.7301.7321.7301.7391.734

1.7381.7291.7271.7351.7351.732

1.7351.7271.7341.7321.7361.741

1.7361.7441.7321.7371.7311.746

1.7351.7351.7291.7341.7301.740

UNIDAD 2: Medidas de Tendencia Central

Ncleos Temticos y Problemticos

Primer Caso: Cuando los Datos no Estn Agrupados Segundo Caso: Cuando los Datos Estn Agrupados

Proceso de Informacin

Las medidas de centralizacin son valores que tienden a situarse en el centro del conjunto de datos ordenados segn su magnitud. Las medidas de centralizacin ms usadas son: Media aritmtica, mediana y moda.

La media aritmtica es la medida de tendencia central ms conocida, es fcil de calcular, de gran estabilidad en el muestreo; se puede aplicar a variables de intervalos ya sean discretos o continuos. Esta medida se define como la suma de todos los valores observados dividido por el nmero de observaciones, es decir encontrar el promedio de los datos en estudio.

La mediana se define como la medida de tendencia central que divide a cualquier distribucin en dos partes iguales. Esta medida se puede aplicar a variables de intervalos (discretas y continuas) y variables ordinales.

La moda de una distribucin se define como el valor que presenta la mayor frecuencia, se usa con variables de intervalos nominales y ordinales. Es comnmente utilizada como una medida de popularidad que refleja la tendencia de una opinin.

2.1 PRIMER CASO: CUANDO LOS DATOS NO ESTN AGRUPADOS

2.1.1Media Aritmtica

La media aritmtica de un conjunto de n nmeros x1, x2, X3..., Xn, se representa por x y se define como:X =

X1 + X2 + X3 + Xn

n nxii=1 n=

Cuando los nmeros x1, x2, x3,....xn, aparecen f1, f2, f3,..... fn veces, respectivamente, es decir, que sus frecuencias respectivas son f1, f2, f3,....fn, la media aritmtica se puede calcular del modo siguiente:X =

f1X1 +f2X2 + f3X3 + ....+fnXn =f1+f2+f3++fn nfixii=1 nfii=1

En ocasiones, a cada uno de los nmeros x1, x2, x3,....xn, se les asigna un peso determinado w1, w2, w3,....wn. En estos casos, se acostumbra a calcular la media aritmtica ponderada del modo siguiente:X =

w1x1 +w2x2 + w3x3 + ....+wnnn

w1+w2+w3+..+wn nwixii=1 nwii=1

Ejemplo

Hallar la media aritmtica del puntaje obtenido por 5 estudiantes en una prueba: 6, 4, 3, 7, 8.

6+4+3+7+8 28Este es el puntaje promedio de los 5 estudiantes

x = =5,6 55

Hallar la media aritmtica de los siguientes datos que representan las edades de 10 nios. 6, 6, 6, 4, 4, 4, 4, 3, 3, 7.3*6+4*4+2*3+1*747x= = 4,73+4+2+110

El promedio de edad de los 10 nios es de 4 aos, 7meses de 5aos.

Un estudiante ha obtenido las calificaciones siguientes:

AsignaturaNotaPeso

Historia81

Qumica73

Fsica33

Matemtica63

Biologa 53

Geologa62

Dibujo52

Idioma72

filosofa41

Calculando su nota media ponderada:

1*8 + 3*7 + 3*3 + 3*6 + 3*5 + 2*6 + 2*5 + 2*7 + 1*4X =

1+3+3+3+3+2+2+2+1

111X =

= 5,5520

Por lo tanto el promedio de las notas del estudiante es de 5,55

2.1.2 Mediana

La mediana es una serie de datos ordenados en orden de magnitud, es el valor medio si el nmero de datos es impar o bien la media aritmtica de los valores medios si el nmero de datos es par.

Ejemplo

Hallar la mediana de los siguientes datos que corresponden a la venta de leche en un expendio durante los ltimos 7 das:

27800543006080073200438506050054350

27800438505430054350605006080073200

Md = 54350. El precio de la venta de leche que se encuentra en la mitad de los precios es de $54350.

Hallar el valor de la mediana para los siguientes puntajes de las pruebas ICFES: 304, 283,332, 344;295, 339.

283295304332339344

304+332Md == 3182El puntaje de las pruebas que se encuentra en la mitad es de 318.

2.1.3Moda

La moda no puede ser nica e incluso puede no existir.

Ejemplo

En una encuesta realizada sobre los deportes que se practican en un grado determinado de un Colegio de Varones, se presentan los siguientes resultados:

DeporteN de Alumnos

Basket10

Ftbol18

Voleibol5

Otros4

La moda en este caso es el Ftbol, puesto que la mayora de los alumnos lo prefieren.

Se le ha preguntado a un grupo de personas acerca del color preferido por ellas y se obtuvo lo siguiente:

ColorNumero de Personas

Blanco4

Gris8

Azul9

Negro4

Rojo3

Morado2

Caf8

Vinotinto8

Lo cual indica que los colores que pueden estar de moda son el gris, caf y vinotinto.

Hallar la moda de los nmeros 2, 3, 4, 5, 6, 7, 8; como ningn nmero se repite ms que los otros, por consiguiente no hay moda.

2.2 SEGUNDO CASO: CUANDO LOS DATOS ESTN AGRUPADOS

2.2.1 Media AritmticaX =

n xi fii=1 n

Ejemplo

Hallar la media aritmtica de las ventas de los sesenta establecimientos:

IntervalosFXX*F

5 - 1027.515

10 - 15512.562.5

15 - 201217.5210

20 - 251422.5315

25 - 301527.5412.5

30 - 35832.5260

35 - 40437.5150

40 -00

Total601425

X =

1425 = 23,7 = 24 60

Las ventas promedio de los sesenta establecimientos son de $24000.

Hallar el valor promedio para la distribucin correspondiente a las notas obtenidas por 40 estudiantes en una prueba estadstica:

IntervalosFXX*F

10 - 19.61014.8148

19.6 - 29.2324.473.2

29.2 - 38.8734238

38.8 - 48.4743.6305.2

48.4 - 58553.2266

58 - 67.6862.8502.4

Total401532.8

X =

1532.8 = 38.3 = 38 40

El puntaje promedio de los 40 alumnos es de 38.

2.2.2Mediana

Para hallarla cuando los datos estn agrupados se siguen los siguientes pasos:

Ubicar el intervalo donde quede la frecuencia correspondiente a la mitad del tamao de la muestra. Encontrar el valor del lmite real inferior del intervalo dnde est. Aplicar la siguiente frmula:

Md = li + n _ Fa2F n/2

A; donde:li :es el lmite real inferior donde est la F n/2Fa es la sumatoria de frecuencias anteriores a n/2F n/2 es la frecuencia donde est n/2A es la amplitud del intervalo

Ejemplo

Encontrar la mediana de las ventas de los sesenta establecimientos:

IntervalosF

5 - 102

10 155

15 2012

20 - 2514

25 - 3015

30 - 358

35 - 404

TOTAL60

$24.000 corresponde a la venta que est en la mitad.

Encontrar la mediana de la distribucin correspondiente a las notas obtenidas por 40 estudiantes en una prueba estadstica

IntervalosF

10 - 19.610

19.6 - 29.23

29.2 - 38.87

38.8 - 48.47

48.4 - 585

58 67.68

Total40

La nota que est en la mitad en esta distribucin es Moda.

2.2.3Moda

Se debe ubicar el intervalo donde est la mayor frecuencia, y despus se aplica la siguiente frmula:

Li es el lmite real inferior donde est la moda. , 1es la diferencia entre la frecuencia modal y la frecuencia inmediatamente anterior. 2 es la diferencia entre la frecuencia modal y la frecuencia inmediatamente posterior. A es la amplitud del intervalo.

Ejemplo

Encontrar la moda de las ventas de los sesenta establecimientos:

IntervalosF

5 - 102

10 - 155

15 - 2012

20 - 2514

25 - 3015

30 - 358

35 - 404

Total60

Encontrar la moda de la distribucin correspondiente a las notas obtenidas por 40 estudiantes

IntervaloF

10-19.610

19.6-29.23

29.2-38.87

38.8-48.47

48.4-585

58-67.68

Total40

Proceso de Comprensin y Anlisis

Supngase que en un viaje, un automovilista hace las siguientes compras de gasolina. 10 galones a $2500 c/u, 8 galones a $2550 c/u, 15 galones a $2600 c/u y 12 galones $2480 c/u. Cul sera el costo medio por galn?.

La siguiente tabla muestra los salarios mensuales en miles de pesos de 144 empleados de una empresa:

SalariosF

540 - 6076

607 - 67419

674 - 74136

741 - 80824

808 - 87526

875 - 94219

942 - 100910

1009 - 10764

Total144

Encontrar la media, la moda y la mediana.

Diez medidas del dimetro de un cilindro fueron anotadas por un cientfico como 3.88, 4.09, 3.92, 3.97, 4.02, 3.95, 3.98, 4.03, 3.92 y 4.06 centmetros; hallar la media aritmtica de tales medidas.

De entre 100 nmeros: 20 son cuatros, 40 son cincos, 30 son seis y los restantes sietes. Hallar la media aritmtica, la media y la moda.

De los 80 empleados de una empresa, 60 cobran $7000 a la hora y el resto $4000 a la hora. Hallar cunto cobran la media por hora.

Usar la distribucin de frecuencias para hallar la altura media, la altura que ms se repite y la altura que se encuentra en la mitad de 100 estudiantes.

Altura (m)F

1.60 - 1.635

1.63 - 1.6618

1.66 - 1.6942

1.69 - 1.7227

1.72 - 1.758

Total100

Hallar la media, mediana y moda de los pesos de 40 estudiantes de la siguiente tabla:

PESO (Lb)F

118 - 1263

126 1345

134 1429

142 15012

150 - 1585

158 - 1664

166 - 1742

Total40

Los tipos de reaccin de un individuo ante diversos estmulos, medidos por un psiclogo, fueron: 0.53, 0.46, 0.5, 0.49, 0.52, 0.53, 0.44 y 0.55 segundos respectivamente. Determinar su tiempo medio de reaccin.

La siguiente tabla muestra la distribucin de cargas mximas en toneladas cortas que soportan los cables producidos en cierta fbrica. Determinar la carga mxima media, la carga mxima que se repite y la carga que ms se repite.

Carga Mxima(Toneladas Cortas)F

9.3 - 9.72

9.7 - 10.15

10.1 - 10.512

10.5 - 10.917

10.9 - 11.314

11.3 - 11.76

11.7 - 12.14

Total60

La siguiente tabla muestra el nmero de bodas en Colombia para hombres y mujeres de distintos grupos de edad durante 1984.

Hallar la media, mediana y moda tanto para hombres como para mujeres, estableciendo las respectivas conclusiones.

Edad (aos)Hombres(Miles)Mujeres(Miles)

15 - 19121481

19 - 232.4414.184

23 - 275.9306.952

27 - 316.5877.193

31 - 3511.78811.893

35 - 399.0499.022

39 - 438.7498.171

43 - 475.7864.654

47 - 512.5811.524

UNIDAD 3: Medidas de dispersin

Ncleos Temticos y Problemticos

Desviacin Estndar o Tpica Varianza Coeficiente de Variacin

Proceso de Informacin

Las medidas de dispersin o variacin dan idea de la separacin de los datos numricos alrededor de una medida de centralizacin. Las medidas de dispersin ms utilizadas son:

3.1 DESVIACIN ESTNDAR O TPICA

Indica que tan dispersos estn los datos con respecto a la media aritmtica. Si los datos no estn agrupados, la desviacin estndar de una serie de nmeros n. X1, x2, x3,.....xn est determinada por:

Si los datos estn agrupados, la desviacin estndar viene dada por:

Las anteriores frmulas se utilizan cuando se trabaja con la poblacin.

Si los datos estn agrupados, la desviacin estndar viene dada por:

Las anteriores frmulas se utilizan cuando se trabaja con la muestra.

Ejemplo

Hallar la desviacin estndar del puntaje obtenido por 4 estudiantes en una prueba: 6 4, 3, 7. 8.

5.6X =

Hallar la desviacin estndar de las edades de 10 nios: 6, 6, 6, 4, 4, 4, 4, 3, 3, 7.

Hallar la desviacin estndar de las ventas de los sesenta establecimientos x = 24.

IntervalosFX(X-x)2 F

5 1027.5544.5

10 - 15512.5661.25

15 - 201217.5507

20 - 251422.531.5

25 - 301527.5183.75

30 - 35832.5578

35 - 40437.5729

Total603235

3.2 VARIANZA

Esta es la medida de variacin ms importante, ya que se obtiene a partir de la media aritmtica de una distribucin. La varianza seala la distancia promedio de cualquier observacin en el conjunto de datos. La varianza de un conjunto de datos se define como el cuadrado de la desviacin tpica.

La varianza es una medida de dispersin, en la cual, las unidades son los cuadrados de las unidades de los datos, es decir, pesos cuadrados, personas cuadradas, etc., y por esto no son expresiones fciles de interpretar.

Si los datos no estn agrupados, la varianza de una serie de nmeros n: x1, x2, x3........ Xn est determinada por:

Si los datos estn agrupados, la varianza viene dada por:

Ejemplo

Hallar la varianza del puntaje de 5 estudiantes: 6, 4, 3, 7, 8.

Hallar la varianza de las edades de 10 nios: 6, 6, 6, 4, 4, 4, 4, 3, 3. 7.

X = 4.7

18.1S2 = = 1.8110

Hallar la varianza de las ventas de los sesenta establecimientos: X = 24

IntervalosFX(X-x)2 F

5 1027.5544.5

10 15512.5661.25

15 201217.5507

20 251422.531.5

25 301527.5183.75

30 - 35832.5578

35 - 40437.5729

Total603235

3235S2 = = 53.960

3.3 COEFICIENTE DE VARIACIN

Esta medida relaciona la desviacin estndar y la media, para expresar la variacin de la desviacin con respecto a la media aritmtica. Este coeficiente de variacin se acostumbra expresarlo en porcentaje.

SLa frmula que se utiliza es: cv = * 100X

El coeficiente de variacin es una medida muy utilizada en control de calidad. Para estos casos, generalmente existen especificaciones que limitan el coeficiente de variacin. Tambin nos sirve para determinar la homogeneidad de la informacin, es decir, si el coeficiente de variacin es pequeo la informacin es homognea y si el coeficiente de variacin es grande la informacin es heterognea.

Ejemplo

Hallar el coeficiente de variacin de 6, 4, 3, 7, 8

X = 5.6S = 1.34Cv = 23.9%

Este porcentaje indica cmo se distribuye la desviacin estndar con respecto a la media a travs de los datos.

Hallar el coeficiente de variacin de las ventas de los sesenta establecimientos y obtener conclusiones.

X = 24S = 7.3

7.3Cv = *10024

Cv = 30.42%. De aqu se puede decir que las ventas de los sesenta establecimientos son homogneas. Si el trabajador A produce por hora 40 tornillos en promedio, con desviacin de 5 tornillos y el trabajador B produce 180 tornillos en promedio con desviacin de 15, cul de los trabajadores presenta menor variabilidad?

5CVA = *100 = 12.5% para el operador A40

15CVB = *100 = 9.4% Para el operador B180

Esto significa que el operador B, quien tiene mayor desviacin en la produccin, presenta menor variacin, porque la media de produccin para el operador B es mucho mayor que la del operador A.

Proceso de Comprensin y Anlisis

Hallar la desviacin estndar y la varianza de los puntos obtenidos asignados a 8 nios en un juego: 12, 6, 7, 3, 15, 10 18 y 5.

Hallar la desviacin estndar y la varianza en la compra de cremas dentales: $9.345, $3.850, $8.235, $8.000, $9.578, $8.560, $9.234, y 18.456.

Hallar la desviacin estndar de las alturas de los estudiantes de acuerdo a la siguiente tabla:

Altura (m)F

1.60 1.635

1.63 1.6618

1.66 1.6942

1.69 1.7227

1.72 1.758

Total100

Hallar la desviacin estndar de la distribucin de salarios de la siguiente tabla:

SALARIOSNM. EMPLEADOS

$250.000 - $260.0008

$260.000 - $270.00010

$270.000 - $280.00016

$280.000 - $290.00014

SALARIOSNM. EMPLEADOS

$290.000 - $300.00010

$300.000 - $310.0005

$310.000 - $320.0002

Total65

La siguiente tabla muestra los cocientes de inteligencia (lQ) de 480 nios de una escuela elemental. Hallar la desviacin estndar:

FX

470

974

1678

2882

4586

6690

8594

7298

54102

38106

27110

18114

11118

5122

2126

Un fabricante de tubos de televisin produce dos tipos de tubos A y B, que tienen vidas medias respectivas: xA = 1495 horas y xB = 1875 horas y desviacin tpica de SA = 280 horas y SB = 310 horas. Qu tipo de tubo tiene mayor dispersin?

En un examen final de Estadstica, la puntuacin media de 150 estudiantes fue de 78 y la desviacin estndar 8. En lgebra la media fue de 73 y la desviacin estndar 7.6. En qu materia fue mayor la dispersin?.

Hallar la desviacin estndar y el coeficiente de variacin para los datos de la siguiente tabla:

Carga Mxima(Toneladas Cortas)F

9.3 - 9.72

9.7 10.15

10.1 - 10.512

10.5 - 10.917

Carga Mxima(Toneladas Cortas)F

10.9 - 11.314

11.3 - 11.76

11.7 - 12.14

Total60

UNIDAD 4: Medidas de Ubicacin

Ncleos Temticos y Problemticos

Cuartiles, Percentiles y Deciles Diagramas de Caja

Proceso de Informacin

4.1 CUARTILES, PERCENTILES, DECILES

Si un conjunto de datos est ordenado por magnitud, el valor central que divide al conjunto en dos mitades iguales, es la mediana.

Extendiendo esa idea, se puede pensar en aquellos valores que dividen al conjunto en cuatro partes iguales, (cuartiles) esos valores denotados Q1 Q2 y Q3, llamados primer, segundo y tercer cuartil respectivamente. El Q2 coincide con la mediana.

Anlogamente, los valores que dividen a los datos en 10 partes iguales se llaman deciles y se denotan por D1 D2,...D9. El D5 coincide con la mediana.

Y los valores que dividen a los datos en 100 partes iguales se llaman percentiles, denotados por P1 P2,.....P99. El P50 coincide con la mediana.

Si los datos no estn agrupados, se deben ordenar en forma ascendente o descendente y ubicar el dato que est en la posicin n * p:donde,qq = 4, 10, 100p = Nmero a la ubicacin al que se desea referirn = Total de datos

Ejemplo

Con los siguientes datos ubicar el que corresponde a:

Al primer cuartil Al tercer decil Al percentil 80

1285101146334568101112n * p8*1Q1 = = = 2q4

El dato que est en el primer cuartil es 4, ya que est en la segunda posicin.

n * p8*3D3 = = = 2.4 2q10

El dato que est en el tercer decil es 4, ya que est en la segunda posicin.n * p8 * 80P80 = = = 6.4 6q100

El dato que est en el percentil 80 es 10, ya que este valor est en la sexta posicin.

Cuando los datos estn agrupados, utilizamos la misma frmula de la mediana y reemplazamos donde est n/2 por n * p; el lmite inferior es donde est la F (n*p)/qq

Donde U hace referencia a la medida de ubicacin, li es el limite inferior donde est F(n*p)/q

Ejemplo

En las ventas de los sesenta establecimientos encontrar:

El primer, segundo y tercer cuartil El primer, quinto y el sexto decil El percentil doce, cincuenta y ochentan * p

q

Para encontrar estas medidas, primero hay que encontrar para ubicar el intervalo correspondiente a esta posicin.

El Primer, Segundo y Tercer Cuartiln = 60p = 1q = 4n*p = 60*1 = 15 q 4Li= 15Fa = 7F (n*p)/q = 12A = 5

IntervalosF

5 - 102

10 - 155

15 - 2012

20 - 2514

25 - 3015

30 - 358

35 - 404

Total60

De donde el 25% de las ventas de los 60 establecimientos es de $18000 o menos.

IntervaloFn = 60p = 2q = 4n*p = 60*2 = 30 q 4Li= 20Fa = 19F (n*p)/q = 14A = 5

5 - 102

10 - 155

15 - 2012

20 - 2514

25 - 3015

30 - 358

35 - 404

Total60

Donde el 50% de las ventas de los 60 establecimientos es de $24000 o menos.

IntervalosFn = 60p = 3q = 4n*p = 60*3 = 45 q 4Li= 25Fa = 33F (n*p)/q = 15A = 5

5 - 102

10 - 155

15 - 2012

20 - 2514

25 - 3015

30 - 358

35 - 404

Total60

Por lo tanto el 75% de las ventas de los 60 establecimientos es de $29000 o menos

El Primer, Quinto y el Sexto Decil

IntervalosFn = 60p = 1q = 10n*p = 60*1 = 6 q 10Li= 10Fa = 2F (n*p)/q = 5A = 5

5 - 102

10 - 155

15 - 2012

20 - 2514

25 - 3015

30 - 358

35 - 404

Total60

El 10% de las ventas es de $9000 o menos.

IntervalosFn = 60p = 5q = 10n*p = 60*5 = 30 q 10Li= 20Fa = 19F (n*p)/q = 14A = 5

5 102

10 - 155

15 - 2012

20 - 2514

25 - 3015

30 - 358

35 - 404

Total60

El 50% de las ventas es de $24000 o menos

IntervalosFn = 60p = 6q = 10n*p = 60*6 = 36 q 10Li= 25Fa = 33F (n*p)/q = 15A = 5

5 - 102

10 - 155

15 - 2012

20 - 2514

25 - 3015

30 - 358

35 - 404

Total60

Y el 60% de las ventas es de $26000 o menos.

El Percentil Doce, Cincuenta y Ochentan = 60p = 12q = 100n*p = 60*12 = 7.2 = 7 q 100Li= 10Fa = 2F (n*p)/q = 5A = 5

IntervaloF

5 - 102

10 - 155

15 - 2012

20 - 2514

25 - 3015

30 - 358

35 - 404

Total60

60*12

100

5-25 = 15.2 15P12= 10+

Por lo tanto el 12% de las ventas de los sesenta establecimientos es de $15000 o menos.

IntervalosFn = 60p = 50q = 100n*p = 60*50 = 30 q 100Li= 20Fa = 19F (n*p)/q = 14A = 5

5 - 102

10 - 155

15 - 2012

20 - 2514

25 - 3015

30 - 358

35 - 404

Total60

60*50

100

14-195 = 23.9 24P50= 20+

El 50% de las ventas de los sesenta establecimientos es de $24000 o menos.

IntervaloFn = 60p = 80q = 100n*p = 60*80 = 48 q 100Li= 25Fa = 33F (n*p)/q = 15A = 5

5 - 102

10 - 155

15 - 2012

20 - 2514

25 - 3015

30 - 358

35 - 404

Total60

Y el 80% de los establecimientos tienen ventas de $30.000 o menos.

4.2 DIAGRAMAS DE CAJA

Es una representacin del diagrama de una distribucin construida para mostrar sus caractersticas principales y sealar los posibles datos atpicos, es decir, aquellas observaciones que parecen ser distintas de las dems. Su principal utilidad es para depurar informacin puesto que se pueden eliminar los datos de mayor variacin en los extremos. Un diagrama de caja se construye as:

Ordenar los datos de la muestra y obtener el valor mnimo, el mximo y los tres cuartiles Q1, Q2, Q3, localizndolos en una recta numrica utilizando una escala adecuada. Dibujar un rectngulo cuyos extremos son Q1 y Q3. Calcular unos limites admisibles superior e inferior que van a servir para identificar los valores atpicos. Estos lmites se calculan con :Q3 Q1

2Li = Q3 +1.5Q3 Q1

2Li = Q1-1.5

Considerar como valores atpicos los situados fuera del intervalo (li, Ls). Dibujar una lnea que vaya desde cada extremo del rectngulo central hasta el valor ms alejado no atpico, es decir, que est dentro del intervalo (li, ls). Identificar todos los datos que estn fuera del intervalo (li, ls) marcndolos como atpicos.

Ejemplo: Los siguientes datos muestran el nmero de das con aire contaminado en 2001 y 2002 en varias ciudades colombianas:

20012002

A248221

B208171

C113131

D12889

E106

F118101

G6033

H7963

I5556

20012002

J4754

K8855

L4769

M5859

N8248

O3316

Construir el diagrama de cajas correspondiente a la tabla dada.

Para 2001

El primer paso es ordenar la informacin de mayor a menor:

33 47 47 55 58 60 79 82 88 106 113 118 128 208 248

Luego se encuentran los tres cuartiles:

15*1Q1 = = 3.75 4 4

El 25% de ciudades tienen 55 das o menos de contaminacin o el 25% de las ciudades de EEUU tienen entre 33 y 55 das de contaminacin.

15*2Q2 = = 7.5 84

El 50% de ciudades tienen 82 das o menos de contaminacin

15*3Q3 = = 11.25 114

El 75% de ciudades tienen 113 das o menos de contaminacin.

Por tanto los lmites admisibles son:= 156,5113 55

2Li = 55 1,5= 11,5113 - 55

2Ls = 113 + 1,5

Como todos los valores son superiores al lmite inferior, la lnea inferior del diagrama de caja deber llegar hasta el valor mnimo y no hay atpicos en esta direccin.

2001

Este diagrama de caja, muestra que la mayor parte de las observaciones son menores que 113 y que el extremo superior de 248 est muy alejado del grupo principal de datos. Se ve con claridad la amplitud de los datos, que es la longitud del diagrama completo (248 - 33 = 215).

Para 2002

16 33 48 54 55 56 59 63 69 89 101 131 171 22114*1Q1= = 3.75 44

El 25% de ciudades tienen 55 das o menos de contaminacin.14*2Q2= = 74

El 25% de ciudades tienen 59 das o menos de contaminacin.

14*3Q3= = 10.5 114

El 25% de ciudades tienen 101 das o menos de contaminacin.

101 - 55

2= 20.5Li = 55 1,5101 - 55

2= 135.5Ls = 101 + 1,5

2002

Estos diagramas de caja son muy eficaces cuando ellos se comparan conjuntos de datos.

2001

2002

Ntese como los datos tienden a concentrarse ms y ms hacia el extremo inferior de la escala, excepto el extremo alto, el cual permaneci alto durante los dos aos.

Proceso de Comprensin y Anlisis

En la siguiente tabla que relaciona las alturas de 100 estudiantes, determinar el primer, el segundo y tercer cuartil y realizar el grfico correspondiente:

Altura (m)F

1.60 - 1.635

1.63 - 1.6618

1.66 - 1.6942

1.69 - 1.7227

1.72 - 1.758

Total100

Hallar en la siguiente tabla para los salarios en miles de pesos de 144 empleados de una empresa: El primer cuartil El quinto y octavo decil El percentil 10 y el percentil 45

SalarioF

540 - 6076

607 - 67419

674 - 74136

741 - 80824

808 - 87526

875 94219

942 - 100910

1009 - 10764

Total144

Encontrar el primer, segundo y tercer cuartil de la siguiente tabla que relaciona los pesos de 40 personas y realizar el grfico correspondiente:

Peso (Lb)F

118 - 1263

126 - 1345

134 - 1429

142 - 15012

150 - 1585

158 - 1664

166 1742

Total40

Las siguientes son diez medidas del dimetro de un cilindro: 3.88, 4.09, 3.92, 3.97, 4.02 3.95, 3.98, 4.03, 3.92 y 4.06 centmetros. Hallar:

El primer y tercer cuartil El cuarto, el sexto y noveno decil El percentil 48 y el percentil 10

La siguiente tabla muestra una distribucin de frecuencias de las vidas medias de 400 vlvulas de radio probadas en la empresa L & M.Encontrar: El primer, segundo, tercer cuartil y su respectiva grfica El segundo, cuarto y sexto decil. El cincuenta percentil.Vida MediaNmero de Tubos

300 40014

400 - 50046

500 - 60058

600 - 70076

700 - 80068

800 - 90062

900 - 100048

1000 - 110022

1100 - 12006

Total400

UNIDAD 5: Presentacin de la Informacin

Ncleos Temticos y Problemticos

Histograma Polgonos de Frecuencia Ojivas Barras

Proceso de Informacin

Una grfica estadstica es aquella en la cual se presentan los datos estadsticos en trminos de magnitudes, para interpretarlos en forma visual.

Presentar la informacin de la tabla de frecuencias por medio de grficas sirve para reforzar las conclusiones que se determinan de esta tabla. Estas grficas se pueden utilizar para:

Evaluar resultados de un proceso. Presentar resultados de una investigacin.

Para la elaboracin de un grfico hay que tener en cuenta:

Ttulo: indica la descripcin del contenido de la grfica, es decir, indica el fenmeno de estudio. Por ejemplo, Produccin de caf en Colombia en el perodo 1995 - 1997.

Diagrama: es empleado para representar los datos mostrados en una grfica; los diagramas pueden ser de varios tipos: lneas, barras, dimensiones y smbolos.

Escala: se aplica para saber la dimensin del fenmeno graficado. Se debe identificar en los ejes X y Y de un sistema de coordenadas. Las magnitudes en la ordenada o eje Y y las clasificaciones de los datos en las abscisas o eje X.

Existen varios tipos de grficas para representar los datos estadsticos y al mismo tiempo sirven para reforzar las conclusiones dadas en la tabla de frecuencias.

5.1 HISTOGRAMA

Sirve para representar grficamente una distribucin de frecuencias. El grfico se disea trazando los intervalos sobre el eje X y las frecuencias absolutas sobre el eje Y. A partir del intervalo se traza la altura respectiva dada por la frecuencia absoluta.

La empresa Cuero Lindo ha recopilado informacin sobre las ventas en miles de pesos de 60 almacenes. Estos datos son:

VENTAS PARA SESENTA ESTABLECIMIENTOS(Miles de pesos)

IntervaloF

5 - 102

10 - 155

15 - 2012

20 - 2514

25 - 3015

30 - 358

35 - 404

40 - 0

Total60

Las ventas ms frecuentes de los sesenta establecimientos estn entre $25000 y $30000; $20000 y $25000. Y la menos frecuente est en $10000.

5.2 POLGONOS DE FRECUENCIAS

Es una curva que se traza a partir de los puntos medios de cada clase de amplitud; estos se unen por medio de una lnea recta, la cual se disea con base en los datos del histograma.

5.3 OJIVAS

Es el grfico de una distribucin de frecuencias acumuladas (relativa, absoluta) descendente o ascendente. Esta grfica indica la forma como crece la informacin a travs de los intervalos, se puede utilizar como medicin de las variaciones de los grupos. El punto donde se cortan las dos ojivas es el punto central de la distribucin es decir la mitad de la informacin.

5.4 BARRAS

Sirven bsicamente para establecer las diferencias entre grupos individuales y pueden ser de dos tipos:

5.4.1 Barras Verticales

Se emplean para presentar datos clasificados cronolgica o cuantitativamente:

Ejemplo: en la siguiente tabla se encuentra la informacin correspondiente a las ventas anuales de la empresa El Retorno durante el perodo de 1987 - 1996 (en millones de pesos).

AosVentas

19876

19889

198915

199030

199150

199280

1993110

1994150

1995130

1996100

5.4.2 Barras Horizontales

Se emplean para dar datos clasificados geogrfica y cualitativamente, indican la importancia de un atributo con respecto a los dems.

Ejemplo: la siguiente informacin nos indica el nmero de profesionales egresados de distintas carreras en la ciudad de Bogot en 2002:

CarreraNmero de profesionales

Ciencias Sociales1100

Administracin800

Ingenieras500

derecho700

Segmentada

Ejemplo: presenta una comparacin de la magnitud relativa de ventas dentro de cada departamento y de las ventas totales por departamentos. La siguiente informacin corresponde a las ventas por departamentos al contado y a crdito en un almacn, se presenta en miles de pesos.

DepartamentoContadoCrditoTotal

Hombres200120320

Mujeres180110290

Nios15090240

Electrodomsticos300210510

Agrupada

Muestra las ventas por departamento en una empresa al contado y a crdito y permite hacer comparaciones entre departamentos y al interior de cada uno.

Las Grficas de barras horizontales pueden presentarse de dos formas:

Circular o de Tortas

Se utiliza para representar las variables y sirve para hacer notar las diferencias en las proporciones o porcentajes. Es efectiva para permitir las comparaciones cuando los segmentos son relativamente grandes. El proceso para realizar el diagrama consiste en una regla de tres para:

Conocer el ngulo de cada sector, entonces se debe relacionar los 360 que tiene una circunferencia con el tamao de la muestra y con cada una de sus frecuencias absolutas.360 nxFiAs por ejemplo:

360 60x2

360*2x = = 1260

Donde 60 es la muestra de las ventas de los establecimientos; 2 es la frecuencia absoluta del primer intervalo.

360 60x5

360*35x = = 1860

Donde 60 es la muestra de las ventas de los establecimientos; 5 es la frecuencia absoluta del segundo intervalo.Y para conocer el porcentaje que corresponde a cada parte, relacionando 100% con el tamao de la muestra con la frecuencia absoluta.100n yFi

As, por ejemplo:Donde 60 es la muestra de las ventas de los establecimientos; 2 es la frecuencia absoluta del primer intervalo.100% 60 y 2

100*2y= = 3.3 3%60

Esto quiere decir que el 3% de los establecimientos tienen ventas entre $5000 y $10000.

Tallo y Hojas

Se puede tener un cuadro ms informativo que la tabla de recoleccin de datos si se hace un listado diferente.

Se tienen los porcentajes invertidos por 15 industrias manufactureras en el control de contaminacin de Colombia en 2001:170207040817040414030302041001

Para elaborar el diagrama de Tallos y Hojas hay que seguir los siguientes pasos:

El dgito de la extrema izquierda de cada valor es el punto de partida adecuado para clasificar los datos en dos grupos. El O y 1 se usa para formar el tallo y se escribe en columna vertical. A continuacin se escribe el segundo dgito como si fuera una hoja en el rengln adecuado del tallo, a la derecha de la barra vertical.O 3,2,4,2,7,4,4,4,8,3,11 7,7,4,0

Ya que la mayor parte de las observaciones tienen el cero como primer dgito, se puede alargar el tallo a dos categoras de O y dos de 1; en la que los segundos dgitos del O al 4 quedarn en el rengln superior y los dgitos del 5 al 9 en el inferior. Como es fcil de ordenar las observaciones en cualquier rengln, tambin se puede presentar la grfica ordenada de tallo y hojas.O 1,2,2,3,3,4,4,4,4O 7,81 0,41 7,7

Ahora se ve con facilidad que las observaciones van de 01 a 17, que nueve de las 15 observaciones son de 4 o menos.

Con el ejemplo que se ha venido trabajando; se puede elaborar este diagrama de tallos y hojas. En los siguientes datos los resultados son obtenidos en miles de pesos:

401726102621182716382233242028143025293728283322252929292132193523282215341316262420312918191123202428113439102517213418

Presentacin de los Datos en Forma de Tallo y Hojas

10,0,1,1,3,415,6,6,7,7,8,8,8,9,920,0,0,1,1,1,,2,2,2,3,3,4,4,425,5,5,6,6,6,7,8,8,8,8,8,9,9,9,9,930,1,2,3,3,4,4,438,94O4

Las presentaciones de tallo y hoja de ms de dos dgitos se pueden elaborar de diversos modos. Los siguientes datos muestran el nmero de das con aire contaminado en el 2001 en varias ciudades de Colombia:

Ciudad2001

A248

B208

C113

D128

E106

F118

G60

H79

I55

J47

K88

L47

M58

N82

O33

Para construir una grfica de tallo y hojas con los datos del 2001, los dgitos de las centenas y decenas formarn el tallo y las unidades sern las hojas.

033

047.7

055.8

060

079

0828

09

106

113.8

128

13

14

15

16

17

18

19

208

21

22

23

248

Como esta grfica es muy dispersa: hay que hacer que el tallo contenga las centenas y las hojas los dems dgitos

033,47,47

055,58,60,79,82,88

106,13,18,28

1

208,48

2

Proceso de Comprensin y Anlisis

La siguiente tabla muestra la poblacin de alguna ciudad (en millones) en los aos de 1882 2002. Representar estos datos en un diagrama de barras.

AOPOBLACIN(Millones)

188231.4

189239.8

190250.2

191262.9

192276

193292

1942105.7

1952122.8

1962131.7

1972151.1

1982179.3

1992203.3

2002226.5

La siguiente tabla muestra el nmero de sacos de trigo y maz en la cooperativa PQR durante los aos de 1992 2002:

AONMERO DE SACOS DE TRIGONMERO DE SACOS DE MAIZ

199220075

199318590

1994225100

199525085

199624080

AONMERO DE SACOS DE TRIGONMERO DE SACOS DE MAIZ

1997195110

1998210110

1999225105

200025095

2001230110

2002235100

Con referencia a la grfica, determinar el ao o aos durante los cuales:

La produccin de trigo fue mnima. La de maz fue mxima. Se dio el mayor descenso en la produccin de trigo. Decreci la produccin de maz respecto al ao anterior y creci la de trigo. Se produjo idntica cantidad de trigo La produccin conjunta de trigo y maz fue mxima.

Las reas de algunos departamentos de Colombia (en miles de millas cuadradas) se recogen en la siguiente tabla. Representar estos datos en un grfico de tortas y determinar las conclusiones ms relevantes.

DEPARTAMENTOREA (miles de millas cuadradas)

Cundinamarca11.7

Antioquia10.4

Armenia1.9

Amazonas9.4

Meta3.3

Choc6.9

Norte de Santander7.9

Total51.5

En la siguiente tabla, se ven los nmeros (en millones) de estudiantes de enseanza elemental, media y superior en Colombia. Representar los datos, usando grficos de barras y determinar algunas conclusiones.

AOELEMENTALMEDIASUPERIOR

198232.410.23.6

198735.5135.7

199237.114.77.4

199733.815.79.7

200230.614.610.2

La siguiente tabla muestra el estado civil de hombres y mujeres (de ms de 18 aos) en Colombia en 2001. Representar los datos mediante dos grficos circulares y un grfico de diseo propio.

ESTADO CIVILHOMBRES(% total)MUJERES(% total)

Soltero25.118.4

Casado66.761.3

Viudo2.412.4

Divorciado5.87.9

Una fbrica de gaseosa proyecta lanzar al mercado un nuevo sabor, para lo cual se realiza un test de aceptacin de dicho sabor, en una muestra de 32 personas. Se utiliza una escala de 30 para medir el grado de aceptacin. Los puntos obtenidos fueron los siguientes:

19 24 26 31 18 17 22 2124 19 18 19 21 32 31 2628 27 22 17 19 21 22 2430 19 26 27 28 21 24 26

Realizar la representacin del esquema de tallos y hojas de esta informacin.

Un artculo de revista titulado Amargo Panorama, habla acerca del caf colombiano y muestra un grfico de este tipo:

Qu se puede decir de este grfico?.

En la seccin de actualidad de una revista, hay un titular sobre Los Derechos Humanos: una tortura. Y muestra entre otras los siguientes grficos:

De acuerdo a estas grficas responder:

Qu porcentaje de quejas estn concluidas? Qu significado tiene el valor 3794 en el grfico de estado de las quejas? Qu interpretacin le puede dar al grfico quines se quejan?

ANEXO: Tablas

BIBLIOGRAFA GENERAL

BERNAL V. Miguel. Estadstica Descriptiva: J. Elaboracin y Presentacin de Datos Universidad de Pamplona, 1987.GALLARDO, Yolanda. Estadstica: Programa de Sicologa Universidad de Pamplona. 1997.MARTNEZ BENCARDINO, Ciro. Estadstica Comercial. Bogot: Norma, 1981.MORENO GARZN, Adonay. Serie aprender a investigar: Recoleccin de la informacin. Cali: ICFES, 1995.PARZEN, Emmanuel. Teora Moderna de Probabilidades y sus Aplicaciones Mxico: LIMUSA, 1991.PEA SNCHEZ, Damel. Estadstica Modelos y Mtodos I. Fundamentos. Madrid: Alianza editorial, 1986.PORTUS GOVINDEN. Lincoyn. Curso Prctico de Estadstica. Bogot: McGRAW - Hill, 1986.SPIEGEL Murria R. Estadstica. Madrid: McGraw Hill, 1993.