ESTADÍSTICA BÁSICA

143
ESTADÍSTICA BÁSICA CAPITULO I I - CONCEPTOS ESTADÍSTICOS . 1 - Estadística : Se refiere a la ciencia. Estudia la compilación clasificada de datos, la analiza y deduce de ella distintas conclusiones . En la actualidad se define como un método científico de operar e interpretar datos. 2 - Estadísticas : Colección sistemática de datos, presentada en forma de cuadros, tablas y gráficas . 3 - Estadístico : Persona dedicada a elaborar y analizar estadísticas . 4 - Estadígrafo : Descripción numérica de una característica correspondiente a una muestra . Medida que caracteriza a una muestra con fines descriptivos . 5- SIGNIFICADO ETIMOLÓGICO: La palabra ESTADÍSTICA viene del griego STATERO = Balanza, del latín STATUS = Situación o estado y del alemán STAAT = Estado . La estadística es una disciplina aplicada a todos los campos de la actividad humana . Es un instrumento, no un fin, para la toma de decisiones, pues esta supone un sistema o método científico que conlleva recolección, organización, análisis e interpretación de cierta información . En general, su finalidad es suministrar información y su utilidad depende, en gran parte, del fin que se proponga y de la forma como se presenten los datos. II. TERMINOLOGÍA BÁSICA : 1 - POBLACIÓN : O Universo, grupo entero motivo de estudio . Conjunto de medidas o recuento de todos los elementos que presentan una característica común . Los elementos pueden ser personas, objetos, sucesos o cosas . El elemento puede ser una ENTIDAD SIMPLE (persona) o una ENTIDAD COMPLEJA ( Familia ) y se denomina UNIDAD INVESTIGATIVA. Una POBLACIÓN puede ser FINITA O INFINITA. 2 - MUESTRA : Pequeña parte del grupo, que representa a la población . Conjunto de medidas o recuento de una parte de los elementos de la población .El número de sus elementos varía entre el 5% y el 25% de la población objeto de estudio. 3 - TIPOS DE MUESTREO : 3.1. PROBABILISTICO O ALEATORIO Puede ser a su vez 3.1.1. ALEATORIO SIMPLE : Es aquel donde todos los elementos de la población tiene la misma oportunidad de ser incluidos en la muestra . 3.1.2. ALEATORIO ESTRATIFICADO : En este la población se divide en grupos con

description

Libro estadistica

Transcript of ESTADÍSTICA BÁSICA

ESTADSTICA BSICA

ESTADSTICA BSICACAPITULO I I - CONCEPTOS ESTADSTICOS .1 - Estadstica : Se refiere a la ciencia. Estudia la compilacin clasificada de datos, la analiza y deduce de ella distintas conclusiones . En la actualidad se define como un mtodo cientfico de operar e interpretar datos.2 - Estadsticas : Coleccin sistemtica de datos, presentada en forma de cuadros, tablas y grficas .3 - Estadstico : Persona dedicada a elaborar y analizar estadsticas .4 - Estadgrafo : Descripcin numrica de una caracterstica correspondiente a una muestra . Medida que caracteriza a una muestra con fines descriptivos . 5- SIGNIFICADO ETIMOLGICO:La palabra ESTADSTICA viene del griego STATERO = Balanza, del latn STATUS = Situacin o estado y del alemn STAAT = Estado .La estadstica es una disciplina aplicada a todos los campos de la actividad humana . Es un instrumento, no un fin, para la toma de decisiones, pues esta supone un sistema o mtodo cientfico que conlleva recoleccin, organizacin, anlisis e interpretacin de cierta informacin . En general, su finalidad es suministrar informacin y su utilidad depende, en gran parte, del fin que se proponga y de la forma como se presenten los datos.II. TERMINOLOGA BSICA :1 - POBLACIN : O Universo, grupo entero motivo de estudio . Conjunto de medidas o recuento de todos los elementos que presentan una caracterstica comn .Los elementos pueden ser personas, objetos, sucesos o cosas . El elemento puede ser una ENTIDAD SIMPLE (persona) o una ENTIDAD COMPLEJA ( Familia ) y se denomina UNIDAD INVESTIGATIVA.Una POBLACIN puede ser FINITA O INFINITA.2 - MUESTRA : Pequea parte del grupo, que representa a la poblacin . Conjunto de medidas o recuento de una parte de los elementos de la poblacin .El nmero de sus elementos vara entre el 5% y el 25% de la poblacin objeto de estudio. 3 - TIPOS DE MUESTREO :3.1. PROBABILISTICO O ALEATORIO Puede ser a su vez3.1.1. ALEATORIO SIMPLE : Es aquel donde todos los elementos de la poblacin tiene la misma oportunidad de ser incluidos en la muestra .

3.1.2. ALEATORIO ESTRATIFICADO : En este la poblacin se divide en grupos concaractersticas especificas . Se realiza cuando la poblacin es heterognea, presentando gran variabilidad .3.1.3. SISTEMTICO : Consiste en determinar un intervalo igual al valor obtenido al dividir el tamao de la poblacin por el de la muestra . Luego se toma aleatoriamente un dato al que se suma el tamao del intervalo para encontrar un nuevo dato y as se continua con todos los datos .3.2. MUESTREO NO PROBABILISTICO : Se utiliza cuando se toma una muestra de cualquiertamao y los elementos se seleccionan de acuerdo con la opinin o juicio que tenga el investigador sobre la poblacin . Si la muestra es homognea, este tipo de muestra es aceptable .4 - PARMETROS : Son todas aquellas medidas que describen numricamente una caracterstica poblacional. Por ejemplo, el parmetro que describe el dato medio de un conjunto es la MEDIA.5 - VARIABLES O CARACTERSTICAS : Son ciertos rasgos, cualidades o propiedades que poseen los elementos de una poblacin o muestra.Una variable es un smbolo que puede tomar un valor cualquiera en un conjunto definido, llamado el DOMINIO de la variable.5.1. Las variables pueden ser CUALITATIVAS cuando expresan rasgos y dan origen a los ATRIBUTOS, como por ejemplo : Profesin, sexo, estado civil etc . Estos atributos a su vez tienen MODALIDADES . Por ejemplo:PROFESIN : Abogado, medico, ingeniero, etc.SEXO : Masculino, femenino .ESTADO CIVIL : Soltero, casado, viudo, divorciado .Las variables CUANTITATIVAS son aquellas que describen numricamente una caracterstica de la poblacin. A su vez, se clasifican en:VARIABLES DISCRETAS ,cuando admiten nicamente valores enteros, por ejemplo : El numero de hijos, de viviendas etc .VARIABLES CONTINUAS : admiten cualquier valor numrico dentro de un intervalo, por ejemplo : La estatura, el peso etc.5.2. DATOS : Son los entes que miden las VARIABLES, igual que ellas pueden clasificarse en DATOS CUALITATIVOS Y DATOS CUANTITATIVOS, ya sean DISCRETOS O CONTINUOS, dependiendo del tipo de variable que miden. 6- DIVISIN DE LA ESTADSTICA :6.1 - DEDUCTIVA O DESCRIPTIVA : Trata solo de describir y analizar un grupo o poblacin dada sin sacar conclusiones sobre un grupo mayor . Tiene como finalidad colocar en evidencia aspectos o caractersticas de una poblacin .

6.2 - INDUCTIVA, INFERENCIAL O ANALTICA: Trata de las condiciones en las cuales son vlidas la inferencias o conclusiones obtenidas a partir del anlisis de una muestra. Busca dar explicaciones al comportamiento de u n conjunto de observaciones, probar la validez de los resultados ; intenta descubrir las causas que lo originan . Cuando no se est absolutamente cierto de la validez de las inferencias se aplica la teora de las probabilidades .III- APLICACIONES DE LA ESTADSTICA :El campo de aplicacin de la estadstica es muy amplio . En general, se aplica a hechos que pueden ser observados y presentados mediante registros grficos y numricos . Se aplica la estadstica en la mayora de las ciencias especialmente en aquellas que tienen que ver con la experimentacin y la recoleccin de datos.

IV- LA INVESTIGACIN ESTADSTICA .La investigacin es una operacin compleja que requiere atender mltiples aspectos y que genera muy variadas funciones . Su resultado depende de la finalidad que persiga, de la naturaleza de los fenmenos y de la facilidad que se tenga para realizar las observaciones .1- CARACTERSTICAS BSICAS : Toda investigacin debe reunir las siguientes caractersticas :1.1. CLARIDAD : En todos sus aspectos debe ser clara y precisa . Conocida por todas las personas que en ella intervienen.1.2. SENCILLEZ : Es indispensable y condicin esencial de la claridad, aunque no debe limitar la presentacin completa de la investigacin .1.3. UTILIDAD : Toda investigacin debe tener una aplicacin practica que justifique su trabajo .

2. CLASES DE INVESTIGACIN:2.1. INTERNA : Investiga los fenmenos originados dentro de una empresa o entidad sin abandonar su marco territorial.2.2. EXTERNA :Se realiza con el fin de obtener informacin que permita comparar fenmenos o entidades, establecer su posicin relativa o estudiar su comportamiento actual o futuro2.3. EXHAUSTIVA : Es aquella en la cual se observan todos los elementos que constituyen la poblacin objeto de estudio.2.4. PARCIAL : Es aquella donde solo se observa una parte de los elementos o unidades que forman la poblacin ,es decir, se estudia la poblacin a travs de la muestra .3. ETAPAS DE UNA INVESTIGACIN :3.1. PLANEAMIENTO : En el plan debemos definir y organizar cada una de las actividades necesarias para llevar a cabo el trabajo y alcanzar as los objetivos propuestos . Todo plan debe tener en cuenta los siguientes aspectos :3.1.1. OBJETO DE LA INVESTIGACIN : Que se investiga ? . Es el hecho o fenmeno que se desea estudiar. En una investigacin salarial ser el salario, en una investigacin sobre rendimiento acadmico de un grupo sern los resultados durante un periodo escolar . Es de gran importancia definir el objeto de una investigacin y determinar su naturaleza cualitativa y cuantitativa . Definir las posibilidades de investigacin y sus limitaciones .3.1.2. OBJETIVO O FINALIDAD DE LA INVESTIGACIN : Qu pretende la investigacin ? Identificar con claridad y precisin el fin propuesto, formulando el problema de tal manera que nos permita establecer los objetivos generales y especficos y de ser posible jerarquizar los mismos . En esta etapa se deben responder interrogantes como : Qu se investiga ? . Cmo se realizar la investigacin ? . Cundo y dnde se realizar ? .3. 1.3. UNIDAD DE INVESTIGACIN : Dnde se realiza la investigacin ? .La unidad es la fuente de informacin, es decir, a quin va dirigida . Puede ser una persona , ungrupo familiar laboral o social, una vivienda, una empresa pblica o privada, una regin etc . Su

seleccin depende del objetivo propuesto .La unidad debe ser clara, adecuada al tipo de investigacin, mensurable y comparable . Toda unidad principal debe poseer unidades secundarias .La fuente de informacin puede ser :DIRECTA, si all se produce el hecho , como una notara por ejemplo para determinar el nmero de nacimientos,INDIRECTA : cuando se consideran aquellas fuentes donde el hecho se refleja . Por ejemplo, las rentas departamentales permiten determinar la cantidad de consumo de bebidas alcohlicas.3.1.4. EXAMEN DE LA DOCUMENTACIN Y METODOLOGA . Cmo y qu se ha investigado al respecto ?.Es importante determinar si la investigacin ha sido realizada con anterioridad con el fin de prescindir de su estudio ; averiguar si se cumpli el objetivo propuesto y si la informacin era actualizada. En caso contrario se realizar tratando de corregir todas las deficiencias presentadas en la investigacin anterior, aprovechando al mismo tiempo sus aspectos positivos .3.1.5. MTODO DE OBSERVACIN : Qu caractersticas debe reunir la investigacin ? . En qu forma se realizar la toma de datos ? .Debe decidirse por el mtodo que se emplear : Censo o Muestra. Esta eleccin depende de los siguientes factores : Tiempo disponible, recursos humanos y financieros, nmero de unidades que componen la poblacin, el grado de variabilidad etc .3.1.6. PROCESO DE RECOLECCIN : Qu tcnica se emplear al recolectar la informacin ?Los datos se pueden recolectar mediante encuestas realizadas por correo, por entrega personal del cuestionario , entrevista, panel, observacin directa, motivacin , por telfono etc .POR CORREO : Son poco costosas, pero sus instrucciones deben ser muy claras y precisas .

ENTREGA PERSONAL : Reduce la posibilidad de prdida de los cuestionarios .LA ENTREVISTA : Es el proceso de recoleccin ms empleado , pues permite recolectar el mayor nmero de cuestionarios, se obtienen respuestas a todas las preguntas , se aclaran dudas, se pueden hacer comprobaciones . Su desventaja estriba en su mayor costo y en la influencia que puede ejercer el entrevistador sobre el entrevistado .EL PANEL : Se realiza cuando se requiere informacin de grupos de familias o individuos a intervalos de tiempo definidos .Para aplicarlo es necesario motivar a sus participantes, revisar su composicin con frecuencia y cambiar los elementos que presenten fallas notorias que afecten al grupo.ENCUESTA POR OBSERVACIN DIRECTA : No requiere cuestionario . Simplemente , la persona encargada de recolectar la informacin observa los fenmenos , motiva su estudio y hace anotaciones segn pautas fijadas .ENCUESTA POR MOTIVACIN : El entrevistador pregunta libremente, procurando sintetizar los datos que aclaren el motivo de la entrevista . Este proceso es muy costoso y no permite hacer cmputos.

ENCUESTA TELEFNICA : Se emplea de preferencia para estudios de radio y televisin, cuando se requiere cierta informacin . Utilizando el directorio se seleccionan al azar los entrevistados .Se expone brevemente el objetivo de la entrevista y se procede a formular las preguntas3. 1.7. PRESUPUESTO . Se cuenta con los recursos econmicos suficientes para todo el proceso de investigacin ?.Se debe analizar si los recursos econmicos son suficientes para los costos requeridos en cada etapa, desde el planeamiento hasta el momento de la publicacin .3.1.8 CALENDARIO DE TRABAJO . Qu tiempo requiere cada etapa ? .Es el ordenamiento de las fases de la investigacin . Se debe precisar la fecha inicial y final de cada etapa . Esto permite el control del desarrollo de la investigacin . El siguiente cuadro es un ejemplo de calendario de trabajo .ETAPAS FECHAS

INICIAL FINAL1- Planeamiento.a - Fase inicial o preliminarb - Preparacin de encuestas

c - Preparacin del personal2. Recoleccin.a - Pretest (en caso de necesidad )b - Trabajo de campo3. Procesamiento y anlisisa - Depuracin y clasificacinb - Tabulacin y anlisis

c - Publicacin3.1.9. PREPARACIN DEL CUESTIONARIO . Qu contiene la encuesta y cmo se resuelve ? Al elaborar un cuestionario se consideran aspectos materiales y tcnicos .ASPECTOS MATERIALES : Tamao del formulario, calidad del papel, color de tinta, tipo de impresin etc.ASPECTOS TCNICOS : Las preguntas se ordenan gradualmente segn su dificultad . No debemos emplear abreviaturas . Las preguntas deben ser claras, precisas y comprensibles .Todo formulario debe constar de :. ENCABEZAMIENTO : Contiene el nombre de la institucin u organismo que realiza la investigacin , titulo de esta . El titulo debe llevar implcitos el qu, cmo ,cundo y dnde se realiza la investigacin,

.CUERPO : Contiene las preguntas. Si se requiere identificar al informante ser necesario iniciar preguntando : nombre, direccin, estado civil, edad, profesin etc . El cuestionario puede disponerse en serie o en cuadro . Se presenta en SERIE , cuando una pregunta va a continuacin de la otra y se usa para casos individuales . El CUADRO se emplea para formas colectivas . En un mismo cuestionario se pueden combinar ambas modalidades ..INSTRUCCIONES : Aclaran la forma como puede responderse el cuestionario . Pueden ser escritas al comienzo, al final o en una separata . OBSERVACIONES : Espacio libre al final para que el entrevistador o el entrevistado, escriban aclaraciones, opiniones o comentarios sobre el trabajo realizado .3.1.10. SELECCIN Y PREPARACIN DEL PERSONAL : Qu requisitos deben reunir los entrevistadores y cul es su funcin ?Para esta seleccin se tienen en cuenta los siguientes criterios : Nmero de personas acorde al nmero de formularios o unidades a entrevistar, conocimiento que tenga del cuestionario y del objetivo de la investigacin ; cualidades morales que le impidan falsear las respuestas; cualidades sociales y de cortesa ;presentacin personal correcta etc . El adiestramiento del personal se realiza a travs de cursos o seminarios de corta duracin .3.1.11. PREPARACIN Y ACTUALIZACIN DE LISTAS DE ENTREVISTADOS : Est seleccionada la unidad de investigacin ?.Se prepara un listado de todas las unidades que conforman la poblacin objeto de la investigacin para seleccionar de all la muestra necesaria a travs de procesos estadsticos especiales que sern objeto de estudio ms adelante .3.1.12. PROPAGANDA : Es la labor de anunciar la investigacin , para disponer el nimo del pblico fuente de informacin, al tiempo que se da a conocer el inters general de los resultados esperados.3.1.13. PRETEST O ENCUESTA PRELIMINAR : Se realiza con el fin de tener un mayor conocimiento sobre la poblacin objetivo y facilita as la prueba del cuestionario . Permite calcular costos, tiempo y variabilidad de las caractersticas que se van a estudiar.3,2. RECOLECCINSe denomina tambin trabajo de campo , es el conjunto de operaciones de observacin, anotacin y registro en los formularios . De esta etapa depende el resultado final de la investigacin . La organizacin del trabajo de campo contempla los siguientes puntos :1- Supervisin.2- Control de encuestas .3- Revisin de los cuestionarios inconclusos .4- Calidad y consistencia de las respuestas .5- Cumplimiento del calendario fijado6- Distribucin y control de los entrevistadores .En la recoleccin de datos se pueden presentar diferentes tipos de error :

1- Error de medicin o cuantifcacin de las caractersticas .2- Error del entrevistador o influencia negativa del mismo .3- Diseo defectuoso del cuestionario .4- Instrucciones imprecisas.3.3. PROCESAMIENTO Y ANLISIS .La experiencia ha demostrado que los datos obtenidos adolecen de una cantidad de errores, subsanables o no por diferentes procedimientos, atribuibles a diversas causas . Se recomienda por lo tanto ,1a revisin de procedimientos, del trabajo realizado y de los resultados obtenidos . Esta parte se conoce como depuracin de datos . Adems es importante clasificar, reunir y analizar la informacin obtenida . Los aspectos bsicos de esta etapa son :3.3.1. CODIFICACIN : Luego de revisadas las respuestas obtenidas, se procede a su codificacin, especialmente si se utiliza la tabulacin mecnica . El cdigo es un nmero que sustituye la respuesta , cuando se va a hacer su recuento . Ejemplo :Usted es un trabajador : Independiente 1 Asalariado 2 Si el nmero de respuestas pasa de 9 se emplean 2 dgitos : 01, 02, 03 , etc .3.3.2. TABULACIN : Se puede hacer por procedimientos manuales o mecnicos , dependiendo de la calidad de los formularios, del nmero de preguntas, del tiempo y de los recursos disponiblesEn la tabulacin mecnica se utilizan las tcnicas especiales que permiten el uso de computadoras . La tabulacin manual se realiza mediante la Elaboracin de cuadros, grficos y esquemas, que facilitan el anlisis de la informacin y la inferencia de conclusiones y recomendaciones .ANLISIS E INTERPRETACIN : El anlisis se fundamenta en el objetivo propuesto al iniciar la investigacin y en las hiptesis establecidas .Para lograr una mayor precisin en el anlisis, es de gran importancia el clculo de estadgrafos de centralizacin y de dispersin .Esta ultima etapa encierra dos aspectos : anlisis y evaluacin estadstica de los resultados ; anlisis y evaluacin tcnica de acuerdo con la naturaleza de la investigacin .3.3.3. PUBLICACIN : Se realiza con el fin de hacer llegar a las personas interesadas el resultado total del estudio . Se hace esencial presentar todos los aspectos considerados en el proceso investigativo , en forma clara, precisa y tcnica, adems, de la correspondiente validez que merezcan las conclusiones .Debe incluirse copia del cuestionario , resaltando las preguntas de mayor importancia ;los cuadros y grficas, acompaados del anlisis y comparaciones correspondientes y las conclusiones y recomendaciones .TALLER # 1 .1- Clasifique en finitas o infinitas las siguientes poblaciones :

a- Cerrojos producidos por una fabrica en un da .

b- Resultados obtenidos en sucesivos lances de una moneda .

c. Habitantes de la ciudad de Bogot

d- Acciones vendidas cada da en la bolsa de valores .

e- Papeletas extradas de una urna, en extracciones con reemplazamiento.2- Para los estudios anotados a continuacin, indicar cul sera la poblacin y cul la muestra adecuada, si fuere necesario:

a- Toneladas de carbn producidas en Colombia anualmente .b- Nmero de hijos por familia en la regin A .c- Pulgadas de precipitacin en la regin B durante 6 meses .d- Rendimiento acadmico de los alumnos de la U en el II semestre de 1.996 .e- Nmero de habitantes de la ciudad C .3- Clasificar cada una de las variables de las siguientes distribuciones

a- Alumnos por mes de nacimiento .

b- Profesionales por estatura y peso .

c. Obreros por salarios .

d- Accidentes por su causa .

e- Fallecimiento por edades .4- Escribir el dominio de las siguientes variables :

a- Pases del Nuevo Continente .

b- Resultados obtenidos en un lance de una moneda .

c- Estado civil de una persona .

d- Puntos obtenidos en el lance de un dado .

e- Nmero de libros de la biblioteca del colegio .5- Ubicar en estadstica descriptiva o en estadstica inferencial cada uno de los siguientes aspectos motivo de un estudio estadstico :a- Describir los grupos en trminos de su promedio de estaturas .

b- Determinar la probabilidad de que muestras de observaciones sean slo resultado de variaciones al azarc- Encontrar la diferencia entre 2 mtodos especficos de enseanza .d- Determinar la vida media de las bombillas producidas por una determinada empresa .e- Analizar la conducta de un grupo escolar frente a una evaluacin de estadstica .6- Decir si son falsas o verdaderas las siguientes afirmaciones :a- Una muestra es un subconjunto de una poblacin __ .

b- Una variable discreta admite nicamente valores enteros . __ .

c- La unidad de investigacin es la fuente de recoleccin de datos . __ .d- En el muestreo aleatorio , algunos elementos tienen la misma posibilidad de pertenecer a la muestra.e- La inferencia estadstica se realiza a partir de parmetros estadsticos . __ ,f- Una variable es la representacin numrica de la caracterstica de una muestra . __ .g- El objeto de toda investigacin es el hecho o fenmeno que se desea estudiar .______h- En una investigacin la observacin y registro de datos corresponde a la etapa de planeamiento __.i- La estadstica descriptiva debe resolver los problemas surgidos de la relacin entre precisin y sntesis ______j- Un parmetro o estadstico mide caracterstica muestral. ______

Disear un modelo de investigacin estadstica siguiendo los pasos descritos en la lectura, hasta el paso que contiene el procesamiento,

CAPITULO II

I - ESCALAS Y GRFICAS .1. FUNCIONES : Una variable Y es una funcin de la variable X cuando a cada valor de X, corresponde un solo valor de Y. Se denota Y=F(X) . Donde Y es la variable dependiente mientras que X es la variable independiente. EJEMPLO : La poblacin es funcin del tiempo es decir : P= F(T)La dependencia entre una y otra variable est a menudo recogida en una tabla . Tambin puede indicarse a travs de una ecuacin que relaciona las variables .2. TIPOS DE ESCALAS UNIFORME : Previamente se determina un valor representativo para cada uno de los valores reales del dato que se debe representar .ESCALA = Longitud del dibujo / longitud real LOGARTMICA : Las escalas o representaciones se hacen aplicando logaritmos .3. COORDENADAS CARTESIANAS : Cuando en estadstica se trata de expresar las variaciones de una funcin, se emplea la representacin mediante ejes coordenados. En el eje horizontal se representa la variable independiente y en el vertical la variable dependiente .

EJEMPLO : en una grfica de poblacin, el tiempo se ubica en el eje x, la poblacin en el eje y.

4. GRFICAS : En estadstica se emplean muchos tipos de curvas y grficas, dependiendo de la naturaleza de los datos y del propsito para el cual se elaboran . Su seleccin depende de algunos principios generales como son: La grfica debe ser sencilla y contener slo las lneas y smbolos bsicos . La grfica debe ser explcita . El titulo ha de ser claro y conciso, colocado generalmente en medio de la parte superior. Por lo general comprende,:

a- La naturaleza de los datos .

b- Su situacin geogrfica y

c- Periodo de tiempo que abarcan . Si la grfica presenta ms de una variable debe hacerse la diferenciacin mediante leyendas o signos convencionales. La grfica se presenta siempre de izquierda a derecha y de abajo hacia arriba . Los datos numricos deben presentarse en cuadro o tabla anexa, sino son incluidos en la misma grfica. Las grficas deben presentarse luego de la exposicin de un texto, nunca antes de ella .5- GRFICAS O DIAGRAMAS LINEALES :Se utilizan para representar series cronolgicas y distribuciones de frecuencias .REGLAS PARA EL TRAZADO ; El cero de la escala vertical siempre debe colocarse. La curva debe trazarse ms gruesa que las coordenadas para que resalte . Los ttulos deben ser claros y todos los letreros y notas deben colocarse horizontalmente. Las unidades empleadas deben destacarse .

EJEMPLO: INTENSIDAD DE LAS LLUVIAS DURANTE 1998, EN 3 ZONAS DEL PAIS.

6- DIAGRAMAS RECTANGULARES DE BARRAS.

Es la representacin visual mediante rectngulos. Se utilizan para todo tipo de datos.

Generalmente en el eje x se ubican las variables y en el eje y los datos numricos. Se emplean bsicamente para graficar series de datos que varan con el tiempo.

Matricula de la facultad de ingeniera .T.P. 1.985 Distribucin trimestral por zonas7. PICTOGRAMAS O PICTOGRAFOS : Se emplean cuando se trata de llamar la atencin del pblico. Consiste en grficas de objetos, animales o personas que representan una determinada cantidad de elementos8. DIAGRAMAS CIRCULARES : Se utiliza cuando se tiene un conjunto de datos que manejan pocas variables. Teniendo en cuenta la medida de la circunferencia en grados se calcula cuantos grados tiene la parte o sector circular que se desea graficar. Para su elaboracin se tiene en cuenta que el circulo completo o 360 grados equivale al 100% de los datos, as un sector circular ser una parte de ella, por ejemplo, un sector de 45 grados equivale a la octava parte del circulo o sea al 12,5%Los datos se deben transformar primero a porcentajes y luego a valores angulares.

PORCENTAJE DE REPROBADOS DURANTE 1.995TALLER # 2 :1- Dada la recta 3x+2y=9, determina si los puntos dados pertenecen o no a la recta :

a- (2,1) b-(l,2) c-Grafique.2- Organice un cuadro con la poblacin de los pases de Amrica del Sur en 1.960 y 1,982 y la tasa de alfabetismo en 1.970 y 1.980 indicando las correspondientes tasas de crecimiento .FUENTE : BBD . En miles de habitantes, alfabetismo en porcentaje . Habitantes Alfabetismo en % Pases 1.960 1.982 1.970 1.980Argentina 20.345 28.517 93.0 93.7Bolivia 3.294 5.920 37.6 62.7Brasil 72.235 124.589 60.3 70.3Colombia 17.213 27.299 78.5 77.6Chile ' 7.596 11.304 86.0 94.0Ecuador 4.429 8.483 71.1 79.0Guyana 604 803 85.0 86.0Paraguay 1.929 3.350 80.0 80.5Per 10.389 17.391 67.7 79.7Surinam 298 376 n.d 65.0Uruguay 2.617 2.921 n.d 89.8Venezuela 7.646 14.639 77.1 82.0n.d= No disponible.3- Represente los datos del cuadro anterior en : a- Diagramas lineales b- Diagramas de barras

c- Haga diagramas circulares para los datos de alfabetismo en 1.980,4- Los aviones agrcolas como modernos aparatos, participan cada vez ms en gran nmero de trabajos . Aproximadamente unos 60 pases son 19.000 aviones tratan alrededor de 200 millones de hectreas (segn la FAO). A continuacin aparecen algunos datos referentes a varios pases. Elabore un pictograma que visualice los datos .PASES # DE AVIONESRusia 8.000E.E.U.U. 6.100 Canad 666Argentina 450 Mjico 450Alemania 235FUENTE : Revista BASF- Reportes Agrcolas .5- El DAE considera como poblacin econmicamente activa aquella con 10 aos o ms . Dada la siguiente composicin de la poblacin colombiana para el ao 1.973 :Adultos : 20 a 54 aos, el 37.01%.Jvenes : 10 a 19 aos, el 26.23%.Nios : menos de 10 aos, el 29.63% .Ancianos : ms del 54 aos, el 7.13%.

Elabore un diagrama circular para los anteriores datos y haga una interpretacin del mismo .CAPITULO IIIDESCRIPCIONES ESTADSTICAS.I-DISTRIBUCIN DE FRECUENCIAS :Un distribucin de frecuencias es un mtodo para organizar y resumir datos, clasificndolos' y ordenndolos previamente .1- TOMA DE DATOS :Es la obtencin o recoleccin de los mismos ,sin seguir un orden definido.2- ORDENACIN :Colocacin de los datos numricos en forma creciente o decreciente de acuerdo a su magnitud.3- RANGO : Es la diferencia entre el mayor y el menor de los datos .Se llama tambin RECORRIDO.4- ELABORACIN DE TABLAS O CUADROS : Se sugieren las siguientes recomendaciones : Definir un criterio de ordenacin de datos . Titulo del cuadro. Debe ser claro y conciso, que responda a interrogantes como : qu, cmo, dnde y cundo se adquiri la informacin .Se puede colocar arriba o abajo dejando dos espacios intermedios. Su encabezamiento contiene ttulos y subttulos de las columnas . Debajo del cuadro se escribe la fuente de los datos, explicacin de abreviaturas, convenciones etc. ESQUEMA DE CUADROTtuloEncabezamiento

Subttulo

Totales

Cuerpo o datos

totales

FUENTE:5- TIPOS DE CUADROS:5.1UNIDIMENSIONALES : Cuando se elaboran con una sola caracterstica o variable .5.2 BIDIMENSIONALES : Se trabaja simultneamente con dos variables .5.3. MULTIDIMENSIONALES : Cuando se estudian tres o ms variables simultneamente.EJEMPLOS :DISTRIBUCIN UN1MENSIONALEDAD

#DE PERSONAS(f)

16-20

5

21-25

4

26-30

8

31-35

12

36-40

9

TOTALES

38

DISTRIBUCIN BIDIMENSIONALSEXO

PROFESIN

MASCULINO

FEMENINO.

TOTAL

Medicina

12

8

20

Abogaca

9

6

15

Odontologa

4

8

12

Fsica

2

3

3

Ingeniera

15

10

25

TOTALES

42

33

75

6- CONCEPTOS BSICOS .La siguiente tabla muestra una distribucin de frecuencias de los salarios por da de 60 empleados de una empresa.SALARIOS ( pesos )

# de empleados ( f )

100- 200

10

200- 300

2

300 400

20

400- 500

15

500- 600

8

600- 700

5

TOTALES

60

Los datos as ordenados y resumidos se denominan DATOS AGRUPADOS. En este ordenamiento se pierde parte del detalle original de los datos pero tiene la ventaja de presentarlos en forma clara y sencilla, facilitando su comparacin y anlisis .6.1. INTERVALOS DE CLASE : 400 - 500, es un intervalo de clase . Es un smbolo que define una clase o grupo de datos. Los valores 400 y 500 son los LIMITES DE CLASE ; Superior e inferior,6.2. LIMITES REALES : Son los valores reales de los extremos, suponindolos como aproximaciones . En el intervalo 400 - 500, los limites reales son 399.5 y 500.5 .6.3. TAMAO DEL INTERVALO ; Es la diferencia entre los limites reales, redondeadas sus cifras ; 500.5 - 399.5 101, 6.3.MARCAS DE CLASE : Punto medio del intervalo. Semisuma de los extremos . En el ejemplo anterior : 400 -500 su marca de clase = ( 400+ 500) = 450.6.4..FRECUENCIA : Nmero de veces que se repite un dato o evento. Tambin se denomina

FRECUENCIA ABSOLUTA.. En el intervalo 400 - 500 su frecuencia es 15 .La frecuencia total es la suma de las frecuencias absolutas

7.REGLAS BSICAS PARA FORMAR DISTRIBUCIONES :7.1. Definir el rango, a partir del mayor y del menor valor o dato .7.2. Determinar el nmero de intervalos, preferible del mismo tamao . El nmero vara entre 5 y 20, dependiendo bsicamente del nmero de datos, con el fin de disminuir el error estandar y la dispersin .7.3. Establecer las frecuencias .En este momento es conveniente elaborar la llamada TABLA DE CONTEO.7.4. Determinar la amplitud o tamao de los intervalos, esto depende del rango y del nmero de intervalos pues :

Amplitud = Rango / nmero de intervalos.

7.5. EJEMPLOS SOBRE DISTRIBUCIONES DE FRECUENCIAS.

EJEMPLO 1.Un examen de estadstica de una hora produjo las siguientes puntuaciones:83

91

88

82

81

84

62

93

50

63

96

68

73

80

97

95

91

38

82

72

88

83

78

93

69

78

91 87

84

91

Vamos a construir una distribucin de frecuencias de 6 intervalos.

PROCESO :

a-RANGO : Determinamos el mayor dato ( 97) y el menor dato ( 38) y hallo su diferencia : 97-38= 59.

b-NUMERO DE INTERVALOS : 6.

c-AMPLITUD DE INTERVALOS : La amplitud o tamao de los intervalos es el cociente entre el RANGO Y EL NUMERO DE INTERVALOS , asi :

AMPLITUD = RANGO/ No INTERVALOS = 59/ 6 = 9,83, este valor se puede aproximar por defecto a 9 y por exceso a 10 por lo tanto vamos a tener intervalos de 9 y de 10 de amplitud, el problema consiste en saber cuantos de cada tipo, para esto procedemos as :

Si se toman todos 6 intervalos de amplitud 10 se tendra un Rango de 6 x 10 = 60 sobrando 1 de 59.

Si se toman todos 6 intervalos de amplitud 9 se tendra un Rango de 6 x 9 = 54 faltando 5 para 59.

Debemos formar entonces : 5 intervalos de 10 de amplitud = 5 x 10 = 50 y

1 intervalo de 9 de amplitud = 1 x 9 = 9

RANGO. = 59 d- INTERVALOS : La formacin de los intervalos se hace a partir de los datos asi :

1 : 38 + 10 = 48 1 = 47 :INTERVALO : 38 47

2 : 48 + 10 = 58 -1 = 57 INTERVALO : 48 --57

3 : 58 + 1 0 = 68 1 = 67 . INTERVALO : 58 -- 67

4 : 68 + 10 = 78 1 = 77 .. INTERVALO : 68 --- 77

5 : 78 + 10 = 88 1 = 87 .INTERVALO : 78 ----87.

6 : 88 + 9 = 97 , Como es el ltimo intervalo no necesitamos restar nada.

e-TABLA DE CONTEO : Necesitamos determinar las frecuencias , para esto se elabora una tabla de conteo as

Dato Fi Dato Fi Dato Fi Dato F i

38 1 72 1 83 2 95 1

50 1 73 1 84 2 96 1

62 1 78 2 87 1 97 1

63 1 80 1 88 2

68 1 81 1 91 4

69 1 82 2 93

6 8 13 3 = 30 DATOS.

f- DISTRIBUCION DE FRECUENCIAS :

INTERVALOSFRECUENCIAS

38 -------- 471

48 ---------571

58.672

68774

788711

889711

TOTAL30

EJEMPLO 2 :

Las edades de los estudiantes de una muestra que se tom entre los asistentes al Sandhills Community College en el presente semestre son:19 18 55 17 33 19 15 32 22 2029 25 23 24 28 41 19 30 33 1844 21 20 19 18 17 20 20 22 39 Construya una distribucin de frecuencias de 5 intervalos .

a- RANGO : Dato mayor = 55 , Dato menor = 15 RANGO = 55 15 = 40

b- No INTERVALOS : 5.

C- AMPLITUD = RANGO / No INTERVALOS = 40 / 5 = 8 . Como el cociente es exacto todos los intervalos son de 8 de amplitud

D- INTERVALOS :

1 : 15 + 8 = 23 1 = 22 . INTERVALO .: 15-----22

2 : 23 + 8 = 31 1 = 30 INTERVALO : 23 ----30

3 : 31 + 8 = 39 1 = 38 . INTERVALO : 31 ------38

4 : 39 + 8 = 47 1 = 46 INTERVALO : 39 ------ 46

5 : 47 --- 55

E - TABLA DE CONTEO

DatoFiDato FiDatoFiDato Fi

151211281391

172222291411

183231301441

194241321551

204251332

TOTAL20TOTAL10TOTAL6TOTAL4

F- DISTRIBUCION DE FRECUENCIAS :

INTERVALOSFi

15---- 2217

23 .. 306

31 .. 383

39 463

47 551

TOTAL30

TALLER # 3;En la tabla adjunta se dan los promedios acumulativos en matemticas, al final del tercer periodo escolar de una muestra de 100 alumnos en el colegio X , del 6o grado :a- Construir una tabla de conteo.b- Precisar el rango de la variable.c- Cuntos alumnos obtuvieron puntuacin de 360 ms?, d- Cuntos alumnos obtuvieron puntuacin de 250 menos ?.e- Qu porcentaje de alumnos reprueban el rea ? .(base= 360)f- Elabore dos distribuciones de frecuencia : una de 5 intervalos y otra de 8 intervalos .416

358

317

363

365

291

404

422

241

288

328

263

402

254

362

424

440

317

299

279

333

382

300

347

421

368

365

356

440

387

294

390

249

418

315

243

273

379

359

263

385

481

279

408

317

299

424

440

254

362

402

288

328

422

241

291

404

363

365

358

317

501

416

360

282

411

424

387

444

354

376

375

420

269

252

405

359

252

399

269

372

354

376

387

444

411

424

360

282

501

408

348

315

481

501

438

310

482

446

385

II - GRFICAS DE LAS DISTRIBUCIONES DE FRECUENCIA1- HISTOGRAMAS : Son una forma de visualizar las frecuencias de clase, por medio de reas de rectngulos . Difieren de los diagramas de barras, pues en estos las alturas miden el tamao de las variables y se dibujan generalmente SEPARADAS, En un histograma las frecuencias quedan representadas por el rea de los rectngulos, no por su altura y las barras se dibujan sin dejar espacio entre ellas , Las bases de los histogramas en el eje X tienen centro en las marcas de clase y longitud igual al tamao de los intervalos.2- POLGONOS DE FRECUENCIAS : Son grficas de lneas trazadas sobre las marcas de clase, se pueden obtener uniendo los puntos medios de los techos de los histogramas ,3- OJIVAS : Son grficas lineales trazadas sobre los lmites superiores de clase, en una distribucin de frecuencias acumuladas. Se denomina tambin POLGONO DE FRECUENCIAS ACUMULADAS. (lmite superior real de clase) .Son semejantes a las siluetas linealesEJEMPLO : Las estaturas de 100 alumnos de la Universidad X, estn representados en la siguiente tabla:Altura (cms)

# estud.

(F)

160-162

18

163-165

20

166-168

45

169-171

9

172-174

8

Total

El Histograma y el polgono de frecuencias es el siguiente:

Frecuencias

40

30

20

10

Intervalos

159.5 162.5 165.5 168.5 171.5 174.5

Marcas de clase : 158 161 164 167 170 173 176

4- DISTRIBUCIN DE FRECUENCIAS ACUMULADAS :La frecuencia acumulada de una clase es la frecuencia total de todos los valores menores que el lmite real superior de clase de un intervalo dado. La tabla correspondiente se denomina DISTRIBUCIN DE FRECUENCIAS ACUMULADAS. Esta tabla es la empleada para elaborar la OJIVA, dependiendo de el lmite que se emplee puede ser "OJIVA MENOS DE" u "OJIVA MAYOR DE"En el ejemplo anterior la tabla de frecuencias acumuladas para el lmite superior real o MENOS DE es :ALTURA (CMS )

# ESTUDIANT. ( f ACUMULA.)

Menos de 162.5

18

Menos de 164.5

38

Menos de 168.5

83

Menos de 171.5

92

Menos de 174.5

100

La OJIVA MENOS DE es la siguienteFrecuencias

100

80

60

40

20

Intervalos

162.5 165.5 168.5 171.5 174.5

5 -DISTRIBUCIONES DE FRECUENCIAS RELATIVAS .Las frecuencias relativas de una clase equivalen a la frecuencia de clase dividida por el total de frecuencias de todas las clases. Este dato generalmente se da como un porcentaje.EJEMPLO : La frecuencia relativa de la clase 166-168 del ejemplo 1 es : Frecuencia relativa ( Fr ) = 45/1 00= 0.45 = 45 %.Una tabla de frecuencias relativas se denomina tambin DISTRIBUCIN PORCENTUAL, su grfica puede ser un histograma o un polgono de frecuencias relativas .6 -DISTRIBUCIN DE FRECUENCIA PORCENTUAL ACUMULADA :Se llama tambin Distribucin de frecuencias relativas acumuladas .La frecuencia relativa acumulada es la frecuencia acumulada dividida por la frecuencia total, se expresa en PORCENTAJE .EJEMPLO : En la tabla de frecuencias acumuladas ( grfica de la ojiva ) tenemos : La frecuencia acumulada relativa para estaturas menores de 164.5 es : Frecuencia relativa % = 38/100= 0.38= 38% Estas tablas tambin se pueden representar grficamente en una de las OJIVAS dadas anteriormente.TALLER # 4:1 - Elabore la tabla de frecuencias relativas para la tabla dada en el primer ejemplo . Haga su histograma y su polgono .2- Elabore la tabla de frecuencias relativas acumuladas para la tabla del primer ejemplo . Haga su Ojiva .3- La siguiente distribucin muestra los pesos de 120 alumnos de un colegio :Intervalos Intervalos Frecuencias

35-38

19

39-42

16

43-46

26

47-50

15

51-54

14

55-58

8

59-62

13

63-66

9

Totales

120

Precisar los siguientes aspectos :a- Lmites de la tercera clase .b- Lmites reales de la cuarta clase.c- Tamao del cuarto intervalo.d- Marca de clase de la segunda y tercera clase .e- Frecuencia de la tercera y cuarta clase.f- Distribucin de frecuencias relativas.g- Histograma y polgono de frecuencia y de frecuencia relativa.h- Distribucin de frecuencia acumulada "Menor que" y "Mayor que", al igual que la distribucin acumulada porcentual, i- Ojivas correspondientes a las anteriores distribuciones ,

CAPITULO III . MEDIDAS DE TENDENCIA CENTRAL.La distribucin de frecuencias y su representacin grfica nos permite tener una idea global de la informacin con respecto a una poblacin. Esta idea es de tipo cualitativo, por lo que interesa un anlisis cuantitativo del fenmeno para as tener un estudio completo del problema. Es necesario reducir la muestra a un conjunto de medidas llamados ESTADGRAFOS. Analizaremos a partir de este momento las medidas de tendencia central.1- LA MEDIA ARITMTICA .Llamada tambin PROMEDIO. Se denota como xm y se calcula de la siguiente manera:1.1 . Cuando los datos no se repiten .Si Xi, X2, X3 , X4)_Xn ; representan datos observados, su media se define como: Xm = X1 + X2+X3+..+Xn / n = Xi / n , donde n = nmero de datos .EJEMPLO : La media aritmtica del conjunto de nmeros : {25,32,48,28,30,35,} es : _ X - 25+32+48+28+30+35 Xm = 25+32+48+28+30+35 / 6 = 36.33

1.2. Cuando los datos se repiten : En este caso aparecen con sus frecuencias absolutas, como en una TABLA DE CONTEO.Si Xi, X2, X3, X4..., Xn tienen respectivamente frecuencias : Fl F2? F3, F4,..., Fn ; su media aritmtica ser ; X m = FiX1,+ F2X2+ F3X3+ F4X4+ ... + Fn.Xn / F1+ F2+ F3+ F4 + . . . + Fn = Fi Xi / Fi .

EJEMPLO : La media de la siguiente serie de datos esX

F

1

3

2

5

3

4

4

8

5

3

Total

23

X m = 3x I +5x2+4x3 +8x4+3 x5 = 3.13 23 1.3. Para datos agrupados en una distribucin de frecuencias (intervalos).En este caso se aplica la anterior frmula, empleando como dato la marca de clase de cada intervalo.EJEMPLO : Calcular la media de la siguiente distribucin :Intervalos

Frecuencias

Marca de clase

36-37

15

36.5

38-39

45

38.5

40-41

35

40.5

42-43

30

42.5

Totales

125

Le anexamos a la tabla la marca de clase de cada intervalo. A continuacin aplicamos la frmula anterior y obtenemos :_ 36.5x15+ 38.5x45+ 40.5x35+ 42:5x30X= = 39.78,

125

1.4. PROPIEDADES DE LA MEDIA ARITMTICA.1. En toda distribucin, la suma de las desviaciones con respecto a la media es igual a cero. !

2. La suma de los cuadrados de las desviaciones respecto a la media es siempre menor que la suma de los cuadrados de las desviaciones respecto a cualquier otro valor. Por esta propiedad podemos afirmar que la media es la medida de tendencia central que minimiza la suma de los cuadrados de las desviaciones en torno a ella.3- La media de una constante por una variable, es igual al producto de la constante por la media aritmtica de la variable.4- La media de la suma de una constante y una variable es igual a la suma de la constante y la media de la variable.5- La media de la suma de dos o ms variables es igual a la suma media de las medias de las variables TALLER # 5 :1- Investigar qu es lo que se conoce como PROMEDIO PONDERADO. D un ejemplo.2- Las calificaciones de un alumno en sus pruebas finales de curso fueron : 85, 73, 78, 67, 86, 80, 90, 95, 92. Cul fue su calificacin promedio ?3- Las velocidades de un auto en kms/h durante un viaje fueron :30 45 50 35 43 55 35 60 48 56 38 30 60 50 45 56 60 50 45 35 45 48 45 38 43 45 56 48 60 50 56a- Elabore una tabla de conteo.b- Construya la distribucin de frecuencias absolutas para cinco (5) intervalos .c- Elabore el histograma y el polgono de frecuencias abs.d- Construya la distribucin de frecuencias relativas .e- Construya el histograma y el polgono de frecuencias relativas .f- Elabore la distribucin de frecuencias acumuladas "mayor que".g- Haga la ojiva de frecuencias acumuladas .

h- Construya la distribucin porcentual de frecuencias acumuladas i- Haga la ojiva de distribucin acumulada porcentual. j- Cul es la velocidad media del auto ?

4- Un empleado realiza un curso de promocin en 4 materias, cuyo valor total es de 15 crditos . Las notas obtenidas fieron : 67, 86, 96, 72. Si las materias valen 4, 6, 3 y 2 crditos respectivamente. Cul fue el promedio obtenido ?5- Los salarios mensuales de 6 empleados de una empresa son : $500.000, $650.000, $360.000, $420.000, $200.000 y $530.000. Calcule el sueldo medio de la empresa.6-Cul es el peso medio de un grupo de 500 personas del cul se sabe que el peso medio de las mujeres es de 45 Kgs, el de los hombres es de 52 kgs y en total hay 200 mujeres.7- Un grupo de 6 estudiantes obtuvo las siguientes calificaciones en matemticas, ingls e historia respectivamente:75,86, 72, 84, 70, 78, 83, 95, 78, 90, 87, 86, 73, 68, 70, 69, 72, 71. Cul fue la calificacin promedio del grupo ?.8-En una investigacin sobre poblacin en 6 zonas, se encontr que el nmero de habitantes es de : 4.580, 3.700, 5.476, 5.230, 6.325,4.837. (por miles). Se supone que en 10 aos la poblacin se duplicar. Cul ser la poblacin promedio de la regin dentro de 10 aos ?2- LA MEDIANALa mediana es el valor central de los datos o sucesos ordenados en forma creciente o en forma decreciente . La simbolizamos por : Med.CALCULO DE LA MEDIANA :2.1. Cundo los datos o sucesos NO se repiten : Calculemos la mediana a los datos : 15, 6, 3, 8, 10 .Lo primero que debemos hacer es ordenar los datos, hagmoslo en forma ascendente y ubiquemos el valor central: 3, 6, 8 ,10, 15 . La mediana es 8 porque tanto a la izquierda como a la derecha de l hay igual cantidad de datos ( 2 ). Calculemos la mediana de los datos : 18, 3, 15, 10, 6, 7.Ordenamos los datos : 3, 6, 7,10, 15, 18. Aqu no existe un nico valor central, en este caso, la mediana es el PROMEDIO de los 2 valores centrales 7 y 10, es decir : 7+10 / 2 =8.5. Como conclusin, podemos anotar entonces que : "La mediana de un conjunto de datos o sucesos ordenados, es igual al valor central si el nmero de datos es impar y es igual al promedio de los 2 valores centrales si el nmero de datos es par.2.2.Cuando los datos se repiten :Ejemplo 1 :La tabla siguiente representa las notas obtenidas durante un semestre. Calcular su mediana.Notas :XiFrecuencias Absolutas: FiFrecuencia acumulada

211

323

447

6512

8719

Total19

SOLUCIN : Dividimos el total de datos por 2 as:Fi / 2 = 19 / 2 =9.5 . Localizo en la tabla la Frecuencia acumulada inmediatamente superior a 9.5, ya que no existe 9.5 ; tomo la inmediata superior que es 12. Selecciono el Xi correspondiente y este valor es la mediana, en este caso es 6Ejemplo 2 :La tabla que sigue, representa la distribucin de frecuencias de las masas en Kgs de un grupo. Calcular su mediana.Masa : XiFr Abs : FiFrecuencia

acumulada

3588

36412

37517

39926

40632

42234

Total34

SOLUCINEncuentro la mitad de las frecuencias ~ 17. Como en la tabla existe una frecuencia acumulada igual a 17, localizo tambin la superior inmediata = 26. Buscamos los Xi correspondientes y la mediana es el promedio, es decir : F i = 17 , Xi = 37 y Fi = 26, .X = 39, luego la mediana es, Med = (37+39) /2 = 38

2*3. Datos agrupados en una distribucin con intervalos :En este caso la mediana se calcula mediante la formula :Med = L+ N/2- Fi acumul. Donde : L= Lmite real inferior de la CLASE MEDIANA( ) xC

F median N= Frecuencia total o nmero de datos. Fi acumul,= Sumatoria de frecuencias por debajo de la clase mediana. Fmediana = Frecuencia de la clase mediana ( Frecuencia absoluta ).C = Tamao del intervalo de la clase mediana, teniendo en cuenta los lmites reales

Se denomina CLASE MEDIANA al intervalo que corresponde a la acumulacin de la mitad de la frecuencia total.Ejemplo : Calcular la mediana para la siguiente distribucin :IntervalosFrecuencia absolutaFrecuencia acumulada

13-1588

16-18513

19-21220

22-24424

25-271034

28-30640

Totales40

SOLUCION :

Como Fi / 2 = 40/2= 20. El intervalo correspondiente a 20 es el intervalo 19 - 21 = Clase mediana. Entonces : L= 18.5= Lmite real inferior. N= Frecuencia total = 40.

Fiacumul, = Frecuencia acumulada por debajo de la clase mediana = 13 .

C = Tamao del intervalo de la clase mediana :21.5-18.5 = 3.

F mediana = Frecuencia absoluta de la clase mediana = 7.Aplicando la frmula anterior obtengo : N/2-Fiacum 40/2-13Med= L+ ( )xC= 18,5 + ( ) x 3 =18.5 + 3 = 21, 5 .

F median 7La mediana de la distribucin es 21,5TALLER 6:1- En quince das, un restaurante sirvi desayunos a 40,52, 55,38,40,48,56,56,60,37,58,63,46,50 y 61 clientes. Obtenga la mediana.2- En 1991, doce vendedores de autos usados vendieron 58, 70, 85, 42, 64, 46, 66, 89, 44, 93, 58 y 79 autos usados. Obtenga la mediana.3- Veinte fallas de energa duraron 18, 125, 44, 96, 31, 26, 80,49,125,63,45,33,89,12,103,75,40,80,61 y 28 minutos. Obtenga la mediana.4- En diecinueve pginas de un informe, un mecangrafo cometi O, O, 1, 2, O, 3, 1,0, O, O, O, 1, 0,0,4, 1, O, O y 2 errores. Encuentre(a) la media; (b) la mediana.5- Los siguientes valores son los tiempos en minutos de veinticinco juegos de la National Baskeball Association (NBA): 138 142 113 126 135142 159 157 140 157121 128 142 164 155139 143 158 140 118142 146 123 130 137(a) Obtenga la mediana directamente ordenando los datos de acuerdo con su tamao.(b) Obtenga la mediana elaborando una distribucin de frecuencias de 5 intervalos.6- En cierto mes, quince vendedores alcanzaron 107,90,80, 92, 86, 109, 102, 92, 353, 78, 74, 102, 106,95 y 91 por ciento de sus cuotas de ventas. Calcule la media y la mediana de estos porcentajes e indique cul de las dos medidas da una mejor idea del rendimiento "promediode los vendedores.7- Calcule la mediana a los ejercicios propuestos en la media aritmtica para datos agrupados y no agrupados, 3. LA MODA:Es el dato de mayor frecuencia. Es la abcisa del pico de la grfica.Una distribucin o grupo de datos que posee una moda se denomina unimodal, si posee dos modas se dicebimodal si tiene varias modas se denomina multmodaL Un conjunto de datos sin REPETIR no tIiene moda.EJEMPLO : En el conjunto de datos : 3,4, 5, 4, 2, 7,4, 2. , la moda es 4 por ser el valor de mayor frecuencia .3.1. MODA PARA DATOS AGRUPADOS : El clculo de la moda en una distribucin de frecuencias, se realiza a partir de la seleccin de la clase modal, es decir , del intervalo con la mayor frecuencia. Posteriormente se aplica la siguiente frmula : Mod. = L + ( 1 / 1 + 2 ) x C

Siendo : L = Lmite real inferior de la clase modal.

1= Exceso o diferencia de la frecuencia modal con la frecuencia de la clase

contigua ianterior . 2 = Exceso o diferencia de la frecuencia modal con la frecuencia de la clase contigua siguiente. C= Tamao del intervalo de la clase modal.EJEMPLO:Calcular la moda para la siguiente distribucin de frecuencias :Intervalos

Frecuencias

13-15

8

16-18

5

18-21

7

22-24

4

25-27

10

28-30

6

Totales

40

SOLUCIN : La clase modal es 25- 27, pues corresponde a la mxima frecuencia que es 10.

L= 24.5 1 =10 - 4 = 6 2 =10 - 6 = 4 C= 27.5 -24.5 = 3.Aplico la frmula dada anteriormente y obtengo :Moda= 24,5 + (6/6+4). 3= 24.5 + (6/10)3 = 24.5+ 1.8 = 26.3

TALLER # 7:1- Calcule las medidas de tendencia central vistas hasta el momento en la serie de nmeros : 2,2,3, 5, 6, 4, 2, 5, 8, 7, 12, 7, 8 ,20. Compare los resultados obtenidos.2- La tabla siguiente muestra la distribucin de la edad de los alumnos de un colegio en el ao 1.996EDAD (aos ))

Frecuencia (F)

9-11

48

12-14

120

15-17

352

18-20

80

21-23

40

Totales

640

a- Hallar la media aritmtica de las edades.b-. Hallar la mediana de las edades.C.- Calcule el valor de la moda de la distribucin. Compare estas medidas y concluya.d- Construya el histograma correspondiente. Localice en l las medidas anteriores.3- Un estudio de la capacidad de frenado de un automvil con un nuevo sistema de frenos, veintin conductores que viajaban a treinta millas por hora pudieron frenar en las distancas siguientes, expresadas en pies:69 58 70 80 4661 65 74 75 5567 56 70 72 6166 58 68 70 6858a- Forme una distribucin de frecuencias y encuentre la media y la mediana.b- Calcule la moda de la tabla y de la distribucin formada..4- Los siguientes son los nmeros de das que diecisiete personas se anticiparon para comprar localidades para un evento deportivo: 7, 3, 4, 12, 18, 3. 8. 14, 6, 16, 7, 6, 1 1, 7, 9, 5 y 2. Encuentre la moda.5- En cincuenta das, stos fueron los nmeros de estudiantes ausentes en una clase de lgebra.1 3 0 0 1 0 4 1 0 1 0

1 2 6 0 1 0 0 1 0 0 0

0 1 3 3 2 5 0 1 1 1 0

3 0 0 0 4 1 1 2 1 2 0

1 0 1 0 0 3 2 0 1 2 1 Encuentre la moda.4. CARACTERSTICAS DE LA MEDIA, LA MODA Y LA MEDIANA.

4.1. EFECTO DE LOS VALORES EXTREMOS :De las medidas de tendencia central vistas hasta el momento, la ms susceptible a los valores extremos es la media, las otras dos no se ve afectadas de una forma tan fuerte como esta medida. Por ejemplo, en la serie numrica : 3, 5, 7, 7, 8 ; la media es 6 ; Si se cambia el extremo 8 por 18, se tiene que la serie es 3, 5, 7, 7, 18 cuya media es ahora 8 ; es decir, la media vari de 6 a 8. La mediana en cambio es insensible a dichos cambios y es 7 en ambas series ; igual sucede con la moda que es 7 en ambas series .

El conocimiento de las tres medidas es importante porque da una buena apreciacin de la distribucin de los valores ; pero si se debe hacer una apreciacin con una sola medida, es mucho ms conveniente emplear la mediana como medida de tendencia central.4.2. CURVA DE FRECUENCIAS Y LAS MEDIDAS DE TENDENCIA CENTRAL.

Y y y

X x x

Media Mediana ModaLas grficas anteriores muestran la posicin de cada una de las medidas de tendencia central. La media es el punto de equilibrio de la grfica semeja al centro de gravedad. La mediana divide el rea bajo la curva en dos partes de igual rea. La moda es la abcisa de mayor ordenada o pico de la curva

4.3. EFECTOS DE LA ASIMETRA :En una distribucin simtrica las tres medidas son idnticas, si la distribucin se torna asimtrica se presenta lo siguiente : No existe cambio en la moda ; la mediana y la media en cambio pueden variar de posicin en el sentido de la asimetra. La asimetra positiva sesga la distribucin hacia la derecha aumentando la mediana y la media ya que hay una mayor concentracin de frecuencias y de observaciones hacia dicho lugar. La asimetra negativa sesga la distribucin hacia la izquierda diminuyendo el valor de la mediana y la media .4.4. CUAL ES LA MEDIDA A ESCOGER ?.La seleccin de la medida de tendencia central depende de la informacin que exista y del objetivo de la informacin. En una distribucin aproximadamente simtrica, se puede emplear cualquier medida . Si los datos no estn ordenados resulta ms fcil el clculo de la media que la mediana, la moda se haya por simple bsqueda del valor ms frecuente. Si se desea calcular totales, la nica medida utilizable es la media, en cambio si se desea ubicar las condiciones de una persona en una clase, la mediana es la medida ms indicada ya que por comparacin pone en evidencia si la persona est por sobre la mitad o por debajo de ella. Si la distribucin tiene forma de progresin aritmtica, se emplea como promedio la mediana o la moda. Si los datos dan forma geomtrica, se emplea la media geomtrica. Si la distribucin presenta intervalos de diferente amplitud, no debe emplearse la moda. Si la distribucin presenta el primero y el ltimo intervalo abiertos se debe usar como promedio la mediana o la moda.5. OTRAS MEDIDAS DE TENDENCIA CENTRAL ;5.1. LA MEDIA GEOMTRICA :La media geomtrica de una serie de N datos se define como raz N-sma del producto de los N datos. Se simboliza por G y se define : G = n . X1 . X2 . X 3 .X4 ..Xn = n Xi

Cuando los datos estn afectados por una frecuencia se emplea la siguiente frmula :

G = n X 1f1 . X2f2 . X3f3 ..Xnfn

Para datos agrupados en una distribucin reemplazamos X por las marcas de clase de cada intervalo.La media geomtrica es til en el clculo de tasas de crecimiento, es decir en el clculo de promedios que estn dados en forma de progresin geomtrica.EJEMPLOS:1- El crecimiento de las ventas en una fabrica en los ltimos 5 aos fue del 20%, 22%, 32%, 29% y 30%. Cul fue la tasa anual de crecimiento ?SOLUCIN : La solucin a este problema es el clculo de la media geomtrica ; teniendo en cuenta que : Decir que : El crecimiento de ventas durante un ao fue del 20%, significa que un artculo Xi de valor $1, fue vendido en $1,20 ; si fue del 22% significa que un artculo X2 de valor $1 fue vendido en $1,22 y as sucesivamente, luego:

G= 5 1,20 x 1,22 x1,32 x1,29 x 1,30 = 1,265 aprox.5.2. LA MEDIA ARMNICA :Usualmente se designa por la letra H, se define como el reciproco dla media aritmtica de los recprocos de los nmeros dados, es decir : 1 N

H = =

1/N . 1/ Xi 1/ X iEsta medida de tendencia central se emplea para promediar razones que son inversamente proporcionales.EJEMPLOS:1. Calcular la media armnica entre los nmeros : 4, 5, 7, 7, 8

. Solucin: 5 5

H = =

+ 1/5 +! /7 +!/7 241/2802. Un obrero pinta una casa en 6 das y otro puede pintarla en 8 das. Cul ser el rendimiento de un obrero modelo que sea representativo del trabajo de los dos obreros ?

Solucin:El valor hallado ser la media armnica de los datos presentados as : 2 H = ------------------ = 48/7 = 6.85aprox 1/6 + 1/8TALLER # 8:1- Los salarios aumentaron los ltimos 4 aos en 28%, 23%, 27%, y 25% ; halle : a) la tasa de crecimiento total en los 4 aos.2- En una industria se ha controlado el tiempo que tardan 3 obreros en ensamblar un motor. Uno demora 6 horas, otro demora 8 horas y el tercero se demora 5 horas. Cul es rendimiento de un obrero modelo que sustituya a los tres anteriores ? , 3- Una empresa de transporte tiene tres autobuses diferentes que emplean en el recorrido entre dos pueblos 16, 15 y 12 horas respectivamente. Halle el tiempo que empleara un autobs modelo que sirva de base para el estudio de costos ?4- Halle dos nmeros cuya media aritmtica es 9.0 y su media geomtrica es 7.2 .5- Halle el valor promedio de un kilo de mercanca adquirida en tres lotes as: 340 kg a $28.30 cada uno, 260 kg a $ 30.10 cada uno y 535 kg a $27.50 cada uno .6. MEDIDAS DE POSICION . CUANTILES : CUARTILES, DECILES Y PERCENTILES :Este tipo de medidas se utilizan cuando la distribucin contiene un gran nmero de datos o de intervalos de clase.6.1. Los cuartiles : Son los valores que dividen el conjunto de datos en cuatro partes iguales. Se representan como : Q1 , Q2 y Q3 que significan primero, segundo y tercer cuartil respectivamente. Para el clculo de los cuartiles se emplea la misma frmula de la mediana, sustituyendo N/2 por N/4, N/2 y 3N/4 para cada uno de los cuartiles en su orden.De acuerdo a la posicin ocupada en los datos, se tiene que :

El cuartil 1 : Q1 , corresponde al dato a partir del cual esta por debajo el 25% de los datos.

El cuartil2 ; Q2 corresponde al dato a partir del cual esta por debajo el 50% de los datos, es decir es la misma mediana.

El cuartil 3 ; Q3 , corresponde al dato a partir del cual esta por debajo el 75% de los datos.6.2. Los deciles :Son los valores que dividen el conjunto de datos en diez partes iguales. Se representan como D1, D2, D3, D4,....... D9. El quinto decil coincide con el valor de la mediana.Su clculo se realiza sustituyendo en la frmula de la mediana el VALOR de N/2 por N/10,2N/10, 3N/10, 4N/10, .....,9N/10 a partir de la primera clase.Igual que en los cuarteles, por debajo de cada decil se encuentra el 10, 20, 30 , 40% . 90% de losa datos.

6.3. Los percentiles :Son los valores que dividen el conjunto de datos en 100 partes iguales. Se representan por P1, P2 , P3, P4 , ., P99 . El percentil nmero 50 equivale a la ,mediana y su hallazgo se efecta aplicando la frmula de la mediana previa sustitucin de N/2 por N/100, 2N/100, 3N/100,........ 99N/100.Las medidas anteriores reciben el nombre genrico de CUANTILES. Igual que en los cuartiles y deciles, cada percentil es un dato por debajo del cual se halla el 1, 2, 3, 4, .99% de los datos. TALLER # 9 :

1-Encuentre la media de la siguiente distribucin de las calificaciones que obtuvieron 500 estudiantes en un examen de geografa:Nmero de Calificacinestudiantes

10-2444

25-3970

40-5492

55-69 147

70-84115

85-9932

En la tabla anterior halle tambin :

(a) los deciles D1 y D7;(b) los percentiles P5 y P88

2- Obtenga la media de la siguiente distribucin de edades de los miembros de un sindicato:

Edad (aos)Frecuencia

15-19

16

20-24

35

25-29

44

30-34

27

35-39

17

40-44

8

45-49

2

50-54

1

Refiriendonos a la distribucin del ejercicio anterior, encuentre :a- Cuartiles Q1 y Q3

b-Los deciles D3 y D 7 .

c- Los percentiles P10, P20 y P65.3-Encuentre la media de la siguiente distribucin de los porcentajes de los estudiantes que pertenecen a un grupo tnico determinado en una muestra de 50 escuelas primarias :

Porcentaje

Nmero de escuelas

0- 4

18

5- 9

15

10-14

9

15-19

7

20-24

1

Refirindonos a la distribucin del ejercicio anterior, encuentre (a) la mediana; (b) los cuartiles Q 1 y Q 2.

(c)Calcule D1 , D3 y D 9 (d) Halle P12, P45 , P70 y P85 CAPITULO IV - MEDIDAS DE DISPERSIN.1. DISPERSIN : POR QUE ES IMPORTANTE ?Para contestar esta pregunta, examinemos las tres curvas de distribucin presentadas en la siguiente figura : Media de A,B y CComo puede observarse la media de las tres curvas es la misma, pero la curva A tiene menor extensin o variabilidad que la curva B y sta a su vez tiene menor variabilidad que la curva C. Si medimos la media solamente de las tres distribuciones, estaremos pasando por alto una diferencia importante que existe entre las tres curvas . Al igual que sucede con cualquier conjunto de datos, la media, la mediana y la moda slo nos revelan una parte de la informacin de lo que necesitamos saber acerca de las caractersticas de los datos. Para aumentar nuestro entendimiento del patrn de los datos, debemos medir tambin su dispersin, extensin o variabilidad Porqu la dispersin de una distribucin es una caracterstica tan importante para entender y medir ?

. Primero, nos proporciona una informacin adicional que nos permite juzgar la confiabilidad de nuestra medida de tendencia central. Si los datos se encuentran muy dispersos, como los de la curva C, la posicin central es menos representativa de los datos, como un todo, que cuando estos se agrupan ms estrechamente alrededor de la media, como en la curva A.

Segundo, ya que existen problemas caractersticos para datos ampliamente dispersos, debemos ser capaces de distinguir que presentan esa dispersin antes de abordarlos.

Tercero, quizs deseemos comparar las dispersiones de diferentes muestras. Si no se desea tener una amplia dispersin de valores con respecto del centro de la distribucin o esto presenta riesgos innecesarios, debemos tener habilidad para reconocerlo y evitar escoger las distribuciones que presenten ms dispersin.

3. MEDIDAS DE DESVIACIN PROMEDIOLas medidas de la dispersin son aquellas que tratan de determinar la desviacin promedio con respecto a alguna medida de tendencia central. Entre estas medidas tenemos :3.1. DESVIACIN MEDIA .'Llamada tambin desviacin media absoluta o promedio de desviacin. Indica la dispersin de los datos con respecto a la media aritmtica. Smbolo = M. D.3.1.1. Para datos no repetidos, no agrupados: Sean X1, X2, X3, X4, ..., Xn datos cuya media aritmtica es X med , entonces su desviacin media es :

| X i - Xmed |

M.D. =

n EJEMPLO : En una evaluacin de matemticas, se obtuvo las siguientes calificaciones : 95, 68, 56, 76, 72, 42, 66, 70, 82, 63 . La media aritmtica de estos datos es igual a 69, es decir :

X med = 95+68+56+76+72+42+66+70+82+63/ 10 = 69 .Las desviaciones respecto a la media son :

95-69 = 26, 68-69 = -!, 59-69 = -13, 76-69=7, 72-69=3, 42-69= -27, 66-69=-3, 70-69=1, 82-69=13, 63-69 = -6.

Tomando los valores absolutos de estas cantidades se tiene que la desviacin media ser entonces : 26+1 + 13+7+3+27+3+1+13+6 M.D. = = 10 10

3.1.2. Para datos con repeticin, es decir agrupados : Si los datos : XI , X2, X3, ...., Xn, tienen frecuencias : fi, f2, f3 ,, ..., f n , su desviacin media ser :

Fi | X i - Xmed |

M.D. =

F i

EJEMPLOS:a- Calcular la desviacin media en la tabla de conteo:Xi

Fi

Fi . Xi

| Xi - Xmed |

Fi .|Xi - Xmed |

7

3

21

3,7

11,1

8

4

32

2,7

10,8

10

3

30

0,7

2,1

13

2

26

2,3

4,6

16

2

32

5,3

10,6

14

5

70

3,3

16,5

18

2

36

7,3

14,6

20

1

20

9,3

9,3

6

6

36

4,7

28,2

9

2

18

1,7

3,4

Totales

30

321

111,2

La desviacin media para la tabla anterior ser :

111,2M.D.= 30

b-.Para datos agrupados en una distribucin :En este caso se considera cada X como la marca de clase y F i como la frecuencia de la clase o intervalo correspondiente y se emplea la frmula dada anteriormente.

EJEMPLO : Halle la desviacin media de la siguiente distribucin :EDADES (AOS

MORTALIDADFi

MARCA DE DE CLASEXi

Fi.Xi

1 - 8

11

9 - 16

20

17 - 24

14

25 - 32

58

33 - 40

75

41 - 48

21

49 - 56

24

57 - 64

6

65 - 72

20

X med =TOTAL

250

M.D = .3.2. DESVIACIN MEDIANA : Se usa en distribuciones con valores extremos o con intervalos abiertos. Resulta de sustituir la media por la mediana en la desviacin media. Se simboliza como : m. d.. y se define como sigue :

3.2.1.- PARA DATOS SIN AGRUPAR :

m. d. = x i - mediana / n , donde n es el nmero de trminos.

Recuerde que el calculo de la mediana depende de la cantidad de datos que haya, PAR o IMPAR , luego de ordenar los datos.EJEMPLOS:

a- Calcular la desviacin mediana de las siguientes edades : 18, 21, 32, 15, 17, 31, y 42 aos .

SOLUCION: Se ordenan los datos y luego se determina el dato central pues existe nmero impar de datos as :

15, 17, 18, 21, 31, 32, 42. El dato central es 21 que corresponde a la mediana. Ahora con este valor se hallan las desviaciones as : 21-15 = 6, 21-17 = 4, 21-18 = 3 , 21-21 = 0 , 21 31 = -10 = 10 , 21- 32 = - 11 = 11 , 21 42 = - 21 = 21 . L a desviacin mediana ser :

m.d. = x i - mediana / n = 6+4+3+0+10+11+21 / 7 = 7, 85

3.2.2. Para datos agrupados : La desviacin mediana se calcula mediante la frmula :

m.d. = Fi | X i Mediana| / F i .

Donde , x i puede ser una dato si se da una tabla de conteo o una marca de clase si se da una distribucin de frecuencias. Recuerde que el clculo de la mediana tambin varia dependiendo de la forma cmo se den los datos.

EJEMPLOS :

1. Las edades de dos grupos de estudiantes se dan a continuacin :

Grupo A : 12, 26, 18, 14, 17, 19, 22, 15, y 31

Grupo B : 22, 17, 16, 21, 15, 19, 26, 33, 18 y 25 .

Utilizando la desviacin mediana, determine que grupo tiene mejor distribucin de edades.

SOLUCION: Para el Grupo A . Como los datos son sin agrupar, hallamos su mediana as :

Ordeno los datos : 12, 14, 15, 17, 18, 19, 22, 26, 31 , hay 9 datos y el dato central = 18 = mediana.

Hallo las desviaciones :

xi mediana : 12-18=6 , 14-18= 4 , 15-18= 3 ,17-18=1, 18-18=0,

19-18=1, 22-18=4 , 26-18=8, 31-18=13 , La suma da : 40, la desviacin mediana ser entonces : m.d. = 40/9 = 4,44 .

Para el Grupo B. Los datos son sin agrupar, los ordeno as: 15,16,17,18,19,21, 22,25, 26, 31. Como hay 10 datos los 2 centrales son : 19 y 21 cuyo promedio es (21+19)/2= 20 = mediana.

Las desviaciones respecto a la mediana son :

xi- mediana : 15-20=5, 16-20=4,17-20=3,18-20=2,19-20=1,21-20=1,

22-20=2,25-20=5,26-20=6,31-20=11. La suma d: 40, la desviacin mediana ser entonces : m. d. = 40/10= 4, Como esta desviacin es menor que la anterior, este grupo tiene mejor distribucin.

EJEMPLO 2: En un grupo las edades se distribuyen en base a la siguiente tabla de conteo

Edades1315161719222528Total

No personas4682545640

Calcule la desviacin mediana de estas edades.

SOLUCION. Los datos son agrupados en una tabla de conteo, hallamos la mediana para esto anexamos inicialmente la columna de frecuencias acumuladas as :

Frecuencia acumulada410182025293440

Inicialmente hallamos la mitad del total de datos : fi / 2 = 40/2 =20. Como este valor aparece en la columna de frecuencias acumuladas, se toman 20 y 25 y se buscan los respectivos xi correspondientes a cada uno de ellos, la mediana es el promedio de estos datos as :

Los datos buscados son : Para 20 es 17 y para 25 es 19 su promedio es :

Mediana = (17+19)/2= 18 .

Con este valor de la mediana se hallan las desviaciones as :

xi-mediana 13-18=532114710

Cada desviacin se multiplica por cada frecuencia es decir se halla : f i x i mediana as :F I x i- mediana5x4=20181625163560 = 172

La desviacion mediana es : m.d. = 172 / 40 =4,3,

EJEMPLO 3: En otro grupo las edades tienen otra distribucin as :

Edades1214161719212230Total

No personas31256481645

Calcular la desviacin mediana del grupo.

SOLUCION: Anexo frecuencia acumulada para hallar la mediana as :

Frecuencia acumulada315202630383945

Hallo la mitad de los datos ; fi /2 = 45/2 = 22,5 .Este valor no aparece en la columna de frecuencias acumuladas, por lo tanto se toma el valor que lo contiene es decir : 26, el dato que corresponde a esta frecuencia es la mediana es decir, mediana = 17. La desviaciones para esta mediana sern :

xi mediana 12-17 =531024513

Cada desviacin se multiplica por cada frecuencia es decir se halla : f i x i mediana as :F I x i- mediana5x3 =153650832578= 179

La desviacin mediana sera : 179/ 45 = 3,977.

De acuerdo con estos datos el Segundo grupo tiene mejor distribucin de las edades .

EJEMPLO 4 : Las estaturas en cms de un grupo de personas se distribuyen as :

Estatura(cms)125-134135-144145-154155-164165-174175-190Total

No personas81064121555

Calcular la desviacin mediana de esta distribucin.

SOLUCION: Se anexa inicialmente la columna de frecuencia acumulada y luego se calcula la marca de clase, que sern los xi as :

FREC. Acumulada81824284055

Marca de clase129,5139,5149,5159,5169,5182,5

Se halla la mitad de los datos para hallar la mediana, as : fi /2 = 55/2 = 27,5 . Con este valor se busca la clase mediana en la frecuencia acumulada, el valor que se aproxima por exceso es 28 que corresponde al intervalo : 155 164 que es la CLASE MEDIANA .En este intervalo se tiene que :

L = limite real inferior del intervalo = 154,5 fi /2 = 27,5 , Frecuencia acumulada antes de la de la clase mediana = 24, frecuencia absoluta de la clase mediana = 4 Amplitud de la clase mediana = 164-155 +1 = 10 . Con estos datos el valor de la mediana ser :

Mediana = L +{ ( fi / 2 F acumulada anterior ) / f. Mediana } . Amplitud =

Mediana = 154,5 + { ( 27,5- 24) / 4 } . 10 = 154,5 + (3,5/4). 10 = 154,5 +8,75 = 163,25.

Con este valor de la mediana se hallan las desviaciones respecto a las marcas de clase as :

xi mediana 129,5-163,25 = 33,7523,7513,753,756,2519,25

Cada desviacin se multiplica por cada frecuencia es decir se halla : f i x i mediana as :F I x i- mediana33,75x8=270237,582,51575288,75= 968,75

El valor de la desviacin mediana es : m.d. = 968,75/ 55 = 17,613.

EJEMPLO 5 :

DESVIACION MEDIANA DE DATOS AGRUPADOS EN UNA DISTRIBUCION DE FRECUENCIAS.La siguiente distribucin corresponde a los calificaciones obtenidas por un grupo de Matematicas .

INTERVALOS20 2930 3940 49505960 697080TOTAL

FRECUENCIAS101281191060

Calculemos la desviacin mediana :

SOLUCION :Anexamos a la tabla anterior la marca de clase y la frecuencia acumulada as

FRECUENCIAS ACUMULADAS102230415060

Marca clase24.534,544,554,564,575

Hallamos inicialmente la mediana , recordemos que para hallar la mediana se debe emplear la formula :

Mediana = L + f i /2 - f acumulada x amplitud.

F mediana

Para hallar la mediana debe agregarsele a la tabla la columna de frecuencias acumuladas que permite determinar la CLASE MEDIANA, asi :

Mitad de los datos = fi/ 2 = 60/ 2 = 30 , luego la CLASE MEDIANA es el intervalo 40-49 donde se tiene que :

L = limite real inferior = 39,5 ; F acumulada = 22 ; f mediana = 8 y Amplitud = 49- 40 + 1 = 10 , la mediana es :

Mediana = 39,5 + ( 30 22 )/8 x 10 = 39,5 + 1x10 = 49,5.

Para calcular la DESVIACION MEDIANA se debe aplicar la formula

m.d. = fi xi mediana , donde xi = marcas de clase, luego debo completar la tabla

fi

XiXi medianaFi Xi mediana

24,525250

34,515330

44,5540

54,5

La desviacin mediana ser : m.d. =

3.3. DESVIACIN TPICA O STANDAR :En este caso es importante diferenciar los dos tipos de desviacin existentes, para la poblacin y para la muestra. La desviacin standar poblacional se indica como :

( Sigma ) y la desviacin standar muestral se indica como : SLa desviacin standar poblacional se define as:

= (x- ) 2 / N = Para datos no agrupadosEn donde se tiene que :X = una observacin o dato. = ( miu) = media poblacional N= Total de datos.

El clculo de la desviacin tpica muestral se hace mediante la anterior frmula simplemente se sustituye , por la media muestral = Xmed . y N por n -1, donde n = nmero de observaciones de la muestra.La frmula dada anteriormente se emplea en el caso de datos sin agrupar en el caso de tener datos agrupados en una tabla de conteo o en una distribucin de frecuencias , el trmino del numerador se ve afectado por el factor de las frecuencias y si existe una distribucin de frecuencias los datos ( Xi) se toman como las marcas de clase y se aplica la frmula :

= f i ( x i x med ) 2 / f i -1

4- Varianza : Esta medida de dispersin se define como el cuadrado de la desviacin tpica o standar. En su clculo se emplean por lgica las frmulas dadas anteriormente, con sus respectivas caractersticas, es decir :Varianza poblacional = 2 y Varianza muestral = S 2

EJEMPLOS:

1-Los salarios de un grupo se dan en la siguiente tabla en S.M.L. , as

Salarios22,32,533,445Total

No pers.68101227550

Calcule la desviacin tipica y la varianza de los datos anteriores.

SOLUCION .

El calculo de la desviacin tpica o S, implica hallar la media para datos agrupados as :

Fi . xi2x6= 12 18,425366,82825= 139,2

El valor de la media ser : Media = 139,2 / 50 = 2,784.

Con este valor se hallan las desviaciones y su cuadrado y se multiplica por la frecuencias asi:

xi- media 0,7840,4840,2840,2160,6161,2162,216

xi media20,61460,23420,08060,04660,37941,47864,9106

F I x i- media2 3,68761,87360,8060,55920,758810,350224,553= 42,5884

La desviacin tpica ser : S = 42,5884 / 50 = 0,8517 = 0,9229 La varianza ser el valor sin extraer la raz cuadrada es decir, 0,8517 .2. Calcular las medidas de dispersin anteriormente anotadas en la siguiente distribucin :Intervalo

Fi

Xi

Xi. Fi

Xi xmed

,(xi-xmed)2

Fi. (Xi-Xmed)2

Xi- med

50-54

4

55-59

7

60-64

12

65-69

3

70-74

10

75-79

4

80-84

8

85-90

2

Total

50

5. Resultado estndar o calificacin Z.La desviacin estndar es til para describir que tan lejos las observaciones individuales de una distribucin se apartan de la media de la distribucin. Una medida que se conoce como resultado estndar o calificacin Z nos da el nmero de desviaciones estndar que un dato en particular ocupa por debajo o por encima de la media. Si hacemos que X simbolice el dato, entonces el resultado estndar calculado a partir de los datos de una poblacin es: Resultado estndar = (X ) /

Donde : X = dato observado, = Media poblacional, = Desviacin estndar poblacionalSi se habla de una muestra, se toma como Xmedia y se toma como S, entonces para un dato x de una muestra cualquiera su resultado estandar es :

Z = ( x X media) / S

EJEMPLOS:1- Supongamos que un frasco contiene un compuesto con un 0.108 % de impureza. Si la poblacin tiene una media de 0.166 y una desviacin estndar de 0.058, cul es el resultado estndar para dicho dato ? Resultado STD = ( 0.108 - 0.1660.) / 058 = -1 2- Una impureza observada de 0.282 % tiene una desviacin Std de +2 . Verifiquelo !2. ALCANCES O RANGOS.La dispersin puede medirse en trminos de la diferencia entre dos valores seleccionados del conjunto dedatos. Podemos analizar tres de las llamadas medidas de distancia: El alcance o rango, el alcance interfractil y el alcance intercuartL2.1. Alcance o rango. Se denomina as a la diferencia entre el mayor y el menor de los datos.Es decir :

Alcance = Dato mayor - dato menorEl rango no es sensible a los cambios en los datos, solamente se ve afectado cuando dichas variaciones se dan en los valores extremos, razn por la cual el rango o alcance no es una medida de dispersin confiable.Para las distribuciones de extremo abierto no existe alcance, pues no existe un valor "ms bajo" o "ms alto en la clase de extremo abierto.

2.2. Alcance o rango interfractil : Se denomina as a la diferencia entre dos cuantiles cualesquiera siempre y cuando no sean los cuarteles, es decir entre dos deciles o dos percentiles.

2.3. Alcance intercuartil : Se denomina as a la diferencia entre los valores de los cuartiles 1 y 3, es decir : Alcance intercuartil = Q3 - Q1Taller #10Para la muestra siguiente :2.549 3.897 3.661 2.697 2.200 3.812 2.228 3.981 2.668 2.2683.692 2.145 2.653 3.249 2.841 3.469 3.268 2.598 3.842 3.362Calcule :a- Alcance.b- Alcance interfractil entre los percentiles vigsimo y octogsimo.c- Alcance intercuartil,5.USOS DE LA DESVIACIN ESTNDAR.5.1. Teorema de Chebyshev. .Este teorema es una de las aplicaciones ms importantes de la desviacin estndar y establece que:" Dado un nmero k, mayor o igual que 1 y un conjunto de n observaciones Xi, X2, X3,..., Xn por lo menos ( 1 - 1/k 2 ) de las observaciones se encuentran dentro de k desviaciones estndar de la media".El teorema de Chebyshev se aplica a cualquier conjunto de observaciones y para propsitos de ilustracin nos referiremos tanto a la muestra como a la poblacin, teniendo en cuenta las diferentes notaciones .

La idea contenida en el teorema anterior se ilustra en la siguiente figura : Frecuencia

relativa

Al menos 1-1/k2

k k

Ilustracin del teorema de TchebysheffSe construye un intervalo midiendo la distancia de k unidades a ambos lados de la media , entonces calculando la fraccin (1-1/k2), vemos que el teorema de Chebyshev establece que al menos esa fraccin de los datos caern en el intervalo construido.Tomemos algunos valores numricos de k y calculemos la fraccin (1-1/K2) as:Cuando k = 1, ( 1-1 / k2) = O de las observaciones se encuentran en el intervalo - a + , que es un resultado poco til.Sin embargo, cuando k= 2, vemos que al menos (1- 1 / 2 2 ) = de las observaciones se hallan en el intervalo que va de : - 2 a . + 2 y as sucesivamente.En funcin de porcentajes, el teorema de Chebyshev nos dice que " No importa que forma tenga la distribucin, al menos el 75% de los datos caen dentro de + - 2 desviaciones estndar a partir de la media de la distribucin, y al menos el 89% de los datos caen dentro de + - 3 desviaciones estndar a partir de la media.

5.2. Regla emprica.Podemos medir an con ms precisin este porcentaje de observaciones que caen dentro de un alcance especfico de curvas simtricas de forma acampanada, esta medicin nos lleva a plantear la regla conocida como "REGLA EMPRICA" cuyo enunciado establece que :"Dada una distribucin de observaciones cuyo polgono es de forma acampanada, podemos decir que :1- El intervalo contiene el 68% de los datos.2- El intervalo 2 contiene el 95% de los datos.3. El intervalo 3 contiene todos o casi todos los datos.EJEMPLO:Se hace un estudio para determinar el tiempo necesario para realizar una operacin especfica en una planta industrial. El tiempo necesario para realizar dicha operacin se midi para n= 40 trabajadores. La media y la desviacin tpica fueron 12.8 y 1.7 respectivamente. Describa los datos.Para describir los datos, calculamos los intervalo bsicos as:

Xmed S = 12.8 1.7 es decir, 11.1 a 14.5 .

Xmed 2 S = 12.8 2(1.7), es decir, 9.4 a 16.2 .

Xmed 3S = 12.8 3(1.7), es decir, 7.7 a 17.9 .Aunque no tenemos informacin acerca de la distribucin hay una buena posibilidad de que tenga una forma monticular y por lo tanto la regla emprica nos puede proporcionar una buena descripcin de los datos, en el caso de que dudemos de la forma acampanada de la distribucin se puede aplicar el teorema de Chebyshev y as estar completamente seguros de nuestra afirmacin.

5.3. Resultado estndar o calificacin Z.La desviacin estndar es tambin til para describir que tan lejos las observaciones individuales de una distribucin se apartan de la media de la distribucin. Una medida que se conoce como resultado estndar o calificacin Z nos da el nmero de desviaciones estndar que un dato en particular ocupa por debajo o por encima de la media. Si hacemos que X simbolice el dato, entonces el resultado estndar calculado a partir de los datos de una poblacin es: Resultado estndar = (X ) /

Donde : X = dato observado, = Media poblacional, = Desviacin estn