Estadistica Descriptiva

9
Modulo de Estadística ESTADÍSTICA Rama de las matemáticas aplicadas, que estudia los hechos económicos, sociales y físicos a base de datos numéricos; entre las estadísticas más antiguas cuentan los censos de población, el cálculo de ganados y cosechas, etc. La estadística es una ciencia, pues aplica el Método ientífico al ocuparse de la toma, organi!ación, recopilación y análisis de datos, tanto para la deducción de conclusiones, para la toma de decisiones ra!onables de acuerdo a tales análisis. Población: "e le llama población o uni#erso, al con$unto total de indi#iduos u ob$etos que se desean in#estigar. Muestra: %s un grupo de una población. "e utili!a cuando la población es muy numerosa, infinita o muy difícil de e&aminar. Estadística Descriptiva: %s la parte de la estadística que trata solamente de describir y anali!ar un grupo dado sin sacar conclusiones o inferencias de un grupo mayor, a partir de ella. La estadística descripti#a incluye las técnicas que se relacionan con el resumen y la descripción de datos numéricos. %stos datos pueden ser gráficos o pueden incluir análisis computacional. Estadística Inferencial: uando una muestra es representati#a de una población se pueden deducir importantes conclusiones acerca de esta, a partir de su análisis. La inferencia estadística comprende aquellas técnicas por medio de las cuales se toma decisiones sobre una población estadística basadas solo en la muestra obser#ada. 'ebido a que dichas decisiones se toman en condiciones de incertidumbre, entonces estas serán confiables con cierto grado de probabilidad. onsiderando que las características medidas de una muestra se denominan estadísticas de la muestra, las características medidas de una población estadística, o uni#erso se llaman parámetros de la población. ANALISIS ESTADISTIC Distribución de !recuencias( Las distribuciones de frecuencias, son series estadísticas ordenadas por intervalos de clases, y por lo tanto, corresponden a la clasificación de grupo de datos, de acuerdo a una característica cuantitati#a. %sta distribuciones se elaboran cuando se tiene una masa de datos, para reducirla a grupos homogéneos y poco numerosos, con fines de descripción, análisis y obtención de indicadores. Serie si"ple o arre#lo: %s un simple listado de la información obtenida de una fuente de datos. E$e"plo: "ueldos mensuales, en pesos, pagados a )* traba$adores de una empresa, ordenados en forma ascendente( )+*.*** )-*.*** )-*.*** ) *.*** ) *.*** /**.*** /**.*** /-*.*** /-*.*** 0**.*** 0**.*** 0-*.*** 0-*.*** -**.*** --*.*** --*.*** 1**.*** 1**.*** 2**.*** 2-*.*** omo el sueldo es mínimo es 3)+*.*** y el má&imo 32-*.***, el %an#o de los salarios es( 2-*.*** )+*.*** igual a 3-0*.***. omo esta tabla no permite tener un idea de la distribución de los sueldos, hay que clasificarlos en un cuadro de frecuencias. 1

description

Definiciones y ejercicios

Transcript of Estadistica Descriptiva

ESTADSTICA

Modulo de Estadstica

ESTADSTICA

Rama de las matemticas aplicadas, que estudia los hechos econmicos, sociales y fsicos a base de datos numricos; entre las estadsticas ms antiguas cuentan los censos de poblacin, el clculo de ganados y cosechas, etc.

La estadstica es una ciencia, pues aplica el Mtodo Cientfico al ocuparse de la toma, organizacin, recopilacin y anlisis de datos, tanto para la deduccin de conclusiones, para la toma de decisiones razonables de acuerdo a tales anlisis.

Poblacin: Se le llama poblacin o universo, al conjunto total de individuos u objetos que se desean investigar.

Muestra: Es un grupo de una poblacin. Se utiliza cuando la poblacin es muy numerosa, infinita o muy difcil de examinar.

Estadstica Descriptiva: Es la parte de la estadstica que trata solamente de describir y analizar un grupo dado sin sacar conclusiones o inferencias de un grupo mayor, a partir de ella. La estadstica descriptiva incluye las tcnicas que se relacionan con el resumen y la descripcin de datos numricos. Estos datos pueden ser grficos o pueden incluir anlisis computacional.

Estadstica Inferencial: Cuando una muestra es representativa de una poblacin se pueden deducir importantes conclusiones acerca de esta, a partir de su anlisis. La inferencia estadstica comprende aquellas tcnicas por medio de las cuales se toma decisiones sobre una poblacin estadstica basadas solo en la muestra observada. Debido a que dichas decisiones se toman en condiciones de incertidumbre, entonces estas sern confiables con cierto grado de probabilidad. Considerando que las caractersticas medidas de una muestra se denominan estadsticas de la muestra, las caractersticas medidas de una poblacin estadstica, o universo se llaman parmetros de la poblacin.

ANALISIS ESTADISTICO

Distribucin de Frecuencias: Las distribuciones de frecuencias, son series estadsticas ordenadas por intervalos de clases, y por lo tanto, corresponden a la clasificacin de grupo de datos, de acuerdo a una caracterstica cuantitativa.Esta distribuciones se elaboran cuando se tiene una masa de datos, para reducirla a grupos homogneos y poco numerosos, con fines de descripcin, anlisis y obtencin de indicadores.

Serie simple o arreglo: Es un simple listado de la informacin obtenida de una fuente de datos.

Ejemplo: Sueldos mensuales, en pesos, pagados a 20 trabajadores de una empresa, ordenados en forma ascendente:

210.000 - 250.000 - 250.000 - 280.000 - 280.000 - 300.000 - 300.000 - 350.000 - 350.000 - 400.000 - 400.000 - 450.000 - 450.000 - 500.000 - 550.000 - 550.000 - 600.000 - 600.000 - 700.000 - 750.000

Como el sueldo es mnimo es $210.000 y el mximo $750.000, el Rango de los salarios es: 750.000 - 210.000 igual a $540.000.Como esta tabla no permite tener un idea de la distribucin de los sueldos, hay que clasificarlos en un cuadro de frecuencias.

Tabla de frecuencias sin clase (datos no agrupados):Los datos de la tabla anterior se pueden resumir, al registrarse el nmero de trabajadores, de acuerdo a su sueldo.

Para ello debemos considerar cada intervalo con lmites cerrado y abierto, o sea [210.000,300.000[La tabla siguiente la vamos a elaborar con frecuencias absolutas, estas frecuencias son las que se obtienen directamente del conteo, pero, tambin incorporaremos las frecuencias relativas que corresponden a los porcentajes de cada frecuencia absoluta, en este caso, se determina con respecto al total de trabajadores (20).

Tambin incorporaremos a la tabla la frecuencia absoluta acumulada que corresponde a la frecuencia absoluta del intervalo ms la suma de las frecuencias absolutas de todos los valores anteriores y la frecuencia relativa acumulada que corresponde al porcentaje de la frecuencia relativa del intervalo ms la suma de las frecuencias relativas de todos los valores anteriores.

La marca de clase corresponde al valor medio de cada intervalo.

Representaciones GrficasPara hacer ms clara y evidente la informacin que nos dan las tablas se utilizan los grficos. Existen mltiples tipos de grficos, pero aqu trataremos solamente de los usados ms frecuentemente, que son: grfico de barras, grfico de sectores o circular (pastel), histograma, polgono de frecuencias, la ojiva y el pictograma.

Grfico de Barras: Se usa fundamentalmente para representar distribuciones de frecuencias de una variable cualitativa o cuantitativa discreta y, ocasionalmente, en la representacin de series cronolgicas o histricas. Uno de los ejes sirve para inscribir las frecuencias, ya sean absolutas o relativas (%), y el otro para la escala de clasificacin utilizada.

Ejemplo:

Grfico circular: Se usa, fundamentalmente, para representar distribuciones de frecuencias relativas (%) de una variable cualitativa o cuantitativa discreta. En este grfico se hace corresponder la medida del ngulo de cada sector con la frecuencia correspondiente a la clase en cuestin. Si los 360 del crculo representan el 100 % de los datos clasificados, a cada 1% le correspondern 3,6. Luego, para obtener el tamao del ngulo para un sector dado bastara con multiplicar el por ciento correspondiente por 3,6 (por simple regla de tres).

Ejemplo:

Histograma: Este grfico se usa para representar una distribucin de frecuencias de una variable cuantitativa continua. Habitualmente se representa la frecuencia observada en el eje Y, y en el eje X la variable

Ejemplo:

Polgono de frecuencias: Se utiliza, al igual que el histograma, para representar distribuciones de frecuencias de variables cuantitativas continuas, pero como no se utilizan barras en su confeccin sino segmentos de recta, de ah el nombre de polgono. Habitualmente se usa cuando se quiere mostrar en el mismo grfico ms de una distribucin.

Ejemplo:

Ojiva: Su objetivo, al igual que el histograma y el polgono de frecuencias es representar distribuciones de frecuencias de variables cuantitativas continuas, pero slo para frecuencias acumuladas

Ejemplo:

Pictograma: Se utiliza un dibujo relacionado con el tema, para representar cierta cantidad de frecuencias. Este tipo de grfica atrae la atencin por los dibujos, pero la desventaja es que se lee en forma aproximada.

Medidas de Tendencia CentralLa utilidad de las medidas de tendencia central se puede ver claramente cuando es necesario determinar, por ejemplo, en qu lugar se ubica la persona promedio o tpica de un grupo, para comparar o interpretar cualquier puntaje en relacin con el puntaje central o tpico, para comparar el puntaje obtenido por una misma persona en dos diferentes ocasiones, para comparar los resultados medios obtenidos por dos o ms grupos y otros casos.

Las medidas de tendencia central ms comunes son:

La media aritmtica: comnmente conocida como media o promedio. Se representa por medio de una letra M en otros casos por .La mediana: la cual es el puntaje que es ubica en el centro de una distribucin. Se representa como Md.La moda: que es el puntaje que se presenta con mayor frecuencia en una distribucin. Se representa Mo.

Cmo calcular la mediana, la media y la moda.Para determinar la mediana, se ordenan los valores de mayor a menor o lo contrario. Se divide el total de casos entre dos, una vez el valor resultante corresponde al nmero del caso que representa la mediana de la distribucin. En muchas ocasiones, los casos son tan numerosos que no se pueden ordenar uno tras otro sino que se agrupan por frecuencia de ocurrencia en cada valor o por intervalos de clase cuando el rango de posibles valores de la variable es muy amplio. En estos casos el proceso es un poco ms complejo y requiere de la utilizacin de la siguiente frmula:

Li= lmite inferior de la clase medianac=amplitud del intervaloN=nmero total de datosFi-1=frecuencia absoluta acumulada de la clase anterior a la medianafi=frecuencia absoluta de la clase mediana

Para calcular la media aritmtica de un conjunto de datos, se suma cada uno de los valores y se divide entre el total de casos.Sea X una variable estadstica que toma los valores x1,x2,x3,...,xn, con frecuencias absolutas f1,f2,f3,...,fn, respectivamente, la media viene dada por:

Si la variable es contnua, o an siendo discreta si estn los datos agrupados en clases, se toman como valoresx1,x2,x3,...,xn, las marcas de clase.

La moda se identifica al observar el valor que se presenta con ms frecuencia en la distribucin.Ahora bien, en el caso de datos agrupados en intervalos, es fcil determinar la clase modal (clase con mayor frecuencia), pero el valor dentro del intervalo que se presume tenga mayor frecuencia se obtiene a partir de la siguiente expresin:

Li=lmite inferior de la clase modal.c=amplitud de los intervalos.D1=diferencia entre la frecuencia absoluta de la clase modal y la frecuenciaabsoluta de la clase anterior.D2=diferencia entre la frecuencia absoluta de la clase modal y la frecuenciaabsoluta de la clase siguiente.

CuantilesLa mediana divide a la distribucin en dos partes iguales, los cuantiles son parmetros que dividen los datos de la distribucin en partes iguales. Los ms usados son:

Cuartiles:Se llaman cuartiles a tres valores que dividen a la serie de datos en cuatro partes iguales. Q1,Q2 y Q3 (cuartil primero, cuartil segundo y cuartil tercero)

Quintiles:Se llaman quintiles a cuatro valores que dividen a la serie en cinco partes iguales.K1, K2, K3 y K4( quintil primero,... )

Deciles:Nueve valores iguales que dividen la distribucin en 10 partes iguales.D1, D2 ,..... y D9( decil primero,...)

Percentiles: Noventa y nueve valores que dividen la serie en 100 partes iguales.P1, P2, ..... y P99( percentil primero,... )

El clculo es anlogo al de la mediana.

EJERCICIOS.

Principio del formulario

1)Hallar la mediana de los valores 5, 8, 13, 8, 6, 8, 10, 12, 8.A.5B.6C.8D.

E.Ninguna de las anteriores

2)Para un trabajo determinado, una empresa contrata 80 operarios, 60 de ellos ganarn $ 50.000 semanales y los 20 restantes $ 70.000 a la semana. Cul es el sueldo medio de los operarios en una semana?A.$ 50.000B.$ 55.000C.$ 60.000D.$ 62.857E.$ 70.000

3)Cul es el valor de la media en la tabla de notas siguiente, correspondiente a 10 alumnos?

A.10/7B.10/3C.50/3D.5E.Ninguna de las anteriores

4)En la serie de nmeros 2, 4, 4, 5, 5, 5, 17, el valor de la moda es(son):A.2 y 17B.4C.5D.4 y 5E.6

5)Queremos construir un grfico circular con la cantidad de veces que ha salido cada vocal en la pgina de un libro. Cuntos grados le corresponden a la letra a en el grfico?

A.10B.12C.60D.120E.150

6)En un curso hay alumnos y en otro curso alumnos, entonces el promedio de alumnos es:A.

B.

C.20D.10E.

7)En una tabla de frecuencias el intervalo 20 40, tiene frecuencia 18, la marca de clase es:A.18B.20C.30D.40E.60

8)La media de seis elementos es 10. Sabiendo que cinco de ellos son 8, 12, 13, 5 y 9; hallar el elemento que falta.A.9,5B.13C.37D.47E.60/47

9)Un alumno obtiene en tres pruebas parciales las siguientes notas: 7, 5 y 3. En el examen final consigue un 6. Si esta nota final tiene doble valor que las parciales, cul ser su nota media?A.4,2B.5,2C.5,4D.5,6E.6,7

10)Si la nica moda de los siguientes datos: 5, 5, 7, x, 7, 7, 8, 8, 9, x; es 5, entonces el valor de x es:A.5B.5,6C.7D.8E.9

Final del formulario

PAGE 9

_1151158626.unknown

_1151158635.unknown

_1151158640.unknown

_1151158642.unknown

_1151158643.unknown

_1151158641.unknown

_1151158638.unknown

_1151158639.unknown

_1151158636.unknown

_1151158631.unknown

_1151158633.unknown

_1151158634.unknown

_1151158632.unknown

_1151158629.unknown

_1151158630.unknown

_1151158628.unknown

_1151158609.unknown

_1151158617.unknown

_1151158622.unknown

_1151158624.unknown

_1151158625.unknown

_1151158623.unknown

_1151158620.unknown

_1151158621.unknown

_1151158619.unknown

_1151158613.unknown

_1151158615.unknown

_1151158616.unknown

_1151158614.unknown

_1151158611.unknown

_1151158612.unknown

_1151158610.unknown

_1151158600.unknown

_1151158604.unknown

_1151158606.unknown

_1151158607.unknown

_1151158605.unknown

_1151158602.unknown

_1151158603.unknown

_1151158601.unknown

_1151158595.unknown

_1151158597.unknown

_1151158599.unknown

_1151158596.unknown

_1151158593.unknown

_1151158594.unknown

_1151158591.unknown

_1151158592.unknown

_1151158590.unknown

_1151158588.unknown