Unidad 1 Estadistica Descriptiva

24
Orbe Peñaloza Miroslava Yanil UNIDAD 1 ESTADISTICA DESCRIPTIVA La Estadística Descriptiva: es la parte de la Estadística que estudia las técnicas y métodos que sirven para la observación, toma, organización, descripción, presentación y análisis de datos. La Estadística Descriptiva: Es aquella que utiliza técnicas y medidas que indican las características de los datos disponibles. Comprende el tratamiento y análisis de datos que tienen por objeto resumir y describir los hechos que han proporcionado la información, y que por lo general toman la forma de tablas, gráficos, cuadros e índices. Se llama descriptiva por ser su fin primordial la descripción de las características principales de los datos obtenidos. 1.1 RECOPILACIÓN DE DATOS Los datos son medidas y/o números recopilados a partir de la observación. Los datos pueden concebirse como información numérica necesaria para ayudar a tomar una decisión con más bases en una situación particular. Datos son hechos/informaciones y cifras que se recogen, analizan y resumen para su presentación e interpretación. A todos los datos reunidos para un determinado estudio se les llama conjunto de datos para el estudio. Elementos son las entidades de las que se obtienen los datos. Una variable es una característica de los elementos que es de interés. Los valores encontrados para cada variable en cada uno de los elementos constituyen los datos. Al conjunto de mediciones obtenidas para un determinado elemento se le llama observación. Los datos también son clasificados en cualitativos y cuantitativos. Los datos cualitativos comprenden etiquetas o nombres que se usan para identificar un atributo de cada elemento. Los datos cualitativos emplean la escala nominal o la ordinal y pueden ser numéricos o no. Los datos cuantitativos requieren valores numéricos que indiquen cuánto o cuántos. Los Página | 1

Transcript of Unidad 1 Estadistica Descriptiva

Page 1: Unidad 1 Estadistica Descriptiva

Orbe Peñaloza Miroslava Yanil

UNIDAD 1 ESTADISTICA DESCRIPTIVA

La Estadística Descriptiva: es la parte de la Estadística que estudia las técnicas y métodos que sirven para la observación, toma, organización, descripción, presentación y análisis de datos. La Estadística Descriptiva: Es aquella que utiliza técnicas y medidas que indican las características de los datos disponibles. Comprende el tratamiento y análisis de datos que tienen por objeto resumir y describir los hechos que han proporcionado la información, y que por lo general toman la forma de tablas, gráficos, cuadros e índices. Se llama descriptiva por ser su fin primordial la descripción de las características principales de los datos obtenidos.

1.1 RECOPILACIÓN DE DATOS

Los datos son medidas y/o números recopilados a partir de la observación. Los datos pueden concebirse como información numérica necesaria para ayudar a tomar una decisión con más bases en una situación particular. Datos son hechos/informaciones y cifras que se recogen, analizan y resumen para su presentación e interpretación. A todos los datos reunidos para un determinado estudio se les llama conjunto de datos para el estudio. Elementos son las entidades de las que se obtienen los datos.Una variable es una característica de los elementos que es de interés. Los valores encontrados para cada variable en cada uno de los elementos constituyen losdatos. Al conjunto de mediciones obtenidas para un determinado elemento se le llama observación.

Los datos también son clasificados en cualitativos y cuantitativos. Los datos cualitativos comprenden etiquetas o nombres que se usan para identificar un atributo de cada elemento. Los datos cualitativos emplean la escala nominal o la ordinal y pueden ser numéricos o no. Los datos cuantitativos requieren valores numéricos que indiquen cuánto o cuántos. Los datos cuantitativos se obtienen usando las escalas de medición de intervalo o de razón. Una variable cualitativa es una variable con datos cualitativos. Los datos cuantitativos se pueden clasificar en:

• Datos discretos. Son respuestas numéricas que surgen de un proceso de conteo. Sólo pueden tomar valores enteros (1, 2, 8, -4, etc.). Por ejemplo: número de hermanos (puede ser 1, 2, 3...., etc., pero, por ejemplo, nunca podrá ser 3.45).

• Datos continuos. Son respuestas numéricas que surgen de un proceso de medición. Pueden tomar cualquier valor real dentro de un intervalo. Por ejemplo, la velocidad de un vehículo puede ser 90.4 km/h, 94.57 km/h...etc.

De igual manera se pueden clasificar en:AGRUPADOS

Son datos en grandes cantidades, generalmente mayor a 30.

Página | 1

Page 2: Unidad 1 Estadistica Descriptiva

Orbe Peñaloza Miroslava Yanil

NO AGRUPADOSSon datos en pequeñas cantidades, no mayores a 30 datos.

Los expertos en estadística recogen datos de una muestra y utilizan esta información para hacer inferencias sobre la población que representa esa muestra. Así, una población es un todo, representada por (N) y una muestra es una fracción o segmento de ese todo, representada por (n).

Una Población es Finita: cuando existe una cantidad determinada de elementos por analizar; esto es, una cantidad de elementos, numerable y que en determinado momento finaliza

Una Población es Infinita cuando existe una cantidad indeterminada de elementos por analizar; es decir, una cantidad de elementos que aunque los enumeráramos nunca terminaríamos de hacerlo.

1.2 ORDENACIÓN Y CLASIFICACIÓN

Cuando los datos se presentan sin un orden se llama “enunciado” y cuando lo hay pasa a ser “listado”.

1.2.3 DISTRIBUCIÓN DE FRECUENCIAS

La distribución de frecuencias o tabla de frecuencias es una ordenación en forma de tabla de los datos estadísticos, asignando a cada dato su frecuencia correspondiente.

FRECUENCIA ABSOLUTALa frecuencia absoluta es el número de veces que aparece un determinado valor en un estudio estadístico. Se representa por fi.La suma de las frecuencias absolutas es igual al número total de datos, que se representa por N.

Para indicar resumidamente estas sumas se utiliza la letra griega Σ (sigma mayúscula) que se lee suma o sumatoria.

Página | 2

Enunciado 3,9,5,2,7,5,1,7,4,5,6,3,7,8,3,4,6,9,3,2,5

Listado 1,2,2,3,3,3,3,4,4,5,5,5,6,6,7,7,7,8,9,9

Page 3: Unidad 1 Estadistica Descriptiva

Orbe Peñaloza Miroslava Yanil

FRECUENCIA RELATIVALa frecuencia relativa es el cociente entre la frecuencia absoluta de un determinado valor y el número total de datos.Se puede expresar en tantos por ciento y se representa por ni .

La suma de las frecuencias relativas es igual a 1.

FRECUENCIA ACUMULADALa frecuencia acumulada es la suma de las frecuencias absolutas de todos los valores inferiores o iguales  al valor considerado. Se representa por F i.

FRECUENCIA RELATIVA ACUMULADALa frecuencia relativa acumulada es el cociente entre la frecuencia acumulada de un determinado valor y el número total de datos. Se puede expresar en tantos por ciento.

EJEMPLODurante el mes de julio, en una ciudad se han registrado las siguientes temperaturas máximas:

32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27, 28, 29, 30, 32, 31, 31, 30, 30, 29, 29, 30, 30, 31, 30, 31, 34, 33, 33, 29, 29.

En la primera columna de la tabla colocamos la variable ordenada de menor a mayor, en la segunda hacemos el recuento y en la tercera anotamos la frecuencia absoluta.

x i Recuento f i F i n i N i

27 I 1 1 0.032 0.032

28 II 2 3 0.065 0.097

29 6 9 0.194 0.290

Página | 3

Page 4: Unidad 1 Estadistica Descriptiva

Orbe Peñaloza Miroslava Yanil

7 16 0.226 0.516

8 24 0.258 0.774

III 3 27 0.097 0.871

III 3 30 0.097 0.968

I 1 31 0.032 1

31 1

1.2.1 NO. DE INTERVALOS DE CLASE

La distribución de frecuencias agrupadas o tabla con datos agrupados se emplea si las variables toman un número grande de valores o la variable es continua.

Los intervalos de clase se emplean si las variables toman un número grande de valores o la variable es continua. Se agrupan los valores en intervalos que tengan la misma amplitud denominados clases. A cada clase se le asigna su frecuencia correspondiente.

LÍMITES DE LA CLASE

Cada clase está delimitada por el límite inferior de la clase y el límite superior de la clase.

AMPLITUD DE LA CLASE

La amplitud de la clase es la diferencia entre el límite superior e inferior de la clase.

MARCA DE CLASE

La marca de clase es el punto medio de cada intervalo y es el valor que representa a todo el intervalo para el cálculo de algunos parámetros.

Página | 4

Page 5: Unidad 1 Estadistica Descriptiva

Orbe Peñaloza Miroslava Yanil

La selección del número adecuado de intervalos y los límites entre ellos dependen del criterio o experiencia de quien realiza el estudio. Sin embargo, existen reglas empíricas para calcular el número de intervalos; la más empleada es la Regla de Sturges, cuya expresión es:

K= 1 + 3.3Log n

Donde: K=Número de intervalos el cual siempre debe ser un número entero. Razón por la cual se deberá redondear el resultado al entero más cercano.

n= Número de datos.

Log= logaritmo en base 10.

Otra regla utilizada es la de Velleman que establece que el número de Intervalos se obtiene de la raíz cuadrada del número de datos; es decir K=√n , recomendable para tamaños de muestra pequeños (n< 50)

1.2.2 TAMAÑO DEL INTERVALO

AMPLITUD O ANCHURA

Se encuentra dividiendo el rango por el número de intervalos regularmente es de 5 a 6. Se representa con la letra A de tal manera que Ac=R/K

CONSTRUCCIÓN DE LOS INTERVALOS.

Los intervalos de clase son conjuntos numéricos y deben ser excluyentes y exhaustivos; es decir, si un dato pertenece a un intervalo determinado, ya no podrá pertenecer a otro, esto quiere decir excluyentes y además todos y cada uno de los datos deberá estar contenido en alguno de los intervalos, esto les da el valor de exhaustivos.

El primer intervalo se construye de la siguiente manera: Habrá de iniciar con el dato menor, el cual será el extremo inferior del intervalo; el otro extremo se obtiene de la suma del dato menor y la amplitud, con este mismo valor iniciamos el segundo intervalo, del cual el segundo extremo se encuentra sumando al valor anterior la amplitud y este proceso se repite sistemáticamente hasta completar el total de intervalos indicado por la regla elegida, por ejemplo la de Sturges.

Los intervalos de clase deben estar definidos por límites que permitan identificar plenamente si un dato pertenece a uno u otro intervalo. Estos límites son los valores extremos de cada intervalo. Límite inferior: Es el valor menor de cada intervalo, se denota por Li Límite superior: Es el número mayor de cada intervalo, se denota por Ls

Página | 5

Page 6: Unidad 1 Estadistica Descriptiva

Orbe Peñaloza Miroslava Yanil

También será muy útil conocer y calcular la Marca de Clase (MC) de cada intervalo: Se refiere al Punto Medio del intervalo y a través de él representaremos a todo el intervalo y una de las maneras de calcularla es promediando los valores límite de cada intervalo, su fórmula es:

MC = Li+Ls2

EJEMPLOUn grupo de investigadores pertenecientes a la secretaría de seguridad pública, tomó una muestra aleatoria de las velocidades (km/h) registradas por 30 vehículos con el fin de establecer nuevos límites máximos de velocidad para una carretera. La muestra arrojo los datos siguientes:

90, 99, 104, 99, 119, 98, 95, 112, 95, 120, 100, 90, 116, 96, 114, 108, 98, 118, 100, 106, 114, 100, 112, 106, 100, 115, 111, 105, 114, 97

Toda vez que se tienen los datos, se recomienda ordenarlos de menor a mayor o viceversa

90, 90, 95, 95, 96, 97, 98, 98, 99, 99, 100, 100, 100, 104, 105,106, 108, 111, 112, 112, 114, 114, 115, 116, 118, 119, 120

Ahora llevamos a la práctica los pasos descritos anteriormente para la construcción de los intervalos. 1º obtendremos el número de intervalos que vamos a utilizar, para lo cual empleamos la Regla de Sturges:

K = 1 + 3.3Log (30) = 1+ 3.3 (1.4771212547) =1+ 4.87 = 5.87 ≈ 6

2º calculamos el rango de variación, R = 120 – 90 = 30

3º obtenemos la amplitud de cada intervalo de clase como sigue:

Ac= 306

=5

4º construimos los intervalos, el primero de ellos inicia con 90 que es el extremo inferior que, sumado a 5 obtenemos 95, que será el extremo superior; este extremo será el inferior del segundo intervalo; y al sumar nuevamente la amplitud tendremos 100 que será el extremo superior y así sucesivamente hasta completar los 6 intervalos., que se muestran enseguida: [90 – 95), [95 – 100), [100 – 105), [105 – 110), [110 – 115) y [115 – 120]

Para la construcción de distribuciones de frecuencias, contamos el número de datos que le corresponden a cada intervalo; es decir obtenemos las frecuencias absolutas y de estas podemos generar los demás tipos de frecuencias y presentarlas en una tabla de resumen como la que a continuación se muestra:Página | 6

Page 7: Unidad 1 Estadistica Descriptiva

Orbe Peñaloza Miroslava Yanil

1.3 ESTUDIO DESCRIPTIVO

1.3.1 MEDIDAS DE TENDENCIA CENTRAL

Cuando se tiene un grupo de observaciones, se desea describirlo a través de un sólo número. Para tal fin, no se usa el valor más elevado ni el valor más pequeño como único representante, ya que sólo representan los extremos. Una de las propiedades más sobresalientes de la distribución de datos es su tendencia a acumularse hacia el centro de la misma. Esta característica se denomina tendencia central. Las medidas de tendencia central más usuales son: la media aritmética, la mediana y la moda.

MEDIA

La medida de localización más importante es la media, o valor promedio, de una variable. La media proporciona una medida de localización central de los datos. Si los datos son datos de una muestra, la media se denota ; si los datos son datos de una población, la media se denota con la letra griega μ. En las fórmulas estadísticas se acostumbra denotar el valor de la primera observación de la variable x con x1, el valor de la segunda observación de la variable x con x2 y así con lo siguiente. En general, el valor de la i-ésima observación de la variable x se denota x i. La fórmula para la media muestral cuando se tiene una muestra de n observaciones es la siguiente.

X= ∑ xin

Dónde: ∑ x i=x1+x2+x3…+xn

Para calcular la media de una población use la misma fórmula, pero con una notación diferente para indicar que trabaja con toda la población. El número de observaciones en una población se denota N y el símbolo para la media poblacional es μ.

μ=∑ x iN

Dónde: ∑ x i=x1+x2+x3…+xn

Ejemplo. Obtener la media muestral de los siguientes datos: 46 54 42 46 32

Solución. x=46+54+42+46+325=44

Página | 7

Page 8: Unidad 1 Estadistica Descriptiva

Orbe Peñaloza Miroslava Yanil

Las características de la media aritmética son:

1. Es una medida totalmente numérica o sea sólo puede calcularse en datos de características cuantitativas. 2. En su cálculo se toman en cuenta todos los valores de la variable.3. Es lógica desde el punto de vista algebraico. 4. La media aritmética es altamente afectada por valores extremos. 5. No puede ser calculada en distribuciones de frecuencia que tengan clases abiertas. 6. La media aritmética es única, o sea, un conjunto de datos numéricos tiene una y sólo una media aritmética.

MODA

La moda de un conjunto de datos numéricos es el valor que más se repite, es decir, el que tiene el mayor número de frecuencias absolutas. La moda puede ser no única e inclusive no existir. La moda es una medida de tendencia central muy importante, porque permite planificar, organizar y producir para satisfacer las necesidades de la mayoría.

Ejemplo. Obtener la moda de los siguientes datos: -3, 3, -2, 0, 3, -1, -2, 4, 5, -2, 0, 1. Solución. Ordenando de forma ascendente: -3, -2, -2, -2, -1, 0, 0, 1, 3, 3, 4, 5. El valor que más se repite es el -2, por lo tanto ese valor es su moda.

Cálculo de la moda para datos agrupados1º Todos los intervalos t ienen la misma amplitud

L i es el límite inferior de la clase modal.

f i  es la frecuencia absoluta de la clase modal.

f i - - 1  es la frecuencia absoluta inmediatamente inferior a la en clase

modal.

f i - + 1  es la frecuencia absoluta inmediatamente posterior a la clase

modal.

a i  es la amplitud de la clase.

También se uti l iza otra  fórmula de la moda que da un valor

aproximado de ésta:

Página | 8

Page 9: Unidad 1 Estadistica Descriptiva

Orbe Peñaloza Miroslava Yanil

Calcular  la moda de una distribución estadística que viene dada por la

siguiente tabla:

2º Los intervalos tienen amplitudes distintas.En primer lugar tenemos que hallar las alturas.

La clase modal es la que tiene mayor altura.

La fórmula de la moda aproximada cuando existen distintas amplitudes es:

EJEMPLOEn la siguiente tabla se muestra las cali f icaciones (suspenso, aprobado, notable y sobresaliente) obtenidas por un grupo de 50 alumnos.  Calcular la moda.

f i hi

[0,5) 15 3

[5,7) 20 10

[7,9) 12 6

[9,10) 3 3Página | 9

f i

[60,63) 5[63,66) 18[66,69) 42[69,72) 27[72,75) 8

100

Page 10: Unidad 1 Estadistica Descriptiva

Orbe Peñaloza Miroslava Yanil

50

MEDIANA

La mediana es el punto central de una serie de datos ordenados de forma ascendente o descendente. De acuerdo al número de casos o datos, hay dos formas para calcular la mediana: para número impar y para número par.

Número impar de datos ordenados de menor a mayor o de mayor a menor: la mediana es el valor que queda justo al centro.

Ejemplo. Obtener la mediana de los siguientes datos: -3, 5, 18, 4, 11, -6, 9, 10, -1, 2. Solución. Ordenando de forma ascendente: -6, -3, -1, 2, 4, 5, 9, 10, 11, 18. Los valores centrales son 4 y 5. Su media aritmética es: x= 4+5/2=4.5 En este caso, la mediana de este conjunto no pertenece al conjunto de datos.

Las características de la mediana son: 1. En su cálculo no se incluyen todos los valores de la variable. 2. La Mediana no es afectada por valores extremos. 3. Puede ser calculada en distribuciones de frecuencia con clases abiertas. 4. No es lógica desde el punto de vista algebraico.

MEDIANA PONDERADALa media ponderada de un conjunto de valores de una variable x a los que se han asignado, respectivamente, una ponderación se calcula mediante la fórmula:

Donde:

  EJEMPLO:

En una materia dada se asignan pesos de importancia, de la siguiente forma: Unida I (20% del curso), Unidad II (25% del curso), Unidad III (20%  del curso), Unidad IV (15% de la calificación), Unidad V (20% de la calificación). Si las calificaciones de un alumno son 8 en la primera unidad, 5 en la segunda, 8 en la tercera unidad, 10 en la cuarta unidad y 8 en la última unidad. Es decir, se tienen la siguiente tabla:

Unidad Ponderacion (Wi) Datos (Wi)

Página | 10

Page 11: Unidad 1 Estadistica Descriptiva

Orbe Peñaloza Miroslava Yanil

I 20% = 0.2 8II 25% = 0.35 5III 20% = 0.2 8IV 15% = 0.15 10V 20% = 0.10 8

 

 

1.3.2 MEDIDAS DE DISPERSIÓN

La dispersión se refiere a la separación de los datos en una distribución, es decir, al grado en que las observaciones se separan. Las medidas de dispersión nos informan sobre cuánto se alejan del centro los valores de la distribución . Existen otras dos características de los conjuntos de datos que proporcionan información útil: el sesgo y la curtosis.

Las medidas de dispersión son:

RANGO

Llamamos rango al número de unidades de variación presente en los datos recopilados y se obtiene de la diferencia entre el dato mayor y el dato menor. Se representa con la letra R

Características del rango:

1. A medida que el rango es menor, el grado de representatividad de los valores centrales se incrementa. 2. A medida que el rango es mayor, la distribución está menos concentrada o más dispersa. 3. Su cálculo es extremadamente sencillo. 4. Tiene gran aplicación en procesos de control de calidad. 5. Tiene el inconveniente de que sólo depende de los valores extremos. De esta forma basta que uno de ellos se separe mucho para que el recorrido se vea sensiblemente afectado.

DESVIACIÓN MEDIA ABSOLUTA

Página | 11

Page 12: Unidad 1 Estadistica Descriptiva

Orbe Peñaloza Miroslava Yanil

La desviación media es la división de la sumatoria del valor absoluto de las distancias existentes entre cada dato y su media aritmética y el número total de datos:

DESVIACIÓN ESTÁNDAR

La desviación estándar de la población, es simplemente la raíz cuadrada de la varianza de la población. Como la varianza es el promedio de los cuadrados de las distancias de las observaciones a la media, la desviación estándar es la raíz cuadrada del promedio de los cuadrados de las distancias entre las observaciones y la media. Mientras que la varianza se expresa con el cuadrado de las unidades utilizadas para medir los datos, la desviación estándar está en las mismas unidades que las que se usaron para medir los datos.

Desviación estándar para datos agrupados.

VARIANZA

La varianza es una medida de variabilidad que utiliza todos los datos. La varianza está basada en la diferencia entre el valor de cada observación (xi) y la media. Ala diferencia entre cada valor xi y la media (cuando se trata de una muestra, μ cuando se trata de una población) se le llama desviación respecto de la media. Si se trata de una muestra, una desviación respecto de la media se escribe (xi ), y si se trata de una población se escribe (xi μ). Para calcular la varianza, estas desviaciones respecto de la media se elevan al cuadrado. Si los datos son de una población, el promedio de estas desviaciones elevadas al cuadrado es la varianza poblacional. La varianza poblacional se denota con la letra griega σ2. En una población en la que hay N observaciones y la media poblacional es μ, la varianza poblacional se define como sigue.

EJEMPLO:

Calcular la varianza de la distribución de la tabla:

Página | 12

xi fi xi · fi xi2 · fi

[10, 20) 15 1 15 225

[20, 30) 25 8 200 5000

[30,40) 35 10 350 12 250[40, 50) 45 9 405 18 225

[50, 60 55 8 440 24 200[60,70) 65 4 260 16 900

[70, 80) 75 2 150 11 250

42 1 820 88 050

Page 13: Unidad 1 Estadistica Descriptiva

Orbe Peñaloza Miroslava Yanil

COEFICIENTE DE VARIACIÓN

Cuando se quiere comparar el grado de dispersión de dos distribuciones que no vienen dadas en las mismas unidades o que las medias no son iguales se utiliza el coeficiente de variación de Pearson que se define como el cociente entre la desviación estándar y el valor absoluto de la media aritmética:

%cv=σx.100

Este coeficiente, representa el porcentaje que la desviación estándar contiene a la media aritmética y por lo tanto cuanto mayor es CV mayor es la dispersión y menor la representatividad de la media.

EJEMPLO

Una distribución tiene x = 140 y σ = 28.28 y otra  x = 150 y σ = 24. ¿Cuál de las dos presenta mayor dispersión?

La primera distribución presenta mayor dispersión.

1.3.3 MEDIDAS DE SESGO Y CURTOSIS

Las medidas de forma son medidas que determinan numéricamente algunas características de la forma en que están distribuidos los datos. Entre estas medidas se tiene: el coeficiente de asimetría o coeficiente de sesgo y el coeficiente de curtosis.

COEFICIENTE DE ASIMETRÍA DE PEARSON Y EL MOMENTO 3

La asimetría es la medida que indica la simetría de la distribución de una variable respecto a la media aritmética, sin necesidad de hacer la representación gráfica. Los coeficientes de asimetría indican si hay el mismo número de elementos a izquierda y derecha de la media.

Página | 13

Page 14: Unidad 1 Estadistica Descriptiva

Orbe Peñaloza Miroslava Yanil

Existen tres tipos de curva de distribución según su asimetría: Asimetría negativa: la cola de la distribución se alarga para valores inferiores a

la media. Simétrica: hay el mismo número de elementos a izquierda y derecha de la media.

En este caso, coinciden la media, la mediana y la moda. La distribución se adapta a la forma de la campana de Gauss, o distribución normal.

Asimetría positiva: la cola de la distribución se alarga para valores superiores a la media.

El coeficiente de asimetría de Pearson CAP mide la diferencia entre la media y la moda respecto a la dispersión del conjunto X=(x1, x2,…, xN).Este procedimiento, menos usado, lo emplearemos solamente en distribuciones unimodales y poco asimétricas.

Si CAP<0: la distribución tiene una asimetría negativa, puesto que la media es menor que la moda.

Si CAP=0: la distribución es simétrica. Si CAP>0: la distribución tiene una asimetría positiva, ya que la media es mayor que

la moda.

CURTOSIS MOMENTO 4 O POR PERCENTILES

La curtosis (o apuntamiento) es una medida de forma que mide cuán escarpada o achatada está una curva o distribución. Este coeficiente indica la cantidad de datos que hay cercanos a la media, de manera que a mayor grado de curtosis, más escarpada (o apuntada) será la forma de la curva.Página | 14

Page 15: Unidad 1 Estadistica Descriptiva

Orbe Peñaloza Miroslava Yanil

La curtosis se mide promediando la cuarta potencia de la diferencia entre cada elemento del conjunto y la media, dividido entre la desviación típica elevado también a la cuarta potencia. Sea el conjunto X=(x1, x2,…, xN), entonces el coeficiente de curtosis será:

1.4 GRÁFICAS

1.4.1 HISTOGRAMA

Una presentación gráfica usual para datos cuantitativos es el histograma. Esta gráfica se hace con datos previamente resumidos mediante una distribución de frecuencia, de frecuencia relativa o de frecuencia porcentual. Un histograma consiste en una serie de rectángulos, cuyo ancho es proporcional al rango de los valores que se encuentran dentro de una clase, y cuya altura es proporcional al número de elementos que caen dentro de la clase. Si las clases empleadas en la distribución de frecuencias son del mismo ancho, entonces las barras verticales del histograma también tienen el mismo ancho. La altura de la barra correspondiente a cada clase representa el número de observaciones de la clase. Como consecuencia, el área contenida en cada rectángulo (base por altura) ocupa un porcentaje del área total de todos los rectángulos la cual es igual a la frecuencia absoluta de esa clase correspondiente respecto a todas las observaciones hechas.

1.4.2 POLÍGONO

Página | 15

Page 16: Unidad 1 Estadistica Descriptiva

Orbe Peñaloza Miroslava Yanil

Aunque se utilizan menos, los polígonos de frecuencias son otra forma de representar gráficamente distribuciones tanto de frecuencias como de frecuencias relativas. Para construir un polígono de frecuencias señalamos éstas en el eje vertical y los valores de la variable que estamos midiendo en el eje horizontal, del mismo modo en que se hizo con el histograma. A continuación, graficamos cada frecuencia de clase trazando un punto sobre su punto medio y conectamos los puntos sucesivos resultantes con una línea recta para formar un polígono (una figura con muchos lados).

Un polígono de frecuencias que utiliza frecuencias relativas de datos puntuales en cada una de las clases, en lugar del número real de puntos, se conoce como polígono de frecuencias relativas. Este polígono tiene la misma forma que el polígono de frecuencias construido a partir del mismo conjunto de datos, pero con una escala diferente en los valores del eje vertical. En lugar del número absoluto de observaciones, la escala representa el número de observaciones de cada clase expresadas como una fracción del total de observaciones.

1.4.3 OJIVA

La gráfica de una distribución acumulada, llamada ojiva, es una gráfica que muestra los valores de los datos en el eje horizontal y las frecuencias acumuladas, las frecuencias relativas acumuladas o las frecuencias porcentuales acumuladas en el eje vertical.

La ojiva se construye al graficar cada uno de los puntos correspondientes a la frecuencia acumulada de las clases.

Página | 16

Page 17: Unidad 1 Estadistica Descriptiva

Orbe Peñaloza Miroslava Yanil

1.4.4 PASTEL

Este gráfico se utiliza fundamentalmente, para representar distribuciones de frecuencias relativas (es decir, porcentajes % o proporciones) haciendo corresponder la medida de la frecuencia relativa con la medida del ángulo en grados; es decir, si el 100 % de los datos son 360º de la circunferencia, a cada 1% le corresponderán 3.6º; así, para obtener la medida del ángulo del sector, multiplicamos la frecuencia correspondiente por 3.6º. Al utilizar este gráfico se aconseja no sobrepasar los 10 elementos, y ordenar los sectores de acuerdo a una de dos formas, ya sea siguiendo el orden que se les dé a los datos o empezando del mayor al menor segmento, iniciando a partir de las 12 horas y en el sentido de las manecillas del reloj. Por último, si el texto que representa cada sector no puede colocarse dentro del mismo, se elabora una leyenda que se coloca fuera del segmento, unidos por una flecha.

Página | 17

Page 18: Unidad 1 Estadistica Descriptiva

Orbe Peñaloza Miroslava Yanil

REFERENCIAS BIBLIOGRÁFICAS

Estadística para administración y economía.Anderson, Sweeney, WilliamsThomson Editores2008P. 5,6,7,36,39,83,84

Estadística para administración y Economía.Levin, RichardPrentice Hall2004P. 9,30,31,58,59

REFERENCIAS ELECTRÓNICAS

http://132.248.164.227/publicaciones/docs/apuntes_matematicas/34.%20Estadistica%20Descriptiva.pdf

http://www.ditutor.com/estadistica/estadistica_descriptiva.html

http://www.hacienda.go.cr/cifh/sidovih/cursos/material_de_apoyo-f-c-cifh/1materialdeapoyocursoscifh/4estad%C3%ADsticabasica/probabilidadyestadistica.pdf

http://dieumsnh.qfb.umich.mx/estadistica/media_pond.htm

http://www.universoformulas.com/estadistica/descriptiva/asimetria-curtosis/

Página | 18