Distribuciones de Frecuencia

33
Métodos Tabulares y gráficos para resumir datos

description

efrdgthh

Transcript of Distribuciones de Frecuencia

Page 1: Distribuciones de Frecuencia

Métodos Tabulares y

gráficos para resumir

datos

Page 2: Distribuciones de Frecuencia

2

MARTHA CECILIA DURAN LEON.

Ingeniera Industrial

Especialista en Gerencia de la Calidad

del Producto y el Servicio

Page 3: Distribuciones de Frecuencia

• Métodos Tabulares ( Distribuciones de

Frecuencia)

• Métodos Gráficos (Gráficos de Barras, Gráficos

circulares, Gráficos de Líneas, Histogramas entre

otros)

3

Descripción de Datos

Page 4: Distribuciones de Frecuencia

• Una distribución de frecuencia es un resumen tabular de datos

que muestra el numero (frecuencia) de elementos en cada una

de las diferentes clases. Las clases deben ser mutuamente

excluyentes.

PROCESO ESTADISTICO

• La construcción de una tabla de frecuencia para datos

cualitativos requiere solo del conteo del número de elementos o

individuos que caen dentro de cierta clase o categoría.

4

Distribución de Frecuencia

Distribución de

Frecuencia

Page 5: Distribuciones de Frecuencia

5

Definiciones …

Page 6: Distribuciones de Frecuencia

6

1-9

Definición …

Page 7: Distribuciones de Frecuencia

7

Distribución (tablas ) de

Frecuencia

Page 8: Distribuciones de Frecuencia

8

Tablas de distribución de

Frecuencia variables cualitativas

Relacionar un texto que permita entender la relación de

los valores dentro de un cuadro

Cuadro No xxx . Título del cuadro

Nombre de la variable

que se observa Frecuencia ( f i )

Porcentaje frecuencia

relativa (h i) en %

TOTAL Fuente: xxxxx

Page 9: Distribuciones de Frecuencia

• Gráfico de Barras: El instrumento más común para representar una variable

cualitativa en forma gráfica es la gráfica de barras. En la mayoría de los casos,

el eje horizontal muestra la variable de interés y el eje vertical la cantidad,

número o fracción de cada uno de los posibles resultados. Una característica

distintiva de la gráfica de barras es que existe una distancia o espacio entre las

barras

El gráfica de barras se puede usar para describir una serie de datos de

cualquier nivel de medición

9

Representación Gráfica Datos

Cualitativos

Page 10: Distribuciones de Frecuencia

• GRÁFICA CIRCULARES O DE PASTEL: Gráfica que

muestra la parte o porcentaje que representa cada clase

del total de números de frecuencia.

• Son utilizados en aquellos casos donde nos interesa no

sólo mostrar el número de veces que se da una

característica o atributo de manera tabular sino que se

pueda visualizar mejor la proporción en que aparece esa

característica respecto del total.

10

Representación Gráfica Datos Cualitativos

Page 11: Distribuciones de Frecuencia

Se explican los detalles de construcción de una gráfica de pastel

empleando la información de la tabla 2.3, la cual muestra una caída en

los gastos de la lotería de una determinada ciudad en 2004.

TABLA 2.3: Gastos de la lotería del estado xx

11

Representación Gráfica Datos Cualitativos

Ya que cada rebanada de pastel representa la porción relativa de cada

componente, es posible compararlas con facilidad:

• El gasto más cuantioso de la lotería se canaliza en premios.

• Cerca de una tercera parte de los fondos recaudados se transfieren a educación.

• Los gastos de operación apenas corresponden a 5% de los fondos recaudados.

• (Lind 24-25)

Page 12: Distribuciones de Frecuencia

• Visualiza el comportamiento de dos o

más categorías de una variable

• Se debe emplear una misma escala

numérica para todos los conjuntos de datos

• Dentro de esta categoría se encuentran los

gráficos de columna agrupada.

12

DIAGRAMA DE BARRAS

ESTRATIFICADO

Page 13: Distribuciones de Frecuencia

13

Fuente : Instituto Nacional de Estadística e Informática - 1998

Gráficos de Barras

FIGURA 2. POBLACIÓN SEGÚN NIVEL DE EDUCACIÓN POR

SEXO : 1998

-

10,00

20,00

30,00

40,00

50,00

60,00

70,00

80,00

90,00

100,00

MUJER

HOMBRE

0,00

5,00

10,00

15,00

20,00

25,00

30,00

35,00

40,00

45,00

Sin Nivel Inicial Secundaria Sup. No Univer.

Sup. Univer. Especial

HOMBRE

MUJER

(Porcentajes)

Niveles de Educación

FIGURA 2. POBLACIÓN SEGÚN NIVEL DE EDUCACIÓN POR

SEXO : 1998

Fuente : Instituto Nacional de Estadística e Informática - 1998

GRAFICOS DE BARRAS

ESTRATIFICADO

GRAFICOS DE COLUMNA

AGRUPADA

Niveles de Educación

Page 14: Distribuciones de Frecuencia

14

1-9

Distribución de frecuencias variables

cuantitativas

Tablas de distribución de Frecuencia

Relacionar un texto que permita entender la relación de los

valores dentro de un cuadro

http://www.virtual.unal.edu.co/cursos/ciencias/2001065/html/un1/cont_112_12.html

Cuadro No xxx . Título del cuadro

Nombre de la variable

que se observa Frecuencia ( f i )

Porcentaje frecuencia

relativa (h i)

Frecuencia

acumulada

Fi

frecuencia relativa

acumulada (H i)

TOTAL

Fuente: xxxxx

Page 15: Distribuciones de Frecuencia

15

Cómo crear una Distribución de frecuencia

variables cuantitativas

Metodología:

1.Defina el numero de clases. Emplear suficientes agrupamientos o

clases de manera que se perciba la forma de la distribución

Formula Sturges: K = 1 + 3,3 logn o 2k , si se cumple 2k > n

2.Determine el intervalo o ancho de clase. Todas las clases deben

cubrir el valor más bajo y el valor más alto. Ancho (i) = Rango / k

3.Establecer los límites de cada clase. Cada observación se debe

incluir en una sola categoría

4.Ingresar los datos de la variable en cada clase

5.Contar el numero de elementos de cada clase.

Page 16: Distribuciones de Frecuencia

16

Cómo crear una Distribución de

frecuencia variables cuantitativas

Metodología:

Paso 1: Defina el número de clases. El objetivo

consiste en emplear suficientes agrupamientos o clases,

de manera tal que se perciba la forma de la distribución.

Aquí se necesita criterio. Una gran cantidad de clases o

muy pocas podrían no permitir ver la forma fundamental

del conjunto de datos.

Lind. Estadística aplicada a los negocios y la economía. McGraw-Hill Interamericana, 2005. VitalBook file.

Page 17: Distribuciones de Frecuencia

17

Cómo crear una Distribución de

frecuencia variables cuantitativas

Page 18: Distribuciones de Frecuencia

18

Cómo crear una Distribución de frecuencia

variables cuantitativas

Metodología:

Paso 3: Establezca los límites de cada clase. Esto es importante

para que sea posible incluir cada observación en una sola categoría.

Esto significa que debe evitar la superposición de límites de clase

confusos.

Paso 4 Ingresar los datos de la variable en cada clase

Anote los Gastos hechos por las amas de casa en las clases. Para comenzar,

el gasto de la primer dato es de $41. Éste se ingresa en la clase de $40 a $130

• Lind. Estadística aplicada a los negocios y la economía. McGraw-Hill

Interamericana, 2005. VitalBook file.

Page 19: Distribuciones de Frecuencia

• Histogramas

• Polígonos de frecuencia

• Ojivas

• Diagrama Tallo de Hojas

• Diagrama Box – Plot

• Diagrama de puntos

19

Representación Gráfica Datos

Cuantitativos

Page 20: Distribuciones de Frecuencia

20

HISTOGRAMA

GRAFICOS DE DISTRIBUCIÓN DE

FRECUENCIA

• Representación gráfica más usual para datos cuantitativos

• Se construye colocando la variable de interés en el eje horizontal y la

frecuencia, o frecuencia relativa, porcentual o densidad.

• El área de cada rectángulo representa la proporción de la muestra que está

en el intervalo de clase correspondiente

• El área total bajo el histograma es igual a 1

Para los datos continuos,

consideraremos diferentes casos

donde los datos han sido organizados

en

forma de:

* distribución de frecuencia,

* distribución de frecuencia relativa, y

* distribución de frecuencia

acumulativa.

Page 21: Distribuciones de Frecuencia

21

1-9

GRAFICOS DE DISTRIBUCIÓN DE

FRECUENCIA

COMO DIBUJAR UN HISTOGRAMA DE FRECUENCIA

Paso 1 : Dibuje unos ejes cartesianos

Paso 2 : Identifique todas las clases en el eje horizontal.

Paso 3 : Escoja una escala apropiada para el eje vertical que

muestre todas las frecuencias.

Paso 4 : Siendo cada intervalo de clase la base de la barra (o

rectángulo), elévelos hasta que la altura corresponda al valor de

la frecuencia de la clase datos.

Page 22: Distribuciones de Frecuencia

22

GRAFICOS DE DISTRIBUCIÓN DE

FRECUENCIA

POLIGONO DE FRECUENCIAS

• Relacionado estrechamente con el histograma

• Línea poligonal formada por segmentos de recta que

une los puntos medios de cada intervalo. (Marca de

clase)

• Se utiliza cuando se quiere dar una impresión de

aumento o disminución continua de las frecuencias.

• Ventaja: Permite comparar dos o más grupos de datos,

a diferencia de los histogramas.

Page 23: Distribuciones de Frecuencia

23

OJIVA

GRAFICOS DE DISTRIBUCIÓN DE

FRECUENCIA

• Cuando se requiere estudiar las frecuencias acumuladas.

• Las frecuencias acumulada pueden emplearse para determinar cuantos

datos u observaciones están por arriba o por debajo de cierto valor.

Nombre de la

variable que se

observa

Marca de clase (Mi)

Frecuencia

acumulada

Fi

frecuencia relativa

acumulada (h i)

frecuencia relativa

acumulada en % (H

i)

TOTAL

Mi: Marca de clase. Punto Medio del intervalo. Valores representativos de los

datos comprendidos en las clases.

Page 24: Distribuciones de Frecuencia

24

OJIVA

EJERCICIO

• Elaborar la Ojiva para el ejemplo de Gastos de las amas de casa

– En menos de qué cantidad (miles de pesos) gastan en abarrotes el 50%

las amas de casa?

– En menos de qué cantidad (miles de pesos) gastan en abarrotes el 25%

las amas de casa?

– Cuál es la cantidad de amas de casa que gastan menos de $250.000

Page 25: Distribuciones de Frecuencia

25

COMO DIBUJAR UN HISTOGRAMA DE DENSIDAD

La altura de cada intervalo es la densidad de la muestra en ese

intervalo de clase

Page 26: Distribuciones de Frecuencia

26

EJERCICIO

La siguiente tabla corresponde a las emisiones de gas de 62 vehículos conducidos a una

gran altitud. El rango de la muestra va desde un mínimo 1,11 a un máximo de 23,38 en

unidades de gramos de emisiones por galón de combustible

.

Ejemplo 1,17 Estadística para ingenieros de Navidi

Intervalo de Clase

(g/gal)frecuencia

frecuencia

relativa Densidad

[ 1 - 3) 12 0,193548387

[ 3 - 5 ) 11 0,177419355

[ 5- 7 ) 18 0,290322581

[ 7 - 9 ) 9 0,14516129

[ 9 - 11 ) 5 0,080645161

[ 11 - 15 ) 3 0,048387097

[ 15 - 25 ) 4 0,064516129

62

a. Determine la proporción de los vehículos en la muestra con emisiones entre 7 y 11

g/galon

b. Use el histograma para calcular la proporción de vehículos en la muestra con emisiones

entre 6 y 10 g/ galón.

Page 27: Distribuciones de Frecuencia

• En un estudio de dos semanas sobre la productividad de

los trabajadores se obtuvieron los siguientes datos

acerca del número de piezas aceptables producidas por

una cantidad determinada de trabajadores. Los datos

son los siguientes:

• Elabore una tabla de frecuencia para los datos que se

presentan a continuación

Los datos fueron suministrados por el Departamento de

Producción de la empresa

27

EJERCICIO

Page 28: Distribuciones de Frecuencia

28

EJERCICIO

64 35 80 48 76

57 66 65 41 53

34 53 49 35 74

59 37 54 69 55

44 52 56 66 77

88 61 44 58 32

75 41 34 66 83

47 52 77 61

84 58 40 53

48 62 52 29

62 50 20 73

Page 29: Distribuciones de Frecuencia

• Dado un conjunto de datos formado por observaciones, las cuales pueden ser

representadas mediante X1, X2, X3 … Xn y donde cada Xi tiene por lo menos dos

dígitos. Una forma rápida de obtener una representación visual del conjunto de datos

es construir un diagrama de tallos y hojas. Este diagrama es usado cuando hay un

número no muy pequeño de datos. Los siguientes son los pasos para construir un

diagrama de tallos y hojas:

• Seleccionar uno o más dígitos iniciales para los valores de tallo. El dígito(s) final(es)

se convierte (n) en hojas. Para facilitar la determinación de la forma de la distribución

de los datos se necesitan al menos 5 tallos. El procedimiento acostumbrado consiste

en ordenar los valores de las hojas de menor a mayor.

• Hacer una lista de valores de tallo en una columna vertical.

• Registrar las hojas por cada observación junto al valor correspondiente del tallo.

• Indicar las unidades para tallos y hojas en algún lugar del diagrama.

• El diagrama de tallos y hojas tiene forma de campana.

• Los diagramas de tallos y hojas nos dan una idea de la localización de los datos y de

la forma de la distribución. Esta técnica funciona bien para los conjuntos de datos que

no tienen una dispersión muy grande.

29

Diagrama de Tallo y hojas

Page 30: Distribuciones de Frecuencia

• Técnica estadística para representar un conjunto de

datos. Cada valor numérico se divide en dos partes. El

digito principal se convierte en el tallo y los dígitos

secundarios en las hojas. El tallo se localiza a lo largo

del eje vertical y los valores de las hojas se apilan unos

contra otros a lo largo del eje horizontal.

• De las conclusiones:

– se observa el mínimo y el máximo.

– Concentración de datos

– Se pueden observar distribuciones uniformes

30

Conclusión: Diagrama de Tallo

y hojas

Page 31: Distribuciones de Frecuencia

Es una gráfica usada para datos cuantitativos.

La técnica conocida como Diagrama de Tallo y hojas muestra en forma simultánea el orden jerárquico y la forma de un conjunto de datos

Ejemplo: Los siguientes datos representan pesos de una muestra de 15 varones adultos.

Stem-and-leaf de peso N = 15 Unidad e hoja = 1,0

70 76 72 75 75 68 64 65 58 57 83 78 80 85 82 72

Para elaborar un diagrama de tallo de hojas se inicia acomodando los datos a la izquierda en una línea vertical.

En este caso las ramas la forman el primer dígito de los datos, y las hojas serán dadas por los últimos dígitos de los datos.

31

Diagrama de Tallo y hojas

Page 32: Distribuciones de Frecuencia

32

Diagrama de Tallo y hojas

Tallo y hoja de Edad N = 100

Unidad de hoja = 1,0

5 2 00224

10 2 88888

29 3 0000000022222222444

40 3 66666688888

(18) 4 000022222224444444

42 4 666666666888888

27 5 0002244444444

14 5 668

11 6 00222

6 6 88

4 7 024

1 7 8

Page 33: Distribuciones de Frecuencia

Diagrama de tallo y hojas

Los datos siguientes corresponde al numero de hamburguesas vendidas en un restaurante de comidas rápidas durante 15 semanas. A continuación represente el tallo de hojas con estos datos utilizando unidad de hoja = 10.

1565 1852 1644 1766 1888 1912 2044 1812

1790 1679 2008 1852 1967 1954 1733

.

33