Apuntes. Presentación de datos, agrupación y gráficos

11

Click here to load reader

description

Apuntes de clase y ejemplosPresentación de datos.Para organizar los datos:   Tablas de distribución de frecuencias GráficosDistribución de frecuencias: es una tabla utilizada para organizar datos. La columna de la izquierda(llamada clases o grupos) contiene todos los valores que puede tomar la variable estudiada. La columna de la derecha es una lista de las frecuencias o número de observaciones correspondientes a cada clase.   Distribución de frecuencias de variable cualitativa. Distri

Transcript of Apuntes. Presentación de datos, agrupación y gráficos

Page 1: Apuntes. Presentación de datos, agrupación y gráficos

Apuntes de clase y ejemplos

Presentación de datos.

Para organizar los datos:

Tablas de distribución de frecuencias

Gráficos

Distribución de frecuencias: es una tabla utilizada para organizar datos. La columna de la izquierda

(llamada clases o grupos) contiene todos los valores que puede tomar la variable estudiada. La columna de la

derecha es una lista de las frecuencias o número de observaciones correspondientes a cada clase.

Distribución de frecuencias de variable cualitativa.

Distribución de frecuencias de variable cuantitativa:

o Sin agrupar.

o Agrupada.

Distribución de frecuencias de una variable cualitativa.

Ejemplo.

Se registró el sexo de los primeros 20 clientes que entraron en un Wallmart al abrir.

Codificación: 0= hombre, 1=mujer.

0 1

1 1

0 0

0 1

0 0

0 0

0 0

0 1

1 0

1 0

Tabla de distribución de frecuencias.

Valores frecuencia frecuencia relativa grados

Hombre 0 13 65% 234

Mujer 1 7 35% 126

20 100% 360

Gráfica de barras: la altura de cada rectángulo representa la frecuencia de cada valor. Las barras se dibujan separadas

entre sí. Sirve para llamar la atención en la frecuencia de cada valor.

Page 2: Apuntes. Presentación de datos, agrupación y gráficos

Apuntes de clase y ejemplos

Gráfica de sectores (circular, de pastel, de pie, de tarta): el círculo representa el total y los segmentos que

parten del centro representan las proporciones de ese total. Cada segmento es proporcional a la frecuencia

correspondiente. Se utiliza cuando se quiere llamar la atención sobre la proporción.

Ejemplo.

Se preguntó a 15 personas qué les parece el servicio de un restaurant. Los datos registrados son los siguientes:

1 1 2 4 2 1 3 1 2 1 4 4 2 4 4

Codificación: 1=Muy satisfecho, 2=satisfecho, 3=regular, 4=nada satisfecho.

Valores frecuencia frecuencia relativa grados

Muy satisfecho 1 5 33.33% 120

Satisfecho 2 4 26.67% 96

Regular 3 1 6.67% 24

Nada satisfecho 4 5 33.33% 120

15 100% 360

0

5

10

15

Hombre Mujer

Hombre 65%

Mujer 35%

Page 3: Apuntes. Presentación de datos, agrupación y gráficos

Apuntes de clase y ejemplos

Distribución de frecuencias de una variable cuantitativa

Distribución de frecuencias sin agrupar

Cuando son pocos datos o pertenecen a una variable discreta, se pueden representar de forma no agrupada.

Ejemplo.

Se contaron el número de automóviles vendidos al mes en 20 sucursales Ford. Los datos son los siguientes.

6 8 10 8

7 9 8 10

10 7 10 10

9 11 9 9

8 9 9 9

Valores Frecuencia Frecuencia relativa frecuencia acumulada frecuencia relativa acumulada

6 1 5% 1 5%

7 2 10% 3 15%

8 4 20% 7 35%

9 7 35% 14 70%

10 5 25% 19 95%

11 1 5% 20 100%

0

1

2

3

4

5

6

Muy satisfecho Satisfecho Regular Nada satisfecho

Muy satisfecho

33%

Satisfecho 27% Regular

7%

Nada satisfecho

33%

Page 4: Apuntes. Presentación de datos, agrupación y gráficos

Apuntes de clase y ejemplos

20 100%

Frecuencia: número de observaciones para cada clase o valor de la variable.

Frecuencia relativa: la proporción de cada frecuencia con respecto al total de observaciones.

Frecuencia acumulada: para cada valor xi, es la suma de las frecuencias de los valores anteriores o iguales a

xi.

Frecuencia relativa acumulada: es la frecuencia acumulada de las frecuencias relativas anteriores o iguales a

cada valor xi.

Polígono de frecuencias: línea que une los puntos donde se relaciona cada clase con su frecuencia. Muestra

la simetría de la distribución de frecuencias.

Page 5: Apuntes. Presentación de datos, agrupación y gráficos

Apuntes de clase y ejemplos

Ejemplo.

Considere los siguientes datos, pertenecientes a la talla de zapatos de 15

personas.

3 6 8

9 4 7

7 8 9

2 8 6

4 6 3

Valores frecuencia frecuencia relativa

frecuencia acumulada

frecuencia relativa acumulada

2 1 6.67% 1 6.67%

3 2 13.33% 3 20.00%

4 2 13.33% 5 33.33%

5 0 0.00% 5 33.33%

6 3 20.00% 8 53.33%

7 2 13.33% 10 66.67%

8 3 20.00% 13 86.67%

0

1

2

3

4

5

6

7

8

6 7 8 9 10 11

fre

cue

nci

as

autos vendidos

0

1

2

3

4

5

6

7

8

6 7 8 9 10 11

fre

cue

nci

a

Autos vendidos

(nota técnica: Por cuestiones

de tiempo, no añadí en Excel

los valores que cierran la

curva gráficamente. Pero

ustedes al realizarlo de forma

manual deben añadirlo).

Page 6: Apuntes. Presentación de datos, agrupación y gráficos

Apuntes de clase y ejemplos

Valores frecuencia frecuencia relativa

frecuencia acumulada

frecuencia relativa acumulada

9 2 13.33% 15 100.00%

15 100.00%

Distribución de frecuencia de datos agrupados.

Cuando son muchos datos o pertenecen a una variable continua, se presentan de forma agrupada.

Al agruparse deben ser mínimo 5 clases y máximo 20.

Una regla simple para calcularlos es la siguiente:

2k≥n

También puede utilizarse la ley de Sturges:

k=1+3.3log(n)

Decidir cuántas clases se utilizarán es cuestión de criterio y no hay reglas específicas para ello. Pero las pautas

como la regla simple y la ley de Sturges nos ayudan a decidir un número adecuado de intervalos.

Pasos para agrupar datos:

1. Decidir el número de clases o intervalos.

2. Calcular el ancho o amplitud de las clases (o intervalos). Se redondea a un número entero para

facilitar la interpretación.

0

1

2

3

4

2 3 4 5 6 7 8 9

0

1

2

3

4

2 3 4 5 6 7 8 9

fre

cue

nci

a

tallas de zapatos

Page 7: Apuntes. Presentación de datos, agrupación y gráficos

Apuntes de clase y ejemplos

a.

3. Colocar las observaciones en su correspondiente clase de manera que sean inclusivos y no se solapen.

Ejemplo.

Se registraron los tiempos (en horas) de 20 obreros para finalizar una manufactura. Los datos a continuación:

3.5 5 3 3.9

5.2 2.3 6.2 1

2.8 3.6 2.4 4.4

6.7 2.6 4.8 2.8

4.5 2.9 3.6 5.5

1. Decidir el número de clases.

N=20

25=32

K=5

Se ordenan para localizar valor max y valor min.

1

2.3

2.4

2.6

2.8

2.8

2.9

3

3.5

3.6

3.6

3.9

4.4

4.5

4.8

5

5.2

5.5

6.2

6.7

2. Decidir la amplitud de cada clase.

max 6.7

min 1

rango 5.7

Page 8: Apuntes. Presentación de datos, agrupación y gráficos

Apuntes de clase y ejemplos

n 20

k 5

amplitud (6.7-1)/5=1.14 aproximado a 1.2

3. Armar las clases de manera que sean inclusivas y no se solapen.

LIR LSR ¿Cómo se leen los intervalos? Clases MC FREC FREC R FREC A FREC R A

1 2.2 1 y menos de 2.2 [1, 2.2) 1.6 1 5% 1 5%

2.2 3.4 2.2 y menos de 3.4 [2.2, 3.4) 2.8 7 35% 8 40%

3.4 4.6 3.4 y menos de 4.6 [3.4, 4.6) 4 6 30% 14 70%

4.6 5.8 4.6 y menos de 5.8 [4.6, 5.8) 5.2 4 20% 18 90%

5.8 7 5.8 y menos de 7 [5.8, 7) 6.4 2 10% 20 100%

20 100%

Marca de clase: punto medio de cada clase.

LIR: límite inferior real del intervalo.

LSR: límite superior real del intervalo.

Histograma: gráfica que coloca las clases de una distribución de frecuencias en el eje horizontal y las

frecuencias en el eje vertical. Revela detalles y patrones de la distribución. Las barras se dibujan unidas. Se

utiliza para datos agrupados.

Polígono de frecuencias: se grafica con las marcas de clase y las frecuencias.

1

7

6

4

2

0

1

2

3

4

5

6

7

8

1 y menos de 2.2 2.2 y menos de 3.4 3.4 y menos de 4.6 4.6 y menos de 5.8 5.8 y menos de 7

fre

cue

nci

a

Horas para terminar una manufacturas

Page 9: Apuntes. Presentación de datos, agrupación y gráficos

Apuntes de clase y ejemplos

Ojiva o diagrama de Galton: llamado a veces gráfico de frecuencias acumuladas, es una línea que conecta

puntos que son el porcentaje acumulado de observaciones situadas por debajo del límite superior de cada

intervalo en una distribución de frecuencias acumuladas.

Otros gráficos.

Diagrama de puntos

Cuando queremos relacionar dos variables entre sí, utilizamos el diagrama de puntos.

Una de las variables debe ser una serie ordenada.

Se puede relacionar una variable con respecto al tiempo (serie de tiempo).

También se pueden relacionar dos variables entre sí.

Ejemplo. Relacionando dos variables.

0

1

2

3

4

5

6

7

8

1.6 2.8 4 5.2 6.4

fre

cue

nci

a

Horas para terminar una manufactura

5%

40%

70%

90%

100%

0%

20%

40%

60%

80%

100%

120%

2.2 3.4 4.6 5.8 7

fre

cue

nci

a re

lati

va a

cum

ula

da

Horas para terminar una manufactura

Page 10: Apuntes. Presentación de datos, agrupación y gráficos

Apuntes de clase y ejemplos

Producción de petróleo Inversión

450 3.2

480 2.6

500 2.8

520 2.8

560 3.3

580 3.1

590 3.3

600 3.2

620 3.5

650 3.5

700 3.9

Series de tiempo.

Periodo Porcentaje de población desempleada en Cancún

2008/01 4.5

2008/02 3.0

2008/03 4.3

2008/04 4.9

2009/01 5.0

2009/02 7.2

2009/03 8.1

2009/04 6.7

2010/01 6.0

2010/02 6.6

2010/03 6.2

Fuente: INEGI.

3

3.1

3.2

3.3

3.4

3.5

3.6

3.7

3.8

3.9

4

400 450 500 550 600 650 700 750

Inve

rsió

n

Produccion de petroleo

Page 11: Apuntes. Presentación de datos, agrupación y gráficos

Apuntes de clase y ejemplos

0.0

1.0

2.0

3.0

4.0

5.0

6.0

7.0

8.0

9.0

2008

/01

2008

/02

2008

/03

2008

/04

2009

/01

2009

/02

2009

/03

2009

/04

2010

/01

2010

/02

2010

/03

Po

rce

nta

je d

e p

ob

laci

ón

de

sem

ple

ada

en

Can

cún

Trimestres