Post on 30-Jun-2015
description
Apuntes de clase y ejemplos
Presentación de datos.
Para organizar los datos:
Tablas de distribución de frecuencias
Gráficos
Distribución de frecuencias: es una tabla utilizada para organizar datos. La columna de la izquierda
(llamada clases o grupos) contiene todos los valores que puede tomar la variable estudiada. La columna de la
derecha es una lista de las frecuencias o número de observaciones correspondientes a cada clase.
Distribución de frecuencias de variable cualitativa.
Distribución de frecuencias de variable cuantitativa:
o Sin agrupar.
o Agrupada.
Distribución de frecuencias de una variable cualitativa.
Ejemplo.
Se registró el sexo de los primeros 20 clientes que entraron en un Wallmart al abrir.
Codificación: 0= hombre, 1=mujer.
0 1
1 1
0 0
0 1
0 0
0 0
0 0
0 1
1 0
1 0
Tabla de distribución de frecuencias.
Valores frecuencia frecuencia relativa grados
Hombre 0 13 65% 234
Mujer 1 7 35% 126
20 100% 360
Gráfica de barras: la altura de cada rectángulo representa la frecuencia de cada valor. Las barras se dibujan separadas
entre sí. Sirve para llamar la atención en la frecuencia de cada valor.
Apuntes de clase y ejemplos
Gráfica de sectores (circular, de pastel, de pie, de tarta): el círculo representa el total y los segmentos que
parten del centro representan las proporciones de ese total. Cada segmento es proporcional a la frecuencia
correspondiente. Se utiliza cuando se quiere llamar la atención sobre la proporción.
Ejemplo.
Se preguntó a 15 personas qué les parece el servicio de un restaurant. Los datos registrados son los siguientes:
1 1 2 4 2 1 3 1 2 1 4 4 2 4 4
Codificación: 1=Muy satisfecho, 2=satisfecho, 3=regular, 4=nada satisfecho.
Valores frecuencia frecuencia relativa grados
Muy satisfecho 1 5 33.33% 120
Satisfecho 2 4 26.67% 96
Regular 3 1 6.67% 24
Nada satisfecho 4 5 33.33% 120
15 100% 360
0
5
10
15
Hombre Mujer
Hombre 65%
Mujer 35%
Apuntes de clase y ejemplos
Distribución de frecuencias de una variable cuantitativa
Distribución de frecuencias sin agrupar
Cuando son pocos datos o pertenecen a una variable discreta, se pueden representar de forma no agrupada.
Ejemplo.
Se contaron el número de automóviles vendidos al mes en 20 sucursales Ford. Los datos son los siguientes.
6 8 10 8
7 9 8 10
10 7 10 10
9 11 9 9
8 9 9 9
Valores Frecuencia Frecuencia relativa frecuencia acumulada frecuencia relativa acumulada
6 1 5% 1 5%
7 2 10% 3 15%
8 4 20% 7 35%
9 7 35% 14 70%
10 5 25% 19 95%
11 1 5% 20 100%
0
1
2
3
4
5
6
Muy satisfecho Satisfecho Regular Nada satisfecho
Muy satisfecho
33%
Satisfecho 27% Regular
7%
Nada satisfecho
33%
Apuntes de clase y ejemplos
20 100%
Frecuencia: número de observaciones para cada clase o valor de la variable.
Frecuencia relativa: la proporción de cada frecuencia con respecto al total de observaciones.
Frecuencia acumulada: para cada valor xi, es la suma de las frecuencias de los valores anteriores o iguales a
xi.
Frecuencia relativa acumulada: es la frecuencia acumulada de las frecuencias relativas anteriores o iguales a
cada valor xi.
Polígono de frecuencias: línea que une los puntos donde se relaciona cada clase con su frecuencia. Muestra
la simetría de la distribución de frecuencias.
Apuntes de clase y ejemplos
Ejemplo.
Considere los siguientes datos, pertenecientes a la talla de zapatos de 15
personas.
3 6 8
9 4 7
7 8 9
2 8 6
4 6 3
Valores frecuencia frecuencia relativa
frecuencia acumulada
frecuencia relativa acumulada
2 1 6.67% 1 6.67%
3 2 13.33% 3 20.00%
4 2 13.33% 5 33.33%
5 0 0.00% 5 33.33%
6 3 20.00% 8 53.33%
7 2 13.33% 10 66.67%
8 3 20.00% 13 86.67%
0
1
2
3
4
5
6
7
8
6 7 8 9 10 11
fre
cue
nci
as
autos vendidos
0
1
2
3
4
5
6
7
8
6 7 8 9 10 11
fre
cue
nci
a
Autos vendidos
(nota técnica: Por cuestiones
de tiempo, no añadí en Excel
los valores que cierran la
curva gráficamente. Pero
ustedes al realizarlo de forma
manual deben añadirlo).
Apuntes de clase y ejemplos
Valores frecuencia frecuencia relativa
frecuencia acumulada
frecuencia relativa acumulada
9 2 13.33% 15 100.00%
15 100.00%
Distribución de frecuencia de datos agrupados.
Cuando son muchos datos o pertenecen a una variable continua, se presentan de forma agrupada.
Al agruparse deben ser mínimo 5 clases y máximo 20.
Una regla simple para calcularlos es la siguiente:
2k≥n
También puede utilizarse la ley de Sturges:
k=1+3.3log(n)
Decidir cuántas clases se utilizarán es cuestión de criterio y no hay reglas específicas para ello. Pero las pautas
como la regla simple y la ley de Sturges nos ayudan a decidir un número adecuado de intervalos.
Pasos para agrupar datos:
1. Decidir el número de clases o intervalos.
2. Calcular el ancho o amplitud de las clases (o intervalos). Se redondea a un número entero para
facilitar la interpretación.
0
1
2
3
4
2 3 4 5 6 7 8 9
0
1
2
3
4
2 3 4 5 6 7 8 9
fre
cue
nci
a
tallas de zapatos
Apuntes de clase y ejemplos
a.
3. Colocar las observaciones en su correspondiente clase de manera que sean inclusivos y no se solapen.
Ejemplo.
Se registraron los tiempos (en horas) de 20 obreros para finalizar una manufactura. Los datos a continuación:
3.5 5 3 3.9
5.2 2.3 6.2 1
2.8 3.6 2.4 4.4
6.7 2.6 4.8 2.8
4.5 2.9 3.6 5.5
1. Decidir el número de clases.
N=20
25=32
K=5
Se ordenan para localizar valor max y valor min.
1
2.3
2.4
2.6
2.8
2.8
2.9
3
3.5
3.6
3.6
3.9
4.4
4.5
4.8
5
5.2
5.5
6.2
6.7
2. Decidir la amplitud de cada clase.
max 6.7
min 1
rango 5.7
Apuntes de clase y ejemplos
n 20
k 5
amplitud (6.7-1)/5=1.14 aproximado a 1.2
3. Armar las clases de manera que sean inclusivas y no se solapen.
LIR LSR ¿Cómo se leen los intervalos? Clases MC FREC FREC R FREC A FREC R A
1 2.2 1 y menos de 2.2 [1, 2.2) 1.6 1 5% 1 5%
2.2 3.4 2.2 y menos de 3.4 [2.2, 3.4) 2.8 7 35% 8 40%
3.4 4.6 3.4 y menos de 4.6 [3.4, 4.6) 4 6 30% 14 70%
4.6 5.8 4.6 y menos de 5.8 [4.6, 5.8) 5.2 4 20% 18 90%
5.8 7 5.8 y menos de 7 [5.8, 7) 6.4 2 10% 20 100%
20 100%
Marca de clase: punto medio de cada clase.
LIR: límite inferior real del intervalo.
LSR: límite superior real del intervalo.
Histograma: gráfica que coloca las clases de una distribución de frecuencias en el eje horizontal y las
frecuencias en el eje vertical. Revela detalles y patrones de la distribución. Las barras se dibujan unidas. Se
utiliza para datos agrupados.
Polígono de frecuencias: se grafica con las marcas de clase y las frecuencias.
1
7
6
4
2
0
1
2
3
4
5
6
7
8
1 y menos de 2.2 2.2 y menos de 3.4 3.4 y menos de 4.6 4.6 y menos de 5.8 5.8 y menos de 7
fre
cue
nci
a
Horas para terminar una manufacturas
Apuntes de clase y ejemplos
Ojiva o diagrama de Galton: llamado a veces gráfico de frecuencias acumuladas, es una línea que conecta
puntos que son el porcentaje acumulado de observaciones situadas por debajo del límite superior de cada
intervalo en una distribución de frecuencias acumuladas.
Otros gráficos.
Diagrama de puntos
Cuando queremos relacionar dos variables entre sí, utilizamos el diagrama de puntos.
Una de las variables debe ser una serie ordenada.
Se puede relacionar una variable con respecto al tiempo (serie de tiempo).
También se pueden relacionar dos variables entre sí.
Ejemplo. Relacionando dos variables.
0
1
2
3
4
5
6
7
8
1.6 2.8 4 5.2 6.4
fre
cue
nci
a
Horas para terminar una manufactura
5%
40%
70%
90%
100%
0%
20%
40%
60%
80%
100%
120%
2.2 3.4 4.6 5.8 7
fre
cue
nci
a re
lati
va a
cum
ula
da
Horas para terminar una manufactura
Apuntes de clase y ejemplos
Producción de petróleo Inversión
450 3.2
480 2.6
500 2.8
520 2.8
560 3.3
580 3.1
590 3.3
600 3.2
620 3.5
650 3.5
700 3.9
Series de tiempo.
Periodo Porcentaje de población desempleada en Cancún
2008/01 4.5
2008/02 3.0
2008/03 4.3
2008/04 4.9
2009/01 5.0
2009/02 7.2
2009/03 8.1
2009/04 6.7
2010/01 6.0
2010/02 6.6
2010/03 6.2
Fuente: INEGI.
3
3.1
3.2
3.3
3.4
3.5
3.6
3.7
3.8
3.9
4
400 450 500 550 600 650 700 750
Inve
rsió
n
Produccion de petroleo
Apuntes de clase y ejemplos
0.0
1.0
2.0
3.0
4.0
5.0
6.0
7.0
8.0
9.0
2008
/01
2008
/02
2008
/03
2008
/04
2009
/01
2009
/02
2009
/03
2009
/04
2010
/01
2010
/02
2010
/03
Po
rce
nta
je d
e p
ob
laci
ón
de
sem
ple
ada
en
Can
cún
Trimestres