Distribución de Frecuencias
Click here to load reader
-
Upload
omar-cano-contreras -
Category
Documents
-
view
214 -
download
0
description
Transcript of Distribución de Frecuencias
DISTRIBUCIÓN DE FRECUENCIAS
En un estudio estadístico una vez que se recopilan los datos del caso, es necesario
clasificarlos y ordenarlos antes de intentar su interpretación. Generalmente se tienen
números grandes de observaciones que se anotan simplemente en el orden en que esas
observaciones se vayan haciendo. La clasificación adecuada de esas observaciones es
necesaria y de gran importancia para poder llegar a conclusiones mediante su análisis.
ELABORACIÓN DE UNA DISTRIBUCIÓN DE FRECUENCIAS:
Es el agrupamiento de datos en categorías que muestren el número de observaciones en
cada categoría mutuamente excluyente.
EJEMPLO:
Se tiene las edades de los obreros de una cierta compañía:
28 34 43 30 47 38 34 40 31 33
42 33 42 39 30 32 47 37 32 35
41 35 37 33 39 34 32 43 40 38
CALCULAMOS EL RANGO (R):
La edad mínima es: 28. La edad máxima es: 47.
Entonces el rango es: R = 47 – 28 = 19.
CALCULAMOS EL NÚMERO DE CLASES O INTERVALOS (K):
Algunos métodos para hallar el número de clases, esto es sólo una sugerencia:
Primer método:
Donde “n” es el número total de datos. Para nuestro ejemplo:
Segundo método:
Para nuestro ejemplo:
Tercer método:
Este es una sugerencia de los expertos:
N Kn < 50 5 a 7
50 ≤ n < 100 6 a 7100 ≤ n <250 7 a 12
N ≥ 250 10 a 20
Cuarto método:
La experiencia profesional puede determinar el número de clases. Demasiadas clases o
muy pocas no podrían dar a conocer la forma básica del conjunto de datos. Por regla
general, es mejor no utilizar menos de 5 ni más de 15 clases en la elaboración de una
distribución de frecuencias.
Quinto método:
También se puede utilizar la regla de “la potencia de 2” para determinar el número de
clase. Seleccionamos el número entero más pequeño tal que 2k ≥ n, donde n es el número
total de observaciones. Veamos una pequeña tablita con esta regla:
Nº total de observaciones Nº recomendado de clases K9 – 16 4 24 = 1617 – 32 5 25 = 3233 – 64 6 26 = 6465 – 128 7 27 = 128129 – 256 8 28 = 256257 – 512 9 29 = 512513 – 1024 10 210 = 1024
Para nuestro ejemplo haremos caso del primer método, es decir K = 5.
CALCULANDO LA AMPLITUD DE INTERVALO (A):
Cuando se trata de características cuantitativas, la amplitud de una clase en la distribución
de frecuencias, se llama intervalos de clase. Generalmente los intervalos de clase son de
igual amplitud. En este caso la amplitud de un intervalo de clase es la diferencia entre dos
marcas de clase sucesivas, o la diferencia entre los límites superiores (o inferiores) de dos
clases sucesivas. La amplitud de los intervalos de clase a usar al tabular un determinado
conjunto de datos, depende de la naturaleza de esos datos y del uso que de ellos se piense
hacer. Debe tenerse en cuenta que si los intervalos son muy amplios contendrán
observaciones de magnitudes bastante variables, las que estaremos considerando en
conjunto, como un grupo homogéneo, al hacer la distribución de frecuencias.
Para nuestro caso:
Tomaremos como nuestro intervalo como A = 4.
CONSTRUIR LOS LÍMITES DE CLASES:
Vemos que cada intervalo debe tener 4 números: Entonces 28 + 4 -1 = 31. Contiene al 28,
29, 30 y 31. Entonces las clases serán:
Límite Inferior Límite Superior28 3132 3536 3940 4344 47
CALCULANDO LOS LÍMITES REALES:
Sumamos o restamos la mitad de la unidad de medida: Es decir: ½ = 0.5.
Límites Límites RealesInferior Superior Inferior Superior
28 31 27.5 31.532 35 31.5 35.536 39 35.5 39.540 43 39.5 43.544 47 43.5 47.5
CALCULANDO LAS MARCAS DE CLASE (Xi):
El punto medio de un intervalo de clase se acostumbra llamarlo además punto medio,
marca de clase o valor central.
Límites Límites Reales Marca de Clase
(Xi)Inferior Superior Inferior Superior
28 31 27.5 31.5 29.5
32 35 31.5 35.5 33.5
36 39 35.5 39.5 37.5
40 43 39.5 43.5 41.5
44 47 43.5 47.5 45.5
TABLA DE FRECUENCIA:
Límites Límites Reales Marca de Clase
(Xi)
Frecuencia
(ni)Inferior Superior Inferior Superior
28 31 27.5 31.5 29.5 4
32 35 31.5 35.5 33.5 11
36 39 35.5 39.5 37.5 6
40 43 39.5 43.5 41.5 7
44 47 43.5 47.5 45.5 2
Puede resultar conveniente convertir las frecuencias de clase a frecuencia de clase relativas
para mostrar el porcentaje del número total de observaciones en cada clase.
Xi Marca de clase.
ni Frecuencia absoluta.
Ni Frecuencia absoluta acumulada.
fi Frecuencia relativa.
Fi Frecuencia relativa acumulada.
Hallamos las frecuencias acumuladas y las frecuencias relativas:
Límites
Límites Reales
Xi ni Ni fi Fi
Li Ls Lri Lrs
28 31 27.5
31.5
29.5
4 4 0.13
0.13
32 35 31.5
35.5
33.5
11 15 0.37
0.50
36 39 35.5
39.5
37.5
6 21 0.20
0.70
40 43 39.5
43.5
41.5
7 28 0.23
0.93
44 47 43.5
47.5
45.5
2 30 0.07
1.00
EJEMPLO:
Tenemos las notas de un concurso de matemática en un colegio, que participaron 170
estudiantes (la nota máxima es 100 y la nota mínima es 0).
54.5
52.0
88.0
45.0
68.9
40.0
84.1
71.9
89.0
75.5
69.0
77.4
74.0
60.0
70.2
71.4
30.0
59.8
77.1
58.5
15.1
52.3
80.0
74.5
53.0
70.5
63.0
90.4
67.2
81.4
25.3
70.0
60.5
89.5
41.0
63.5
58.0
56.4
62.3
64.7
73.8
85.2
45.0
56.5
72.2
69.5
80.1
24.0
58.6
75.8
54.0
94.1
70.5
61.5
30.0
54.5
72.2
69.0
55.4
72.9
91.2
99.0
47.6
51.5
64.0
64.2
56.6
60.0
80.1
75.3
63.1
66.9
58.0
51.5
50.6
68.2
65.5
55.0
98.2
62.5
63.0
66.0
69.2
36.5
88.6
53.2
77.5
52.0
64.0
67.4
70.0
87.0
95.6
37.3
74.4
85.1
78.5
71.0
68.0
84.7
79.0
61.0
79.0
66.2
60.6
37.6
65.1
77.7
82.3
84.8
76.9
64.0
25.6
73.0
48.3
82.4
8.0 50.5
58.0
55.8
59.5
83.0
86.0
45.1
41.2
60.4
77.0
76.5
65.8
87.9
95.6
68.1
67.0
68.2
77.2
69.4
56.0
84.6
65.9
55.5
26.0
42.8
58.0
74.3
84.4
45.5
78.1
95.2
63.7
58.5
17.2
62.6
63.0
76.0
41.0
73.5
67.1
59.0
91.7
64.0
63.3
68.5
72.0
55.5
57.0
46.6
76.5
53.0
46.7
95.0
Vamos a organizar los datos en una distribución de frecuencias y para eso lo haremos en 3
pasos:
PASO 1: Estableceremos grupos más conocidos como clases. En este problema la primera
clase puede incluir a todos las notas que estén entre 0 – 10, es decir las notas que van de 0
hasta antes del 10 (no incluye el 10 pero si incluye el 9.999).
Intervalo de ClaseLimite Inferior Limite Superior
0 - 1010 - 2020 - 3030 - 4040 - 5050 - 6060 - 7070 - 80
80 - 9090 - 100
PASO 2:
Vamos a distribuir en clases las notas de los estudiantes, sólo haremos las 7 primeras para
mostrar como se hace:
54.5 Pertenece a la clase de 50 – 60
52.0 Pertenece a la clase de 50 – 60
88.0 Pertenece a la clase de 80 – 90
45.0 Pertenece a la clase de 40 – 50
68.9 Pertenece a la clase de 60 – 70
40.0 Pertenece a la clase de 40 – 50
84.1 Pertenece a la clase de 80 – 90
PASO 3:
Contamos las notas que pertenecen a cada clase:
Intervalo de ClaseFrecuencia
Limite Inferior Limite Superior0 - 10 110 - 20 220 - 30 430 - 40 540 - 50 1350 - 60 3360 - 70 4570 - 80 3680 - 90 2190 - 100 10
HALLANDO INTERVALO DE CLASE Y PUNTOS MEDIOS DE CLASE:
En el ejemplo de las notas, hay 10 clases todas con intervalos de clases de 10 unidades y
las marcas de clase o puntos medios son sucesivamente 5, 15, 25, 35,…
CALCULANDO LAS FRECUENCIAS RELATIVAS:
Intervalo de Clase X Frecuencia Frecuencia Frecuencia Frecuencia
i AbsolutaAbsoluta
AcumuladaRelativa
RelativaAcumulada
LimiteInferio
r
LimiteSuperio
r
0 10 5 1 1 0.0059
0.0059
10 20 15 2 3 0.0118
0.0177
20 30 25 4 7 0.0235
0.0412
30 40 35 5 12 0.0294
0.0706
40 50 45 13 25 0.0765
0.1471
50 60 55 33 58 0.1941
0.3412
60 70 65 45 1030.2647
0.6059
70 80 75 36 1390.2118
0.8177
80 90 85 21 1600.1235
0.9412
90 100 95 10 1700.0588
1
SUPONGAMOS:
En el ejemplo de las notas en vez de las 10 clases consideradas, tomáramos sólo las 4
siguientes:
0 – 2525 – 5050 – 7575 – 100
Vemos que no estaríamos diferenciando entre calificaciones tan diferentes como 50 y 74
por ejemplo. El caso contrario, o sea si los intervalos de clase son muy pequeños (y por lo
tanto el número de clases grande) también tiene sus inconvenientes. Una distribución
hecha en esa forma revelaría demasiado detalle para poder obtener rápidamente una idea
clara de los aspectos importantes del fenómeno en estudio. Nótese, que esa es la razón por
la que el cuadro de los datos originales no se usa, sino que se hace la distribución de
frecuencias.
SUGERENCIAS PARA ELABORAR UNA DISTRIBUCIÓN DE FRECUENCIAS
A continuación se presenta algunas pautas, las cuales deben considerarse como guías para
la elaboración de una distribución de frecuencias:
Los intervalos de clase utilizados deben ser iguales. Los intervalos de clase desiguales
ofrecen problemas al representar en forma gráfica la distribución. Sin embargo, en algunos
casos pueden ser necesarios intervalos de clase desiguales para evitar un gran número de
clases vacías, o casi vacías.
EJEMPLO:
Veamos el ejemplo de las notas de otro concurso de matemática en donde participaron
1000 estudiantes:
Intervalo de ClaseFrecuenciaLimite
InferiorLimite
Superior
0 - 10 010 - 20 220 - 30 330 - 40 1540 - 50 9050 - 60 22060 - 70 35070 - 80 20080 - 90 10090 - 100 20
Entonces vemos que las clases de 0-10, 10-20, 20-30, no hay casi estudiantes. Entonces
podemos juntar con la clase 30-40:
Intervalo de ClaseFrecuenciaLimite
InferiorLimite
Superior
0 - 40 2040 - 50 90
50 - 60 22060 - 70 35070 - 80 20080 - 90 10090 - 100 20
Trate de evitar tener clases abiertas.
Este tipo de clases ocasiona problemas al hacer gráficos, y al determinar ciertas medidas de
tendencia central y de dispersión.
EJEMPLO:
Los gastos de publicidad son un componente importante en el costo de mercancías
vendidas. A continuación se presenta una distribución de frecuencias que muestran los
gastos de publicidad de 60 compañías productoras.
Gasto de publicidad (millones de $)Número de compañías
( f )
Menos de 35 7
35 – 45 10
45 – 55 21
55 – 65 16
Más de 65 10
Total 64
Evite la superposición de límite de clases establecidas.
No deben utilizarse límites de clase como 10 – 20 y 20 – 30. Las clases establecidas de esta
manera no son mutuamente excluyentes, lo que infringe la definición de distribución de
frecuencias. Con la superposición de clases no estaría claro dónde clasificar un valor de 20.
¿Pertenece a la clase de 10 – 20 o la de 20 – 30? Estos son sólo para no complicarnos,
como en el ejemplo anterior.