8/16/2019 Clase 05.- Organización Tabular de Datos.pdf
1/80
Estadística
Clase 04:
Tables organization of dataOrganización Tabular de Datos
Universidad Nacional de Huancavelica
Facultad de Ciencias de Ingeniería
Departamento Académico de Ciencias Básicas
Escuela Académico Profesional de Ingeniería Ambiental Sanitaria
Ing. Jorge Luis Huere PeñaMaster in Informátics and Computer Science
e-mail : [email protected]
http://images.google.com.pe/imgres?imgurl=http://chispis.blogia.com/upload/20060619143602-foto-estadistica-blog.jpeg.bmp&imgrefurl=http://chispis.blogia.com/2006/junio.php&h=225&w=220&sz=146&hl=es&start=17&tbnid=T3aEvO7aRj1gLM:&tbnh=108&tbnw=106&prev=/images?q=estadistica&gbv=2&svnum=10&hl=es&sa=G
8/16/2019 Clase 05.- Organización Tabular de Datos.pdf
2/80
2
Si los datos no están organizados son depoca utilidad en una investigación o para una toma dedecisiones.
8/16/2019 Clase 05.- Organización Tabular de Datos.pdf
3/80
3
Los datos deben organizarse, para entendermejor su naturaleza fundamentalmente utilizandodos métodos : el método tabular y el método gráfico.
The importance of data organization
a importancia de la organización de los datos
8/16/2019 Clase 05.- Organización Tabular de Datos.pdf
4/80
4
La organización tabular de datos pueden
realizarse bajo tres formas:
1. Clasificación ordenada de datos.
2. Diagrama de tallos y hojas
3. Tablas de distribución de frecuencias.
Tables organization of data
Organización Tabular de datos
8/16/2019 Clase 05.- Organización Tabular de Datos.pdf
5/80
5
Orderly classification dataClasificación ordenada de datos
Si ordenamos los datos sin procesar, de laobservación más pequeña a la más grande, la
secuencia ordenada obtenida, se denomina
clasificación ordenada.
Ejemplo: en un estudio sobre coeficienteintelectual de estudiantes de ingeniería de una
universidad peruana, se obtuvieron estas
observaciones:
33.1 34.6 34.2 36.1 34.2 35.6 34.5 35.8 34.5 34.2 34.3 35.1
35.2 33.7 36.0 34.2 34.7 34.6 34.3 33.4 34.9 33.8 33.6 35.3
35.2 34.6 33.7 34.8 33.9 34.7 35.1 34.2 36.5 34.1 34.0
8/16/2019 Clase 05.- Organización Tabular de Datos.pdf
6/80
6
Ordenando los datos de manera ascendente,
tenemos:
33.1 33.7 33.9 34.2 34.2 34.3 34.6 34.7 34.9 35.2 35.6 36.1
33.4 33.7 34.0 34.2 34.2 34.5 34.6 34.7 35.1 35.2 35.8 36.5
33.6 33.8 34.1 34.2 34.3 34.5 34.6 34.8 35.1 35.3 36.0
¿Cuáles son las principales propiedades que se
observa en este conjunto de datos?
8/16/2019 Clase 05.- Organización Tabular de Datos.pdf
7/80
7
Las principales propiedades que se observan en esteconjunto de datos son:
El número de datos es de 35.
La menor observación es de 33,1.
La mayor observación es de 36,5 .
El rango de los valores observados es de:
3,5 = (36,5 – 33,1)+ 0,1
El 51,43% (18 trabajadores) de los datos están alrededorde 34 . (18/35)*100.
Son muy pocos frecuentes (8,57%) los trabajadores concoeficiente intelectual mayor a 36 . (sólo 3 trabajadores).
8/16/2019 Clase 05.- Organización Tabular de Datos.pdf
8/80
8
8/16/2019 Clase 05.- Organización Tabular de Datos.pdf
9/80
9
Mientras mayor sea el número de observaciones presentesen una serie de datos, mas laborioso es realizar la
clasificación ordenada de los datos.
Whi le the greater the number of observat ions present
in a data set, is more labo riou s make the orderly
classi f icat ion of d ata.
8/16/2019 Clase 05.- Organización Tabular de Datos.pdf
10/80
10
Un diagrama de tallo y hojas consiste en una serie de
hileras horizontales de números. El número utilizado
para designar una hilera es un tallo, el resto denúmeros de la hilera se denominan hojas.
Stem and leaf iagram
Diagrama de tallo y hojas
Esta técnica funciona bien,cuando el conjunto de datos
no tiene una gran dispersión
8/16/2019 Clase 05.- Organización Tabular de Datos.pdf
11/80
11
Elija algunos números adecuados que puedanservir de tallo. Se requieren como mínimo 5tallos. Los tallos elegidos generalmente son elprimer o los dos primeros dígitos de los datos.
Nombre las hileras mediante los tallos elegidos.Organice gráficamente los datos registrando eldígito, siguiendo el tallo.
Trazar una curva a lo largo de la parte superior
del diagrama.
Determinar las principales características.
Se pueden considerar el siguiente proceso:
8/16/2019 Clase 05.- Organización Tabular de Datos.pdf
12/80
12
Ejemplo: Con los datos anteriores sobre el coeficiente intelectual de los
trabajadores, construir un diagrama tallo-hoja.
33.1 34.6 34.2 36.1 34.2 35.6 34.5 35.8 34.5 34.2 34.3 35.1
35.2 33.7 36.0 34.2 34.7 34.6 34.3 33.4 34.9 33.8 33.6 35.3
35.2 34.6 33.7 34.8 33.9 34.7 35.1 34.2 36.5 34.1 34.0
Dato menor: 33,1 Dato mayor: 36,5
Tallos posibles: 33, 34, 35 y 36
Sólo existen 4 tallos, debiendo ser el mínimo 5 tallos,entonces los tallos propuestos se desdoblan, de lasiguiente manera:
33 (del 33,0 al 33,4)
33 (del 33,5 al 33,9)
8/16/2019 Clase 05.- Organización Tabular de Datos.pdf
13/80
1
3
34 (del 34,0 al 34,4)
34 (del 34,5 al 34,9)
35 (del 35,0 al 35,4)
35 (del 35,5 al 35,9)
36 (del 36,0 al 36,4)
36 (del 36,5 al 36,9)
Luego clasificamos los datos en función al valor deldecimal.
8/16/2019 Clase 05.- Organización Tabular de Datos.pdf
14/80
14
¿Qué características se observan?.
Finalmente, se traza una línea por el borde, a fin dedelimitar la forma de la distribución.
33
33
34
34
35
35
36
36
1 4
7 7 9 8 6
2 2 2 3 2 2 1 3 0
6 6 8 7 6 7 5 5 9
2 2 1 1 3
6 8
0 1
5
25 datos
10 datos
8/16/2019 Clase 05.- Organización Tabular de Datos.pdf
15/80
15
Son 35 casos.
La menor observación es de 33,1 .La mayor observación es de 36,5 .
El rango de los valores observados es de 3.5 .(36,5 – 33,1 + 0.1 .)
El 51,43% (18 casos) de los datos están alrededorde los 34 .
Son muy poco frecuentes los casos mayores a 36(3 casos) y menores a 33,5 (2 casos).
La distribución de datos está sesgada a la derecha(sesgo positivo), es decir, hay una mayorconcentración de datos a la izquierda.
Las principales propiedades de los datos :
8/16/2019 Clase 05.- Organización Tabular de Datos.pdf
16/80
16
Se realiza un estudio para ayudar a comprender el
efecto de fumar en los patrones de sueño. La
variable es el tiempo que tarda en quedarse dormido.
La muestras de fumadores y no fumadores producen
estas observaciones :
17,2 19,7 18,1 15,1 18,3 17,6
16,2 19,9 19,8 23,6 24,9 20,1
19,8 22,9 20,0 24,1 25,0 21,4
21,2 18,9 22,1 20,6 23,3 20,2
21,1 16,9 23,0 20,1 17,5 21,3
21,8 22,1 21,0 20,5 20,4 20,7
19,5 18,8 19,2 22,4 19,3 17,4
Ejercicio
FUMADORES15,1 20,5 17,7 21,3 16,0 24,8
16,8 21,2 18,1 22,1 15,9 25,2
22,8 22,4 19,4 25,2 18,3 25,0
25,8 24,1 15,0 24,1 21,6 16,3
24,3 25,7 15,2 18,0 23,8 17,9
23,2 25,1 16,1 17,2 24,9 19,9
15,7 15,3 19,9 23,1 23,0 15,1
NO FUMADORES
8/16/2019 Clase 05.- Organización Tabular de Datos.pdf
17/80
17
Construya un diagrama tallo-hoja para cada uno
de estos conjuntos de datos. Utilice los valores
enteros del 15 al 25 (inclusive) como tallos.
¿Se sorprendería si alguien le dijera que no existe
diferencia en la distribución de esta variable en los
dos grupos?. Explique.
8/16/2019 Clase 05.- Organización Tabular de Datos.pdf
18/80
18
Frequency Table
Tabla de frecuencias
Consiste en una presentación resumidade la información usando tablas o cuadros
Ejemplo: Supongamos que en una entrevista a usuariosdel lo que se busca evaluar son 2 aspectos:
-La opinión sobre la calidad de una construcción
-Nivel de instrucción de los usuarios.
8/16/2019 Clase 05.- Organización Tabular de Datos.pdf
19/80
19
Como son dos variables categóricas, lapresentación de los datos podría realizarse enuna tabla cruzada:
NIVEL OPINIÓN TOTAL
EDUCATIVO Favorable Desfavorable Analfabeto 8 2 10
Primaria 15 5 20
Secundaria 23 7 30
Superior 12 3 15
TOTAL 58 17 75
8/16/2019 Clase 05.- Organización Tabular de Datos.pdf
20/80
20
Ventajas- Se pueden apreciar propiedades de los datos.
- Permite establecer asociaciones entre variables- Se ahorra espacio en un informe escrito.
Elementos:
A. El Título: enunciado breve e informativo acercadel contenido de la tabla (indicar el número). Un buen título
debe responder a las siguientes interrogantes:
8/16/2019 Clase 05.- Organización Tabular de Datos.pdf
21/80
21
1. ¿Qué contiene la tabla?Ej.: La opinión de 75 usuarios sobre calidad
de la construcción
2. ¿Cómo estamos presentando el contenido?
Ej.: Por nivel educativo de los usuarios3. ¿De dónde se obtuvieron los datos?
Ej.: Del servicio de Información de la Municipalidad
4. ¿Cuándo se obtuvo la información?Ej.: (fecha de la recolección de los datos)
What, How, Where, When
8/16/2019 Clase 05.- Organización Tabular de Datos.pdf
22/80
22
Tabla N° 1.- Opinión de 75 usuarios por nivel educativosobre la calidad de la construcción en la Provincia de
Huancavelica. enero del 2010.
Un buen título podría ser:
B. La Matriz: Está constituido por el primerrenglón y la primera columna, en donde se
describen los nombres de las categorías(en datos categóricos) o los intervalos de
clases (en datos cuantitativos), tan concisocomo sea posible.
8/16/2019 Clase 05.- Organización Tabular de Datos.pdf
23/80
23
Para datoscategóricos
NIVEL DE OPINIÓN TOTAL
INSTRUCCIÓN Favorable Desfavorable
Analfabeta
Primaria
Secundaria
Superior
TOTAL
EDAD N° de pacientes Tasa porcentual :%
(en años) (f i) (hi)
39 - 46
47 - 54
55 - 6263 - 70
71 - 78
Total
Para datoscuantitativos
Ejemplo
8/16/2019 Clase 05.- Organización Tabular de Datos.pdf
24/80
24
C. El cuerpo: Está conformado por espacios yconstituyen intersecciones de filas y columnas,
que a veces se denominan celdas , y donde se
anotan las frecuencias absolutas y relativasobtenidas en la tabulación, incluyendo totales y
subtotales.
8/16/2019 Clase 05.- Organización Tabular de Datos.pdf
25/80
25
NIVEL OPINIÓN TOTAL
EDUCATIVO Favorable Desfavorable
Analfabeta 8 2 10
Primaria 15 5 20
Secundaria 23 7 30
Superior 12 3 15 TOTAL 58 17 75
Por ejemplo
8/16/2019 Clase 05.- Organización Tabular de Datos.pdf
26/80
26
D. Notas aclaratorias: Están constituidas por todaaquella información adicional que es necesaria
para describir e interpretar adecuadamente elcontenido de la tabla o cuadro.
Es muy importante cuando se trata de datos
proveniente de fuente secundaria.
Es un aspecto ético precisar de donde provienenlos datos, a la vez que nos liberamos de la
responsabilidad de responder por su calidad.
Se escribe con letra más pequeña.
8/16/2019 Clase 05.- Organización Tabular de Datos.pdf
27/80
27
NIVEL OPINIÓN TOTAL
EDUCATIVO Favorable Desfavorable
Analfabeta 8 2 10 Primaria 15 5 20
Secundaria 23 7 30
Superior 12 3 15
TOTAL 58 17 75
Tabla 1: Opinión de 75 usuarios por nivel educativo sobre la
calidad de la construcción en la ciudad de Huancavelica,enero del 2010.
Fuente: Hospital San Rosa. Dirección de Procesos. Enero 2010.
8/16/2019 Clase 05.- Organización Tabular de Datos.pdf
28/80
28
3. Presentan por lo menos dos columnas: categoría oclase y el número de datos o frecuencia de clase.
4. Puede incluirse una columna de tasa porcentual.
1. Se utilizan para presentar una sola variable.2. Pueden representar datos cualitativos o
cuantitativos.
A) Tablas simples
Pueden ser simples o cruzadas
Table Types
Tipos de tablas
8/16/2019 Clase 05.- Organización Tabular de Datos.pdf
29/80
1.- TABLAS SIMPLES O UNIDIMENSIONALES
TABLA Nº #
EL TITULO DEBE SER CLARO. DELIMITAR EL ESPACIO Y TIEMPO
VARIABLE FRECUENCIA PORCENTAJE
C1C2
...
Cn
f 1f 2
...
f k
f 1%f 2 %
...
f k %
TOTAL n 100
Fuente: debe indicar la procedencia de los datos, espacio y tiempo
8/16/2019 Clase 05.- Organización Tabular de Datos.pdf
30/80
Ejm. De una variable dicotómica
Género Estudiantes PorcentajeMasculino
Femenino
35
48
42.2
57.8
Total 83 100.0
TABLA Nº 01 Género de los estudiantes de la EAP de Ingeniería Civil de la
Universidad de Hvca. Junio del 2010
Fuente: Dirección Universitaria de Servicios Académicos de la UNH. Junio
del 2010
8/16/2019 Clase 05.- Organización Tabular de Datos.pdf
31/80
Ejm. De una variable Politómica
TABLA Nº 02Estado Civil de los estudiantes de la EAP Ingeniería Civil de
la Universidad de Hvca. Junio del 2010
Estado Civil Estudiantes Porcentaje
Soltero
CasadoViudo
Divorciado
Conviviente
42
132
3
23
50.6
15.72.4
3.6
27.7
Total 83 100.0Fuente: Dirección Universitaria de Servicios Académicos de la UNH. Junio
del 2010
8/16/2019 Clase 05.- Organización Tabular de Datos.pdf
32/80
32
Para datos cualitativos se siguen los pasossiguientes:
(1º) Identificar diferentes categorías.(2º) Realizar un conteo.
(3º) Elaborar la tabla: titulo, cuerpo y fuente.
Table Elabo ration
Elaboración de tablas
8/16/2019 Clase 05.- Organización Tabular de Datos.pdf
33/80
33
Ejemplo
Con la finalidad de mejorar la calidad de la
construcción en una empresa constructora, se ha
formulado la siguiente pregunta a 45 usuarios
encuestados durante una semana: “¿Cómo califica
la calidad de la construcción que Ud, tiene en la
ciudad de Huancavelica: muy bueno, bueno,
aceptable, malo o muy malo”
8/16/2019 Clase 05.- Organización Tabular de Datos.pdf
34/80
34
Muy bueno Aceptable Aceptable Muy bueno BuenoBueno Bueno Muy malo Bueno Bueno
Aceptable Bueno Aceptable Malo Muy bueno
Malo Aceptable Muy malo Aceptable Malo
Aceptable Muy bueno Bueno Bueno Aceptable
Bueno Malo Aceptable Muy malo Bueno
Malo Bueno Malo Bueno Aceptable
Bueno Bueno Muy malo Muy bueno Malo
Aceptable Bueno Aceptable Malo Bueno
Los datos recolectados se presentan a continuación:
8/16/2019 Clase 05.- Organización Tabular de Datos.pdf
35/80
35
Primero, se identifican las categorías:
Muy bueno
Bueno Aceptable
Malo
Muy malo
8/16/2019 Clase 05.- Organización Tabular de Datos.pdf
36/80
36
Segundo, se realiza el conteo de las frecuencias:
Muy bueno /////
Bueno ///// ///// ///// / Aceptable ///// ///// //
Malo ///// ///
Muy malo ////
8/16/2019 Clase 05.- Organización Tabular de Datos.pdf
37/80
37
Tabla 1: Calidad del Servicio de la Construcción …
Fuente: Encuesta a los usuarios, julio 2012
Tercero, se presenta la tabla, considerando el
título y la fuente.
Número de TasaCategoria Pacientes Porcentual
Muy Bueno 5 11,11
Bueno 16 35,55
Aceptable 12 26,67
Malo 8 17,78
Muy Malo 4 8,89
Total 45 100,00
8/16/2019 Clase 05.- Organización Tabular de Datos.pdf
38/80
38
Para datos cuantitativos se sigue el procedimientosiguiente:
(1º) Se calcula el rango:(mayor - menor) + 1
(2º) Se determina el número de clases, que mejorrepresenta a los datos (entre 4 y 20). Se
realiza un tanteo.
(3º) Se determina el tamaño o amplitud de clase.
(4º) Se elige el limite inferior de la primera clase.
8/16/2019 Clase 05.- Organización Tabular de Datos.pdf
39/80
39
(5º) Se establecen los límites inferiores de las
siguientes clases.
(6º) Se establecen los limites superiores de cada unade las clases.
(7º) Se realiza un conteo, a fin de determinarcuantos datos se incluyen en cada clase.
(8º) Se elabora la tabla: titulo, cuerpo y fuente.
8/16/2019 Clase 05.- Organización Tabular de Datos.pdf
40/80
1.- VARIABLE CUANTITATIVA DISCRETA
TABLA Nº #EL TITULO DEBE SER CLARO. DELIMITAR EL
ESPACIO Y TIEMPO
Variable
Frecuencia
absoluta
(f i)
Frecuencia Relativa
Simple en %
(hi %)
Frecuencia Absoluta
Acumulada
(Fi)
Frecuencia relativa
acumulada en %
H%
Z1
Z2
...
Zn
f 1
f 2
...
f k
h1%
h2 %
...
hk %
F1%
F2 %
...
Fk %
H1%
H2 %
...
Hk %
TOTAL n 100
Fuente: debe indicar la procedencia de los datos, espacio y tiempo
Ejemplo
8/16/2019 Clase 05.- Organización Tabular de Datos.pdf
41/80
Númerode Hijos Frecuencia(fi)
Frecuencia
Relativasimple en %
( %ih )
Frecuencia
Absoluta Acumulada
( i F )
Frecuencia
Relativa Acumulada en
% ( %i H )1
2
3
4
5
6
7
8
5
6
6
2
5
2
2
2
16.66%
20.00%
20.00%
6.67%
16.66%
6.67%
6.67%
6.67%
5
11
17
19
24
26
28
30
16.66%
36.67%
56.67%
63.33%
80.00%
86.67%
93.30%
100.00%
Total 30 100.00%
Ejemplo
Numero de Hijos por familia en la comunidad Agraria Santa Ana. Junio del 2007
Fuente: INEI – Huancavelica. Censo Población junio 2007
8/16/2019 Clase 05.- Organización Tabular de Datos.pdf
42/80
2.- VARIABLE CUANTITATIVA CONTINUA
INTERVALO Marcas
de clase
(Yi)
Frecuencia
absoluta
(fi)
Frecuencia
Acum.
(Fi)
Frecuencia
relativa
(hi)
Frecuencia
relativa en %
(hi%)
Frecuencia
relativa acum.en
% (Hi%)
[ Li1 – Ls1 ]
[ Li2 – Ls2 ][ Li3 – Ls3 ]
...
...
[ Lik – Lsk ]
Y1
Y2
Y3
...
...
Yk
f 1
f 2
f 3
...
...
f k
F1
F2
F3
...
...
n
h1
h2
h3
...
...
hk
h1%
h2%
h3%
...
...
hk%
H1%
H2%
H3%
...
...
100
Total n 1.00 100
TABLA DE FRECUENCIAS
8/16/2019 Clase 05.- Organización Tabular de Datos.pdf
43/80
¿COMO CONSTRUIMOS UNA TABLA DE FRECUENCIAS?
PRIMER PASO: Encontrar el rango (R); es decir, la diferencia delMáximo Valor y el mínimo valor.
R = VMAX - VMIN
SEGUNDO PASO: Encontrar el número de intervalos (ley de sturges)
k = 1+3.322*log(n) Si n > 25 nk
Sugerencia:
5 < k < 15
8/16/2019 Clase 05.- Organización Tabular de Datos.pdf
44/80
TERCER PASO: Encontrar la Amplitud del Intervalo
Amplitud del
intervalo
Intervalos traslapados :
R = Dato mayor – Dato menor
Ejemplo:
[149 – 155>[155 – 161>[161 – 167>[167 – 173>[173 – 180>
Intervalos no traslapados: R= Dato mayo r
– Dato m enor + 1
Ejemplo:
[149 – 154][155 – 160][161 – 166]
[167 –
172][173 – 180]
Donde:A : Amplitud de un intervalo de clase.R : Rangok : Número de intervalos de clase.A
= R/k
8/16/2019 Clase 05.- Organización Tabular de Datos.pdf
45/80
Ejemplo:
La gerencia de ventas de una gran empresa de contrucción y renta
especializada en condominios vacacionales desea los lineamientos
disponibles en lo que se refiere a rentas mensuales para enviarlos a posibles vacacionistas. Como primer paso, seleccionó una muestra de
120 ofertas de arrendamiento que se muestran a continuación:
Rentas mensuales (en dólares) de condominios
8/16/2019 Clase 05.- Organización Tabular de Datos.pdf
46/80
1170 1207 1581 1277 1305 1472 1077 1319 1537 1849
1332 1418 1949 1403 1744 1532 1219 896 1500 1671
1471 1399 1041 1379 821 1558 1118 1533 1510 17601826 1309 1426 1288 1394 1545 1032 1289 695 803
1440 1421 1329 1407 718 1457 1449 1455 2051 16771119 1020 1400 1442 1593 1962 1263 1788 1501 1668
1352 1340 1459 1823 1451 1138 1592 982 1981 1091
1428 1603 1699 1237 1325 1590 1142 1425 1550 913
1470 1783 1618 1431 1557 896 1662 1591 1551 16121249 1419 2162 1373 1542 1631 1567 1221 1972 1714
949 1539 1634 1637 1649 1607 1640 1739 1540 2187
1752 1648 1978 640 1736 1222 1790 1188 2091 1829
Rentas mensuales (en dólares) de condominios
Las cifras que se muestran en la tabla del ejemplo se las denomina datos
originales (o sin procesar) . En el estado que se encuentra la tabla, lo únicoque se puede apreciar son las rentas más altas y más bajas del conjunto. Sin
embargo estos datos nos pueden dar información más valiosa
8/16/2019 Clase 05.- Organización Tabular de Datos.pdf
47/80
SEGUNDO PASO: k = 1+3.322 log (120)
k = 1 + 3.322*(2.079)
k = 8
TERCER PASO:
A = R/m
A = 1547/8
A = 193
PRIMER PASO: R = VMAX - VMIN
R = 2187 - 640
R = 1547
CUARTO PASO: Determinar los limites de clase
8/16/2019 Clase 05.- Organización Tabular de Datos.pdf
48/80
Intervalos o Clase
[ 640 – 832 ]
[ 833 - 1025 ] [ 1026 - 1218 ]
[ 1219 - 1411 ]
[ 1412 - 1604 ]
[ 1605 - 1797 ]
[ 1798 - 1990][ 1991 - 2183 ]
[ 2184 - 2376 ]
Existen diversos autores que tienen formas particulares de
iniciar un intervalo; pero, para nuestro ejemplo empezaremos
desde el mínimo valor que es 640.
QUINTO PASO: Contar la cantidad de datos para cada
8/16/2019 Clase 05.- Organización Tabular de Datos.pdf
49/80
QUINTO PASO: Contar la cantidad de datos para cada
clase
Intervalos o Clase
[ 640 – 832 ]
[ 833 - 1025 ] [ 1026 - 1218 ]
[ 1219 - 1411 ]
[ 1412 - 1604 ]
[ 1605 - 1797 ]
[ 1798 - 1990][ 1991 - 2183 ]
[ 2184 - 2376 ]
Conteo
/////
///// / ///// ///// /
///// ///// ///// ///// ////
///// ///// ///// ///// ///// ///// ///// ///
///// ///// ///// ///// ///
///// ///////
/
SEXTO PASO: Determinar la frecuencia de cada clase
8/16/2019 Clase 05.- Organización Tabular de Datos.pdf
50/80
SEXTO PASO: Determinar la frecuencia de cada clase
(frecuencia absoluta f i )
Intervalos o Clase
[ 640 – 832 ]
[ 833 - 1025 ]
[ 1026 - 1218 ][ 1219 - 1411 ]
[ 1412 - 1604 ]
[ 1605 - 1797 ]
[ 1798 - 1990]
[ 1991 - 2183 ][ 2184 - 2376 ]
(f i)
5
6
1124
38
23
9
31
http://a/Estadistica%20I/Clases%20para%20el%20ejercito/Vinculo%20de%20frecuencia%20absoluta%20y%20relativa.ppt
8/16/2019 Clase 05.- Organización Tabular de Datos.pdf
51/80
SETIMO PASO: Distribución de frecuencias relativas (f r )
Para convertir una distribución de frecuencias a unadistribución de frecuencias relativas, cada una de las
frecuencias de clase se divide entre el número total de
frecuencias.
frecuencia de clase (f i )
Número de observaciones (n )Frecuencia relativa (hi) =
Calculo de las frecuencias relativas h
8/16/2019 Clase 05.- Organización Tabular de Datos.pdf
52/80
Calculo de las frecuencias relativas hi
Intervalos o Clase[ 640 – 832 ]
[ 833 - 1025 ]
[ 1026 - 1218 ]
[ 1219 - 1411 ][ 1412 - 1604 ]
[ 1605 - 1797 ]
[ 1798 - 1990]
[ 1991 - 2183 ]
[ 2184 - 2376 ]
f i
5
6
11
2438
23
9
3
1
hi 5/120
6/120
11/120
24/12038/120
23/120
9/120
3/120
1/120
120
0.04 =
0.05 =
0.09 =
0.20 =0.32 =
0.19 =
0.08 =
0.02 =
0.01 =
1.00
OCTAVO PASO: Distribución de frecuencias acumuladas (Fi)
8/16/2019 Clase 05.- Organización Tabular de Datos.pdf
53/80
( i)
Intervalos o Clase
[ 640 – 832 ]
[ 833 - 1025 ]
[ 1026 - 1218 ]
[ 1219 - 1411 ]
[ 1412 - 1604 ][ 1605 - 1797 ]
[ 1798 - 1990]
[ 1991 - 2183 ]
[ 2184 - 2376 ]
f i
5
6
11
24
38
23
9
3
1
hi
120
0.04
0.05
0.09
0.20
0.32
0.19
0.08
0.02
0.01
1.00
Fi = Fi-1 + f i
5 = 0 + 5
11 = 5 + 6
22 = 11 + 11
46 = 22 + 24
84 = 46 + 38
107 = 84 + 23
116 = 107 + 9
119 = 116 + 3
120 = 119+1
NOVENO PASO: Distribución de frecuencias relativas
8/16/2019 Clase 05.- Organización Tabular de Datos.pdf
54/80
NOVENO PASO: Distribución de frecuencias relativas
porcentuales (hi %)
Intervalos o Clase
[ 640 – 832 ]
[ 833 - 1025 ]
[ 1026 - 1218 ]
[ 1219 - 1411 ][ 1412 - 1604 ]
[ 1605 - 1797 ]
[ 1798 - 1990]
[ 1991 - 2187 ]
[ 2184 - 2376 ]
f i
5
6
11
2438
23
9
3
1
hi
120
0.04
0.05
0.09
0.200.32
0.19
0.08
0.02
0.01
1.00
Fi
5
11
22
46
84
107
116
119
120
hi %
4
5
9
2032
19
8
2
1
100
DECIMO PASO: Frecuencias relativas porcentuales acumuladas Hi
8/16/2019 Clase 05.- Organización Tabular de Datos.pdf
55/80
p i
Intervalos o Clase
[ 640 – 832 ]
[ 833 - 1025 ]
[ 1026 - 1218 ]
[ 1219 - 1411 ][ 1412 - 1604 ]
[ 1605 - 1797 ]
[ 1798 - 1990]
[ 1991 - 2183 ]
[ 2184 - 2376 ]
f i
5
6
11
2438
23
9
3
1
hi
120
0.04
0.05
0.09
0.200.32
0.19
0.08
0.02
0.01
1.00
Fi
5
11
22
4684
107
116
119
120
hi %
4
5
9
2032
19
8
2
1
100
Hi %
4
9
18
3870
89
97
99
100
PASO ONCE: Marca de clase Yi
8/16/2019 Clase 05.- Organización Tabular de Datos.pdf
56/80
Intervalos o Clase
[ 640 – 832 ]
[ 833 - 1025 ]
[ 1026 - 1218 ][ 1219 - 1411 ]
[ 1412 - 1604 ]
[ 1605 - 1797 ]
[ 1798 - 1990]
[ 1991 - 2183 ][ 2184 - 2376 ]
f i
5
6
1124
38
23
9
31
hi
120
0.04
0.05
0.090.20
0.32
0.19
0.08
0.020.01
1.00
Fi
5
11
2246
84
107
116
119
120
hi %
4
5
920
32
19
8
21
100
Hi %
4
9
1838
70
89
97
99
100
Yi
736
929
11221315
1508
1701
1894
20872280
La marca de clase (Xi) se calcula sumando el limite inferior y superior de un
intervalo o clase y luego se divide entre 2. ( Yi = [Li +Ls]/2 )
8/16/2019 Clase 05.- Organización Tabular de Datos.pdf
57/80
Resumen de la Tabla de frecuencias
INTERVALO Marcas
de clase
(Yi)
Frecuencia
absoluta
(fi)
Frecuencia
Acum.
(Fi)
Frecuencia
relativa
(hi)
Frecuencia
relativa en %
(hi%)
Frecuencia
relativa acum.en
% (Hi%)
[ Li1 – Ls1 ]
[ Li2 – Ls2 ]
[ Li3 –
Ls3 ]...
...
[ Lik – Lsk ]
Y1
Y2
Y3...
...
Yk
f 1
f 2
f 3...
...
f k
F1
F2
F3...
...
n
h1
h2
h3...
...
hk
h1%
h2%
h3%...
...
hk%
H1%
H2%
H3%...
...
100
Total n 1.00 100
Ejemplo: Las edades de los estudiantes del III ciclo de
8/16/2019 Clase 05.- Organización Tabular de Datos.pdf
58/80
Ejemplo: Las edades de los estudiantes del III ciclo de
la EAP de Ing. Civil son las siguientes
19, 25, 19, 21, 18, 21, 22, 18, 24, 22, 23, 20, 24, 20, 19
Para construir una tabla de frecuencias tenemos que seguir
los siguientes pasos:
PRIMER PASO: R = VMAX - VMIN
R = 25 - 18
R = 7
SEGUNDO PASO: k = 1+3.322 log (15)
8/16/2019 Clase 05.- Organización Tabular de Datos.pdf
59/80
k = 4.91
k = 5
TERCER PASO:
A = 7/5
A = 1.4
A = 1
CUARTO PASO: Construir la tabla de frecuencias
8/16/2019 Clase 05.- Organización Tabular de Datos.pdf
60/80
1001.00nTotal
y1
y2
y3
...
...
y4
H1%
H2%
H3%
...
...
Hm%
h1%
h2%
h3%
...
...
hm%
F1
F2
F3
...
...
Fm
h1
h2
h3
...
...
hm
f 1
f 2
f 3
...
...
f k
[ 18 –19 ]
[ 20 - 21 ]
[ 22 - 23 ]
[ 24 - 25 ]
[ 26 - 27 ]
yiHi%hi%Fihif i[CLASE)
8/16/2019 Clase 05.- Organización Tabular de Datos.pdf
61/80
Ejemplo:
Revisemos el ejemplo sobre el coeficiente intelectual de
8/16/2019 Clase 05.- Organización Tabular de Datos.pdf
62/80
62
231 199 209 236 259 248 183 269 212 194 191 260 197 265 261
159 227 245 214 275 186 234 262 230 212 163 220 202 221 223
203 180 292 198 201 174 223 186 200 192 236 186 188 234 230
304 197
216 214 189 138 269 197 222 202 213 163 241 218 242
248 228 154 218 243 192 191 243 230 248 231 262 177 207 276
238 189 212 200 179 249 225 223 289 280 235 220 194 205 206 209 233 222 223 267 212 263 159 243 230 253 192 200 232 222
193 195 259 186 229 184 215 254 233 229 263 163 212 271 216
225 252 218 265 218 155 222 173 228 214 266 172 203 262 213
244 177 242 180 241 261 221 222 189 204 229 212 192 257 248
190 166 216 197 250 224 257 220 255 241 245 212 225 201 209
192 249 216 250 248 187 222 195 247 161 188 229 194 174 184
209 250 180 228 196 254 208 265 234 219 203
Revisemos el ejemplo sobre el coeficiente intelectual delos trabajadores presentado anteriormente.
Solución
8/16/2019 Clase 05.- Organización Tabular de Datos.pdf
63/80
63
1. Se calcula el rango: R = Mayor – menor + 1
Mayor = 317 Menor = 106
Rango = (317 – 106) + 1 = 212
2. Se tantea el número de clases:
4 clases de 53 Rango corregido 212: No exceso
5 clases de 43 Rango corregido 215: Exceso 36 clases de 36 Rango corregido 216: Exceso 4
7 clases de 31 Rango corregido 217: Exceso 5
8 clases de 27 Rango corregido 216: Exceso 4
Se escoge 4 clases por tener el menor exceso.
8/16/2019 Clase 05.- Organización Tabular de Datos.pdf
64/80
64
3. La amplitud de clase es 53.
4. Como no hay exceso con 4 clases, el límite inferior
de la primera clase es el menor número. En este
caso 106.
5. Los límites inferiores de las clases siguientes se
forman sumando al límite inferior de la primera
clase, la amplitud. En este caso, 53
8/16/2019 Clase 05.- Organización Tabular de Datos.pdf
65/80
65
NIVELES DE Tasa
COEF.INTEL. PERSONAS porcentual (%)
106 -
159 -
212 -
265 -
Total 1000 100,00
Fuente: Departamento de Estadística
El menorvalor
106 + 53
8/16/2019 Clase 05.- Organización Tabular de Datos.pdf
66/80
66
6. Luego se calculan los límites superiores de cadaclase. Para la primera clase se resta 1 al límiteinferior de la segunda clase. Para las clases
siguientes, se le suma la amplitud, en este caso53.
8/16/2019 Clase 05.- Organización Tabular de Datos.pdf
67/80
67
Cuadro 2: Niveles de coeficiente intelectual en Huancavelica
Fuente: Departamento de Estadística
NIVELES DECIOEF.INTEL porcentual (%)
Total 1000 100,00
106 - 158
159 - 211
212 - 264
265 - 317
159 - 1
158 + 53
Tasa PERSONAS
8/16/2019 Clase 05.- Organización Tabular de Datos.pdf
68/80
68
7.Finalmente se realiza el conteo de lasfrecuencias y se presenta la tabla con un
título y fuente.
Se acostumbra presentar una columna con lafrecuencias relativas (%)
Cuadro 2: Niveles de coeficiente Intelectual en Huancavelica
8/16/2019 Clase 05.- Organización Tabular de Datos.pdf
69/80
69
Fuente: Departamento de Estadística
NIVELES DE Tasa
COEF.INTEL PERSONAS porcentual (%)
Total 1000 100.0
106 - 158 22 2.2
159 - 211 379 37.9
212 - 264 521 52.1
265 - 317 78 7.8
8/16/2019 Clase 05.- Organización Tabular de Datos.pdf
70/80
70
En algunas ocasiones se elaboran las tablas
con clases abiertas cuando los datos inferiores
o superiores están muy dispersos
Ejemplo
8/16/2019 Clase 05.- Organización Tabular de Datos.pdf
71/80
71
Cuadro 3: Ventas diarias en una Ferreteríadurante el mes de junio 2010 (en soles)
Ventas Tasa
(en soles) Dias porcentual
(%)
menos de 5000 3 10,00
5000 - 8999 7 23,33
9000 - 12999 10 33,33
13000 - 16999 8 26,67
17000 - 20999 2 6,67
Total 30 100,00
Fuente: Registro de Ventas
Ejercicio
8/16/2019 Clase 05.- Organización Tabular de Datos.pdf
72/80
72
Los siguientes datos de refieren a la estatura (en metros) de50 trabajadores que laboran en la Municipalidad de
Ascención en el 2012. Construya una tabla de distribución defrecuencias.
1,68 1,72 1,70 1,67 1,76 1,82 1,59 1,66 1,82 1,70
1,66 1,70 1,68 1,65 1,74 1,80 1,57 1,64 1,80 1,681,72 1,74 1,72 1,69 1,78 1,84 1,61 1,69 1,84 1,741,73 1,75 1,75 1,72 1,81 1,87 1,64 1,70 1,86 1,741,75 1,77 1,76 1,72 1,81 1,87 1,64 1,72 1,87 1,77
La tabla de distribución de frecuenciascompleta tiene la siguiente estructura
8/16/2019 Clase 05.- Organización Tabular de Datos.pdf
73/80
73
Li limite inferiorLs limite superiorXi Marca de la clase i
completa, tiene la siguiente estructuraCLASE Marca de Frecuencia Frecuencia Frec. Absoluta Frec. Relativa
Li Ls Clase: Xi absoluta: f i relativa: hi Acumulada: Fi Acumulada: Hi
f i frecuencia absoluta de la clase i.
hi frecuencia relativa de la clase i.Fi frecuencia absoluta acumulada hasta la clasei.Hi frecuencia relativa acumulada hasta la clase i.
Ejercicio 2:Complete la siguiente tabla que corresponde al peso de 60
8/16/2019 Clase 05.- Organización Tabular de Datos.pdf
74/80
74
Complete la siguiente tabla que corresponde al peso de 60
trabajadores de la Obra de la carretera Huancavelica - Huancayo.
PESO f i Fi hi Hi
(en kilos)
[48,0 – 53> 6
[53,0 – 58> 0,30
[58,0 – 63>
[63,0 – 68> 0,25
[68,0 – 73> 9
Total
Ejercicio
8/16/2019 Clase 05.- Organización Tabular de Datos.pdf
75/80
75
La siguiente información se refiere al peso (en Kg.) de 60
personas. Elabore una tabla de distribución de frecuencias.
k=6 LI1=35 LS5=64 F2=20
h3=0,213 H4=0,799 f 6 = 5 f 1=4
j
Complete la siguiente tabla de distribución defrecuencias:
8/16/2019 Clase 05.- Organización Tabular de Datos.pdf
76/80
76000.1 ih
30 f n
frecuencias:
n
f hi
act ant i f f F act ant
i hh H
f ant --> frecuencia anteriorf act --> frecuencia actual
PESO f i
Xi
Fi
hi
Hi (en libras
128,6 - 135,4 2
135,5 - 142,3 7
142,4 - 149,2 10
149,3 - 156,1 8 156,2 - 163,0 3
Total
Resumamos algunos conceptos
8/16/2019 Clase 05.- Organización Tabular de Datos.pdf
77/80
77
Una distribución de frecuencias (f i) es unconjunto de puntuaciones ordenadas en susrespectivas clases.
Las frecuencias relativas (hi) son tasasporcentuales de casos en cada clase.
La frecuencia acumulada (Fi o Hi) son lasfrecuencias que se van acumulando en cada clase,
desde la más baja hasta la mas alta.
La marca de clase (Xi) es el punto medio de unaclase
B)Tablas cruzadas
8/16/2019 Clase 05.- Organización Tabular de Datos.pdf
78/80
78
B)Tablas cruzadas
1. Sirven para representar dos o más variables
cualitativas.
2. En cada celda se puede incluir la frecuencia
absoluta y relativa (por fila, columna y total).
2.- TABLAS DE DOBLE ENTRADA, BIDIMENSIONALES
O DE CONTINGENCIA
8/16/2019 Clase 05.- Organización Tabular de Datos.pdf
79/80
TABLA Nº #
EL TITULO DEBE SER CLARO. DELIMITAR ELESPACIO Y TIEMPO
Variable
1
Variable 2TOTAL
C1 C2 ... CK
C1
C2
..
..
CK
f 11
f 21
f m1
f 12
f 22
f m2
...
...
...
f 1k
f 2k
f mk
f 1.
f 2.
f m.
TOTAL f.1 f.2 ... f.k f
Fuente: debe indicar la procedencia de los datos, espacio
y tiempo
Ejm.Tabla N° 04
P ió d l S ti f ió L b l d l t b j d
8/16/2019 Clase 05.- Organización Tabular de Datos.pdf
80/80
Satisfacción
Laboral
Género
TotalMasculino Femenino
Satisfecho
Poco satisfecho
Insatisfecho
13
9
13
13
11
14
26
20
27
Total 35 38 73
Percepción de la Satisfacción Laboral de los trabajadores en
sus centros de trabajo según género. Junio del 2005
Fuente: Archivo Central del Consorcio de construcción SACHAPITE Junio del 2005