XS-104 Estadística I
description
Transcript of XS-104 Estadística I
XS-104 ESTADÍSTICA I
Yadira María Alvarado Salas
I Cuatrimestre 2014 – UNED
3 era Tutoría
CAPÍTULO 7DISTRIBUCIONES DE FRECUENCIAS
LA NECESIDAD DE RESUMIR LA INFORMACIÓN CUANTITATIVA:LA DISTRIBUCIÓN DE FRECUENCIAS
Las distribuciones de frecuencia son clasificaciones que se refieren a variables cuantitativas (continuas o discretas).
Resulta valioso disponer de elementos descriptivos que den información acerca de 3 aspectos: Forma: la forma o patrón de distribución de los datos. Posición: la posición de la distribución, o sea, alrededor de qué valor se
tienden a concentrar los datos (valores centrales). Dispersión: la dispersión de los datos alrededor de los valores centrales o
promedios (variabilidad).
Esto es fácil cuando el conjunto de interés tiene pocos datos. Cuando los datos son numerosos, se recurre a agruparlos en una
distribución de frecuencias.
Definición: la distribución de frecuencias es una ordenación o arreglo en clases o categorías que muestra, para cada una de ellas, el número de elementos contenidos (frecuencia).
DISTRIBUCIÓN DE FRECUENCIASDE VARIABLES DISCRETAS
3 2 2 3 2 3 0 34 2 6 1 2 5 2 12 2 2 1 3 2 2 11 2 3 2 1 2 3 2
Cantidad de hermanos (pág 314)
Ejemplo: Número de hermanos de
32 alumnos de un colegio rural de San José.
DISTRIBUCIÓN DE FRECUENCIASDE VARIABLES DISCRETAS
3 2 2 3 2 3 0 34 2 6 1 2 5 2 12 2 2 1 3 2 2 11 2 3 2 1 2 3 2
Cantidad de hermanos (pág 314)
Ejemplo: Número de hermanos de
32 alumnos de un colegio rural de San José.
DISTRIBUCIÓN DE FRECUENCIASDE VARIABLES DISCRETAS
3 2 2 3 2 3 0 34 2 6 1 2 5 2 12 2 2 1 3 2 2 11 2 3 2 1 2 3 2
Cantidad de hermanos (pág 314)
Ejemplo: Número de hermanos de
32 alumnos de un colegio rural de San José.
DISTRIBUCIÓN DE FRECUENCIASDE VARIABLES DISCRETAS
3 2 2 3 2 3 0 34 2 6 1 2 5 2 12 2 2 1 3 2 2 11 2 3 2 1 2 3 2
Cantidad de hermanos (pág 314)
Ejemplo: Número de hermanos de
32 alumnos de un colegio rural de San José.
DISTRIBUCIÓN DE FRECUENCIASDE VARIABLES DISCRETAS
3 2 2 3 2 3 0 34 2 6 1 2 5 2 12 2 2 1 3 2 2 11 2 3 2 1 2 3 2
Cantidad de hermanos (pág 314)
Ejemplo: Número de hermanos de
32 alumnos de un colegio rural de San José.
DISTRIBUCIÓN DE FRECUENCIASDE VARIABLES DISCRETAS
0
16
Número de hermanos
Núm
ero d
e al
um
nos
2
4
6
8
10
12
14
0 1 2 3 4 5 6
Bastones Ejemplo: Número de hermanos de
32 alumnos de unaescuela rural
Gráficos
DISTRIBUCIÓN DE FRECUENCIASDE VARIABLES DISCRETAS
0
16
Número de hermanos
Núm
ero d
e al
um
nos
2
4
6
8
10
12
14
0 1 2 3 4 5 6
Bastones
0
16
Núm
ero d
e al
um
nos 14
12
10
8
6
4
2
0 1 2 6Número de hermanos
Barras
3 4 5
Ejemplo: Número de hermanos de
32 alumnos de unaescuela rural
Gráficos
DISTRIBUCIÓN DE FRECUENCIAS DE VARIABLES DISCRETAS
Númerohermanos
f
0 1
1 6
2 15
3 7
4 1
5 1
6 1
TOTAL 32
DISTRIBUCIÓN DE FRECUENCIAS DE VARIABLES DISCRETAS
Númerohermanos
f fr
0 1 0,0313
1 6 0,1875
2 15 0,4688
3 7 0,2188
4 1 0,0313
5 1 0,0313
6 1 0,0313
TOTAL 32 1,0000
DISTRIBUCIÓN DE FRECUENCIAS DE VARIABLES DISCRETAS
Númerohermanos
f fr
Acumulada"Menos de"
AbsolutaF
0 1 0,0313 1
1 6 0,1875 7
2 15 0,4688 22
3 7 0,2188 29
4 1 0,0313 30
5 1 0,0313 31
6 1 0,0313 32
TOTAL 32 1,0000
DISTRIBUCIÓN DE FRECUENCIAS DE VARIABLES DISCRETAS
Númerohermanos
f fr
Acumulada"Menos de"
AbsolutaF
Acumulada"Menos de"
relativaFr
0 1 0,0313 1 0,0313
1 6 0,1875 7 0,2188
2 15 0,4688 22 0,6875
3 7 0,2188 29 0,9063
4 1 0,0313 30 0,9375
5 1 0,0313 31 0,9688
6 1 0,0313 32 1,0000
TOTAL 32 1,0000
DISTRIBUCIÓN DE FRECUENCIAS DE VARIABLES DISCRETAS
Númerohermanos
f fr
Acumulada"Menos de"
AbsolutaF
Acumulada"Menos de"
relativaFr
Acumulada"Más de" Absoluta
F
0 1 0,0313 1 0,0313 32
1 6 0,1875 7 0,2188 31
2 15 0,4688 22 0,6875 25
3 7 0,2188 29 0,9063 10
4 1 0,0313 30 0,9375 3
5 1 0,0313 31 0,9688 2
6 1 0,0313 32 1,0000 1
TOTAL 32 1,0000
DISTRIBUCIÓN DE FRECUENCIAS DE VARIABLES DISCRETAS
Númerohermanos
f fr
Acumulada"Menos de"
AbsolutaF
Acumulada"Menos de"
relativaFr
Acumulada"Más de" Absoluta
F
Acumulada"Más de"relativa
Fr
0 1 0,0313 1 0,0313 32 1,0000
1 6 0,1875 7 0,2188 31 0,9688
2 15 0,4688 22 0,6875 25 0,7813
3 7 0,2188 29 0,9063 10 0,3125
4 1 0,0313 30 0,9375 3 0,0938
5 1 0,0313 31 0,9688 2 0,0625
6 1 0,0313 32 1,0000 1 0,0313
TOTAL 32 1,0000
DISTRIBUCIÓN DE FRECUENCIAS DE VARIABLES DISCRETAS
¿Cómo obtener los datos que faltan en la tabla de
frecuencias?
DISTRIBUCIÓN DE FRECUENCIAS DE VARIABLES DISCRETAS
¿Cómo obtener los datos que faltan en la tabla de
frecuencias?
DISTRIBUCIÓN DE FRECUENCIAS DE VARIABLES DISCRETAS
¿Cómo obtener los datos que faltan en la tabla de
frecuencias?
DISTRIBUCIÓN DE FRECUENCIAS DE VARIABLES DISCRETAS
Los datos en rojo son los que faltaban.
DISTRIBUCIÓN DE FRECUENCIAS DE VARIABLES DISCRETAS
Los datos en rojo son los que faltaban.
DISTRIBUCIÓN DE FRECUENCIAS DE VARIABLES DISCRETAS35
Núm
ero d
e alu
mn
os 30
25
20
15
10
5
5 6Número de hermanos
0
0 1 2 3 4
Ejemplo: Número de hermanos de
32 alumnos de unaescuela rural.
Frecuencias acumuladas discretas “Menos de”.
DISTRIBUCIÓN DE FRECUENCIAS DE VARIABLES DISCRETAS
Núm
ero d
e al
um
nos
10
35
3 4 5 6Número de hermanos
0 1
15
20
25
30
2
5
0
35
Núm
ero d
e alu
mn
os 30
25
20
15
10
5
5 6Número de hermanos
0
0 1 2 3 4
Ejemplo: Número de hermanos de
32 alumnos de unaescuela rural.
Frecuencias acumuladas discretas “Menos de”.
LA MEDICIÓN DE VARIABLES CONTINUAS Y EL PROBLEMA DEL REDONDEO
Teóricamente una variable continua puede ser medida con la exactitud que se quiera.
En la realidad, las variables continuas se expresan redondeadas en cierto tipo de unidades.
Redondeo a la unidad más próxima:
Si el primer dígito de la parte del número a eliminar:
Es menor que 5, el dígito precedente permanece igual. Es mayor que 5, el dígito precedente aumenta una unidad Es exactamente 5, entonces:
Si el dígito precedente es impar, éste aumenta una unidad
Si el dígito precedente es par, éste permanece igual.
LA MEDICIÓN DE VARIABLES CONTINUAS Y EL PROBLEMA DEL REDONDEO
Redondeo hacia abajo
El último dígito que interesa, se conserva. El resto del número se elimina.
Redondeo hacia arriba
El último dígito que se desea conservar, se incrementa en una unida.
Excepto si va seguido únicamente de ceros.
LA MEDICIÓN DE VARIABLES CONTINUAS Y EL PROBLEMA DEL REDONDEO
Redondeo a la unidad más
próxima
Redondeo hacia abajo
Redondeo hacia arriba
24 351
24 500
24 892
25 000
25 001
25 383
25 500
25 776
0,00723
0,00749
0,00750
0,00799
0,00800
0,008010,00850Re
dond
eo a
milé
sim
asRe
dond
eo a
mile
s
Ilustración del redondeo con los tres diferentes métodos
LA MEDICIÓN DE VARIABLES CONTINUAS Y EL PROBLEMA DEL REDONDEO
Redondeo a la unidad más
próxima
Redondeo hacia abajo
Redondeo hacia arriba
24 351 24 24 25
24 500 24 24 25
24 892 25 24 25
25 000 25 25 25
25 001 25 25 26
25 383 25 25 26
25 500 26 25 26
25 776 26 25 26
0,00723 0,007 0,007 0,008
0,00749 0,007 0,007 0,008
0,00750 0,008 0,007 0,008
0,00799 0,080 0,007 0,008
0,00800 0,008 0,008 0,008
0,00801 0,008 0,008 0,0090,00850 0,008 0,008 0,009Re
dond
eo a
milé
sim
asRe
dond
eo a
mile
s
Ilustración del redondeo con los tres diferentes métodos
DISTRIBUCIÓN DE VARIABLES CONTINUAS
63 71 53 66 63 8853 84 70 62 71 7060 67 72 60 52 6775 55 61 52 77 6464 60 56 45 61 6264 57 61 56 68 6555 53 52 73 80 8461 86 87 67 55 7579 57 75 62 62 5668 64 63 60 65 62
Peso en kilogramos de 60 hombres
Peso de 60 estudiantes hombres (en Kg)
DISTRIBUCIÓN DE VARIABLES CONTINUAS
63 71 53 66 63 88 45 56 61 63 67 7553 84 70 62 71 70 52 56 61 64 68 7560 67 72 60 52 67 52 56 61 64 68 7775 55 61 52 77 64 52 57 62 64 70 7964 60 56 45 61 62 53 57 62 64 70 8064 57 61 56 68 65 53 60 62 65 71 8455 53 52 73 80 84 53 60 62 65 71 8461 86 87 67 55 75 55 60 62 66 72 8679 57 75 62 62 56 55 60 63 67 73 8768 64 63 60 65 62 55 61 63 67 75 88
Peso en kilogramos de 60 hombres Peso en kilogramos ordenados
Peso de 60 estudiantes hombres (en Kg)
DISTRIBUCIÓN DE VARIABLES CONTINUAS Amplitud o recorrido: Valor mayor – valor menor
88 – 45 = 43
Cantidad de clases: no menor a 6, ni mayor de 15 43 / 6 = 7,16 43 / 8 = 5,38 43 / 10 = 4,30
Intervalo: preferible de 5, 10 o múltiplos de ellos.
El intervalo más apropiado es de 5 Kg.
La cantidad de clases es de 9.
¿Dónde empieza la primera clase? En 45
DISTRIBUCIÓN DE VARIABLES CONTINUAS
LÍMITES REALES Y LÍMITES INDICADOS, INTERVALO DE CLASE Y PUNTO MEDIO
Límites de clases Son los valores que definen una clase. Las clases deben ser:
Exhaustivas: todas las observaciones quedan clasificadas.
Mutuamente excluyentes: ninguna observación está en más de una clase.
Hay que distinguir entre: Límites indicados: aparecen indicados en la distribución. Límites reales: señalan la verdadera extensión de la
clase. Ejemplo peso de estudiantes (variable continua):
Límites indicados: 45 - 49 50 - 54 55 - 59 etc. Estos límites no señalan la verdadera extensión de la
clase. Límites reales, con redondeo al Kg más próximo:
44,5 - 49,5 49,5 - 54,5 54,5 - 59,5 etc.
LÍMITES REALES Y LÍMITES INDICADOS, INTERVALO DE CLASE Y PUNTO MEDIO
Relación entre límites reales y el criterio de redondeo
LÍMITESINDICADOS
UNIDAD MÁS PRÓXIMA
(Cumpleaños más cercano)
HACIA ABAJO(Edad cumplida)
HACIA ARRIBA(Próximo
cumpleaños)
10 - 14 9,5 - 14,5 De 10 a menos de 15 Más de 9 a 1415 - 19 14,5 - 19,5 De 15 a menos de 20 Más de 14 a 1920 - 24 19,5 - 24,5 De 20 a menos de 25 Más de 19 a 24
LÍMITES REALES Y LÍMITES INDICADOS, INTERVALO DE CLASE Y PUNTO MEDIO
Intervalo de clase
Indica la amplitud de clase. Cálculo: límite real superior - límite real inferior. Usualmente las clases son iguales, por lo que el
intervalo es usualmente uniforme. Se pueden usar clases desiguales, por lo que la
amplitud variaría.
LÍMITES REALES Y LÍMITES INDICADOS, INTERVALO DE CLASE Y PUNTO MEDIO
Punto medio Es el valor central de la clase. Se puede calcular de dos formas:
Promedio de los límites reales: (44,5 + 49,5) / 2 = 47
Límite inferior más la mitad del intervalo de la clase 44,5 + 5 / 2 = 44,5 + 2,5 = 47
Si las clases son de igual amplitud, los puntos medios se obtienen al sumar repetidamente el intervalo al punto medio de la clase anterior: 47 + 5 = 52 …
Función importante: el punto medio representa a la clase en ciertos cálculos.
Al agrupar se pierde información individual. Los errores se compensan y se vuelve despreciable.
LÍMITES REALES Y LÍMITES INDICADOS, INTERVALO DE CLASE Y PUNTO MEDIO
Clases abiertas
Se ubican al principio o al final de la distribución. Resuelven problemas especiales de clasificación. No permiten calcular el punto medio. Es mejor evitar su uso.
FRECUENCIAS ABSOLUTAS Y RELATIVAS, SIMPLES Y ACUMULADAS
Frecuencia absoluta Cantidad de elementos u observaciones
pertenecientes a una misma clase. Frecuencia relativa
Cálculo: frecuencia absoluta / total de observaciones.
Indica la importancia relativa de la clase. Es conveniente presentarla en porcentaje. Facilitan el análisis y las comparaciones.
Frecuencias acumuladas Cantidad de observaciones mayores o menores
que uno de sus límites. Cálculo: suma de frecuencias absolutas o relativas
ascendente o descendente.
FRECUENCIAS ACUMULADAS
44,5 - 49,5
49,5 - 54,5
54,5 - 59,5
59,5 - 64,5
64,5 - 69,5
69,5 - 74,5
74,5 - 79,5
79,5 - 84,5
84,5 - 89,5
TOTAL
CLASES
FRECUENCIAS ACUMULADAS
44,5 - 49,5 47
49,5 - 54,5 52
54,5 - 59,5 57
59,5 - 64,5 62
64,5 - 69,5 67
69,5 - 74,5 72
74,5 - 79,5 77
79,5 - 84,5 82
84,5 - 89,5 87
TOTAL
CLASESPUNTOSMEDIOS
(Xi)
FRECUENCIAS ACUMULADAS
Absoluta(fi)
44,5 - 49,5 47 1
49,5 - 54,5 52 6
54,5 - 59,5 57 8
59,5 - 64,5 62 20
64,5 - 69,5 67 8
69,5 - 74,5 72 6
74,5 - 79,5 77 5
79,5 - 84,5 82 3
84,5 - 89,5 87 3
TOTAL 60
FRECUENCIA
CLASESPUNTOSMEDIOS
(Xi)
FRECUENCIAS ACUMULADAS
Absoluta(fi)
Relativa(fr)
44,5 - 49,5 47 1 0,017
49,5 - 54,5 52 6 0,100
54,5 - 59,5 57 8 0,133
59,5 - 64,5 62 20 0,333
64,5 - 69,5 67 8 0,133
69,5 - 74,5 72 6 0,100
74,5 - 79,5 77 5 0,083
79,5 - 84,5 82 3 0,050
84,5 - 89,5 87 3 0,050
TOTAL 60 1,000
FRECUENCIA
CLASESPUNTOSMEDIOS
(Xi)
FRECUENCIAS ACUMULADAS
Absoluta(fi)
Relativa(fr)
Absoluta
44,5 - 49,5 47 1 0,017 1
49,5 - 54,5 52 6 0,100 7
54,5 - 59,5 57 8 0,133 15
59,5 - 64,5 62 20 0,333 35
64,5 - 69,5 67 8 0,133 43
69,5 - 74,5 72 6 0,100 49
74,5 - 79,5 77 5 0,083 54
79,5 - 84,5 82 3 0,050 57
84,5 - 89,5 87 3 0,050 60
TOTAL 60 1,000
FRECUENCIA
CLASESPUNTOSMEDIOS
(Xi)
ACUMULADA"Menos de"
FRECUENCIAS ACUMULADAS
Absoluta(fi)
Relativa(fr)
Absoluta Relativa
44,5 - 49,5 47 1 0,017 1 0,017
49,5 - 54,5 52 6 0,100 7 0,117
54,5 - 59,5 57 8 0,133 15 0,250
59,5 - 64,5 62 20 0,333 35 0,583
64,5 - 69,5 67 8 0,133 43 0,717
69,5 - 74,5 72 6 0,100 49 0,817
74,5 - 79,5 77 5 0,083 54 0,900
79,5 - 84,5 82 3 0,050 57 0,950
84,5 - 89,5 87 3 0,050 60 1,000
TOTAL 60 1,000
FRECUENCIA
CLASESPUNTOSMEDIOS
(Xi)
ACUMULADA"Menos de"
FRECUENCIAS ACUMULADAS
Absoluta(fi)
Relativa(fr)
Absoluta Relativa Absoluta
44,5 - 49,5 47 1 0,017 1 0,017 60
49,5 - 54,5 52 6 0,100 7 0,117 59
54,5 - 59,5 57 8 0,133 15 0,250 53
59,5 - 64,5 62 20 0,333 35 0,583 45
64,5 - 69,5 67 8 0,133 43 0,717 25
69,5 - 74,5 72 6 0,100 49 0,817 17
74,5 - 79,5 77 5 0,083 54 0,900 11
79,5 - 84,5 82 3 0,050 57 0,950 6
84,5 - 89,5 87 3 0,050 60 1,000 3
TOTAL 60 1,000
FRECUENCIA
CLASESPUNTOSMEDIOS
(Xi)
ACUMULADA"Menos de"
ACUMULADA"Más de"
FRECUENCIAS ACUMULADAS
Absoluta(fi)
Relativa(fr)
Absoluta Relativa Absoluta Relativa
44,5 - 49,5 47 1 0,017 1 0,017 60 1,000
49,5 - 54,5 52 6 0,100 7 0,117 59 0,983
54,5 - 59,5 57 8 0,133 15 0,250 53 0,883
59,5 - 64,5 62 20 0,333 35 0,583 45 0,750
64,5 - 69,5 67 8 0,133 43 0,717 25 0,417
69,5 - 74,5 72 6 0,100 49 0,817 17 0,283
74,5 - 79,5 77 5 0,083 54 0,900 11 0,183
79,5 - 84,5 82 3 0,050 57 0,950 6 0,100
84,5 - 89,5 87 3 0,050 60 1,000 3 0,050
TOTAL 60 1,000
FRECUENCIA
CLASESPUNTOSMEDIOS
(Xi)
ACUMULADA"Menos de"
ACUMULADA"Más de"
FRECUENCIAS ACUMULADAS
Absoluta(fi)
Relativa(fr)
Absoluta Relativa Absoluta Relativa
44,5 - 49,5 47 1 0,017 1 0,017 60 1,000
49,5 - 54,5 52 6 0,100 7 0,117 59 0,983
54,5 - 59,5 57 8 0,133 15 0,250 53 0,883
59,5 - 64,5 62 20 0,333 35 0,583 45 0,750
64,5 - 69,5 67 8 0,133 43 0,717 25 0,417
69,5 - 74,5 72 6 0,100 49 0,817 17 0,283
74,5 - 79,5 77 5 0,083 54 0,900 11 0,183
79,5 - 84,5 82 3 0,050 57 0,950 6 0,100
84,5 - 89,5 87 3 0,050 60 1,000 3 0,050
TOTAL 60 1,000
FRECUENCIA
CLASESPUNTOSMEDIOS
(Xi)
ACUMULADA"Menos de"
ACUMULADA"Más de"
¿Cómo interpretar los datos de la fila resaltada?
FRECUENCIAS ACUMULADAS
Absoluta(fi)
Relativa(fr)
Absoluta Relativa Absoluta Relativa
64,5 - 69,5 67 8 0,133 43 0,717 25 0,417
8 8 estudiantes tienen pesos entre 64,5 y 69,5 Kg.
0,133 Un 13,3% de los estudiantes pesan entre 64,5 y 69,5 Kg.
43 43 estudiantes pesan menos de 69,5 Kg.
0,717 71,7% de los estudiantes pesan menos de 69,5 Kg.
25 25 estudiantes pesan más de 64,5 Kg.
0,417 41,7% de los estudiantes pesan más de 64,5 Kg.
CLASESPUNTOSMEDIOS
(Xi)
FRECUENCIAACUMULADA"Menos de"
ACUMULADA"Más de"
FRECUENCIAS ACUMULADAS
Resumen de algunas reglas básicas: Si las observaciones no son muchas, puede
resultar innecesario construir una distribución de frecuencias y será suficiente ordenar los datos por magnitud creciente.
Las clases deben ser exhaustivas y mutuamente excluyentes.
Debe procurarse, como regla general, que el número de clases no sea menor que 6 ni mayor a 15.
Siempre que sea posible, evite las clases de diferente amplitud y también las clases abiertas.
Si hay errores alrededor de los cuales existen concentraciones de los datos, es recomendable que se tornen como puntos medios.
LA REPRESENTACIÓN GRÁFICA DE LAS DISTRIBUCIONES DE FRECUENCIAS
Histogramas:Gráfico de
barras verticales, cuyas barras no guardan separación entre sí, y pueden tener diferente anchura.
LA REPRESENTACIÓN GRÁFICA DE LAS DISTRIBUCIONES DE FRECUENCIAS
Histogramas:Gráfico de
barras verticales, cuyas barras no guardan separación entre sí, y pueden tener diferente anchura.
0
5
10
15
20
25
Nú
mero
de e
stu
dia
nte
s
PESO
44,5 49,5 54,5 59,5 64,5 69,5 74,5 79,5 84,5 89,5
LA REPRESENTACIÓN GRÁFICA DE LAS DISTRIBUCIONES DE FRECUENCIAS
Polígono de frecuencias La abscisa (eje X) es
el punto medio de la clase.
La ordenada (eje Y) es la frecuencia.
Los puntos se unen y conforman un polígono.
El polígono se prolonga, como si existiera una clase adicional al principio y al final, ambas con frecuencia cero.
0
5
10
15
20
25
47 52 57 62 67 72 77 82 87
Núm
ero
d
eest
udia
nte
s
PESO
LA REPRESENTACIÓN GRÁFICA DE LAS DISTRIBUCIONES DE FRECUENCIAS
Histograma y polígono de frecuencias Existe correspondencia entre las áreas bajo el
polígono y el histograma.
0
5
10
15
20
25
Nú
mero
de e
stu
dia
nte
s
PESO
44,5 49,5 54,5 59,5 64,5 69,5 74,5 79,5 84,5 89,5
LA REPRESENTACIÓN GRÁFICA DE LAS DISTRIBUCIONES DE FRECUENCIAS
Representación de distribuciones con intervalos desiguales Gráfico erróneo:
Clases FrecuenciaIntervalo de clase
44,5 - 54,5 47 7
54,5 - 59,5 57 8
59,5 - 64,5 62 20
64,5 - 69,5 67 8
69,5 - 84,5 72 14
84,5 - 89,5 87 3
0
5
10
15
20
25
Nú
mero
de e
stu
dia
nte
s
PESO
44,5 49,5 54,5 59,5 64,5 69,5 74,5 79,5 84,5 89,5
LA REPRESENTACIÓN GRÁFICA DE LAS DISTRIBUCIONES DE FRECUENCIAS
Representación de distribuciones con intervalos desiguales Gráfico correcto:
Clases FrecuenciaIntervalo de clase
44,5 - 54,5 47 7
54,5 - 59,5 57 8
59,5 - 64,5 62 20
64,5 - 69,5 67 8
69,5 - 84,5 72 14
84,5 - 89,5 87 3
0
5
10
15
20
25
Nú
mero
de e
stu
dia
nte
s
PESO
44,5 49,5 54,5 59,5 64,5 69,5 74,5 79,5 84,5 89,5
LA REPRESENTACIÓN GRÁFICA DE LAS DISTRIBUCIONES DE FRECUENCIAS Las “ojivas” o polígonos de frecuencias
acumuladas Ojiva “Menos de”
LA REPRESENTACIÓN GRÁFICA DE LAS DISTRIBUCIONES DE FRECUENCIAS Las “ojivas” o polígonos de frecuencias
acumuladas Ojiva “Menos de”
0
10
20
30
40
50
60
70
44,5 49,5 54,5 59,5 64,5 69,5 74,5 79,5 84,5 89,5
Nú
mero
de e
stu
dia
nte
s
PESO
LA REPRESENTACIÓN GRÁFICA DE LAS DISTRIBUCIONES DE FRECUENCIAS Las “ojivas” o polígonos de frecuencias
acumuladas Ojiva “Más de”
0
10
20
30
40
50
60
70
44,5 49,5 54,5 59,5 64,5 69,5 74,5 79,5 84,5 89,5
Nú
mero
de e
stu
dia
nte
s
PESO
CAPÍTULO 8MEDIDAS DETENDENCIA CENTRAL
LAS MEDIDAS DE TENDENCIA CENTRAL:IDEAS BÁSICAS
Propósito de las medidas de tendencia central: Resumir, en un solo número, el centro de los datos
o punto central de localización de la distribución
Medidas de tendencia central: Media aritmética o promedio Mediana Moda Media geométrica Media armónica
SÍMBOLO DE SUMATORIA
Sistema de símbolos o notación: X = variable en consideración (peso, ingreso, etc.). Subíndice i = indica el elemento i (valores
positivos). Representa un valor particular. Xi = 55
Ejemplo: Peso de 6 estudiantes: 55, 64, 53, 79, 64, 68
Sumatoria (símbolo sigma)
SÍMBOLO DE SUMATORIA
Propiedades del símbolo de sumatoria.
1. La sumatoria del producto de una constante por una variable es igual al producto de la constante por la sumatoria de la variable.
2. La sumatoria de la suma algebraica de dos o más variables es igual a la suma algebraica de las sumatorias de las variables.
3. La sumatoria de una constante, tomada de 1 a n, es igual a n veces la constante.
MODA, MEDIANA Y MEDIA ARITMÉTICAEN DATOS NO AGRUPADOS
La moda (en datos no agrupados) Valor más frecuente, el que más se repite. Corresponde a la mayor frecuencia. Ventaja: no se ve afectada por valores extremos
(altos o bajos). Limitación: requiere de un número suficiente de
observaciones para manifestarse claramente. Puede no existir, no estar definida, puede no ser
única. Puede haber más de un valor modal. Aplicada a datos cuantitativos y cualitativos.
14, 15, 17, 17, 21, 21, 21, 21, 33, 36, 40
MODA, MEDIANA Y MEDIA ARITMÉTICAEN DATOS NO AGRUPADOS
Centro Comercial% que lo mencionó
Multiplaza de Escazú 25,7 Moda
Mall San Pedro 23,4
Paseo de las Flores, Heredia 15,2
Terramall, Tres Ríos 14,9
Real Cariari, Belén 5,6
Multiplaza del Este 5,0
Mall Internacional, Alajuela 3,2
Otro 7,0
TOTAL 100,0
Centro Comercial de preferencia
Ejemplo con datos relativos
MODA, MEDIANA Y MEDIA ARITMÉTICAEN DATOS NO AGRUPADOS
Mediana (datos no agrupados) Valor central de una serie de datos ordenados. No más de la mitad de los datos son menores que
él, y no más de la mitad, mayores. 50% de los valores son menores o iguales que él y
el otro 50% son mayores o iguales. Datos sin agrupar:
Primero ordenar, luego calcular el valor central. Si el número de datos es par:
Hay dos valores centrales, se debe calcular la media de los dos valores.
Si n es impar, la posición determina el valor. Posición de la Mediana: ( n + 1 ) / 2
MODA, MEDIANA Y MEDIA ARITMÉTICAEN DATOS NO AGRUPADOS
Mediana (datos no agrupados)
Procedimiento de cálculo:
MODA, MEDIANA Y MEDIA ARITMÉTICAEN DATOS NO AGRUPADOS
Mediana (datos no agrupados) Ventajas de la mediana:
Siempre puede calcularse y el valor obtenido está bien definido. No es afectada por valores extremos, como sí lo es la media
aritmética.Propiedad interesante:
La suma de los valores absolutos de las desviaciones de los valores, con respecto a la mediana, es menor que las desviaciones con respecto a cualquier otro valor.
Limitaciones: Es un valor calculado que no siempre coincide con un dato
observado. No siempre puede ser usado en muchos procedimientos
estadísticos.
MODA, MEDIANA Y MEDIA ARITMÉTICAEN DATOS NO AGRUPADOS
Media aritmética (datos no agrupados)
Ejemplo: edades de 12 personas.
20, 20, 22, 20, 30, 25, 25, 18, 20, 18, 22, 36
𝑋ത = 1𝑛 𝑥𝑖 = σ 𝑥𝑖 𝑛𝑖=1𝑛
MODA, MEDIANA Y MEDIA ARITMÉTICAEN DATOS NO AGRUPADOS
Media aritmética ponderada (datos no agrupados)
X son los valores y W son los pesos. Cada valor se multiplica por la ponderación w.
MODA, MEDIANA Y MEDIA ARITMÉTICAEN DATOS NO AGRUPADOS
Media aritmética ponderada (datos no agrupados)
PROPIEDADES DE LA MEDIA ARITMÉTICA
1. Media * # observaciones = suma observaciones
2. La suma de las desviaciones da cero
3. La suma (resta) de una constante en las observaciones, aumenta (disminuye) el promedio en esa constante.
4. La multiplicación (división) de una constante en las observaciones, multiplica (divide) el promedio en esa constante.
CÁLCULO DE LAS MEDIDAS DE POSICIÓN EN DATOS AGRUPADOS
En datos agrupados no es posible aplicar directamente las fórmulas anteriores.
La moda (Mo) (datos agrupados) Es el valor que se repite con más frecuencia Hay que ubicar “la clase modal” (mayor
densidad de frecuencia).
Li = Límite inferior clase modal. d1 = Diferencia entre clase modal y la clase anterior. d2 = Diferencia entre clase modal y la clase posterior. c = Intervalo de clase modal.
CÁLCULO DE LAS MEDIDAS DE POSICIÓN EN DATOS AGRUPADOS
La mediana (Me) (datos agrupados) La ordenada de la Me divide el área bajo la curva en dos
partes iguales.
n = Total de observaciones ó suma de frecuencia absoluta. Li = Límite inferior de la clase mediana (n/2) en frecuencia
acumulada. fi = Frecuencia absoluta de la clase mediana. Fa = Frecuencia acumulada “Menos de” de la clase anterior a
mediana. c = Intervalo de clase mediana.
Ejemplo: suponga una Me = 64,45 Kg. Interpretación:
Un 50% de los alumnos pesa menos de 63,45 Kg y la otra mitad pesa más de ese peso.
CÁLCULO DE LAS MEDIDAS DE POSICIÓN EN DATOS AGRUPADOS
Media aritmética (datos agrupados)
punto medio de la clase i.
fi = frecuencia de la clase i
CÁLCULO DE LAS MEDIDAS DE POSICIÓN EN DATOS AGRUPADOS
Media aritmética, ejemplo:
USO DE LAS MEDIDAS DE TENDENCIA CENTRAL
El propósito de las medidas de tendencia central es caracterizar y representar un conjunto de datos.
Corrientemente las medidas no compiten, sino que se complementan.
Distribución simétrica: moda = mediana = media.
USO DE LAS MEDIDAS DE TENDENCIA CENTRAL
AsimetríaSe debe a la influenciade valores extremos.
Asimetría positiva (hacia la derecha)Valores extremos altos
Asimetría negativa (hacia la izquierda)Valores extremos bajos
LA MEDIA GEOMÉTRICA Y LA MEDIA ARMÓNICA
Media geométrica
Forma correcta de promediar tasas de cambio, índices, tasas de crecimiento, distribuciones logarítmicas (ingresos, salarios, aumento precios).
Limitación: todos los valores deben ser positivos.
Véase ejemplo 10 pág 375.
LA MEDIA GEOMÉTRICA Y LA MEDIA ARMÓNICA
Media armónica
Se usa para promediar velocidades.
LA MEDIA GEOMÉTRICA Y LA MEDIA ARMÓNICA
Relación entre la media aritmética, la geométrica y la armónica
MUCHAS GRACIAS