UNIDAD IIIMEDIDAS DE DISPERSIÓN
“Medidas de dispersión”
Miden qué tanto se dispersan las observaciones alrededor de su media.
MEDIDAS DE DISPERSIÓN
En algunos casos existen conjuntos de datos que tienen la misma media y la misma mediana, pero esto no refleja qué tan dispersos están los elementos de cada conjunto.
Ejemplo:
Conjunto 1. 80, 90, 100, 110, 120Conjunto 2. 0, 50, 100, 150, 200
MEDIDAS DE DISPERSIÓN
1005
1201101009080 Media
1005
200150100500 Media
Conjunto 1
Conjunto 2
Observa que para ambos conjuntos la Mediana es igual a 100. También nota que los datos del conjunto 2 están más dispersos con respecto a su media que los datos del conjunto 1.
Existen diversas medidas estadísticas de dispersión, pero muchos autores coinciden en que las principales son:
Rango
Varianza
Desviación estándar
Coeficiente de variación
MEDIDAS DE DISPERSIÓN
Mide la amplitud de los valores de la muestra y se calcula por diferencia entre el valor más elevado (Límite superior) y el valor más bajo (Límite inferior).
RANGO
FÓRMULA
Ejemplo 1.
Ante la pregunta sobre número de hijos por familia, una muestra de 12 hogares, marcó las siguientes respuestas:
2 1 2 4 1 32 3 2 0 5 1
Calcula el rango de la variable
Solución.
MAX MINRango X X
5 0 5Rango
Ejemplo 2.
Hay dos conjuntos sobre la cantidad de lluvia (mm) en Taipei y Seúl en un año.
Calcula el rango en cada una de las ciudades.
Solución.
Aplicando la fórmula correspondiente tenemos:
Taipei
Seúl
305 66 239Rango mm mm mm
Ene Feb Mar Abr May Jun Jul Ago Sep Oct Nov DicTaipei 86 135 178 170 231 290 231 305 244 122 66 71Seúl 40 77 83 89 147 168 184 252 209 101 32 13
252 13 239Rango mm mm mm
En este caso se puede observar que el rango es el mismo para ambos casos aunque las cantidades sean diferentes.
050
100150200250300350
Can
tid
ad
de llu
via
(m
m)
Mes
Cantidad de lluvia en Taipei y Seúl 1998
Taipei
Seoul
Mide la distancia existente entre los valores de la serie y la media. Se calcula como sumatoria de las diferencias al cuadrado entre cada valor y la media, multiplicadas por el número de veces que se ha repetido cada valor. La sumatoria obtenida se divide por el tamaño de la muestra.
VARIANZA (Datos no agrupados)
FÓRMULA2
2 1
( )
1
n
ii
x xs
n
Muestral
Poblacional
2
2 1
( )N
i xi
x
N
La varianza siempre será mayor que cero. Mientras más se aproxima a cero, más concentrados están los valores de la serie alrededor de la media. Por el contrario, mientras mayor sea la varianza, más dispersos están.
Ejemplo 1.
Calcula la varianza para los siguientes datos
2 1 2 4 1 3 2 3 2 0 5 1
Solución.
Primero es necesario obtener la media. En este caso
Ahora aplicamos la fórmula correspondiente
2.16x
2 2 2 2 2 2 2 2 2 2 2 22 (2 2.16) (1 2.16) (2 2.16) (4 2.16) (1 2.16) (3 2.16) (2 2.16) (3 2.16) (2 2.16) (0 2.16) (5 2.16) (1 2.16)
12 1s
2 21.66721.9697
11s
Ejemplo 2.
A continuación se muestran dos conjuntos de datos obtenidos a partir de un experimento químico que realizaron dos estudiantes distintos. Calcular la varianza.
Solución.
Primero es necesario obtener la media de cada conjunto de datos. En este caso
Estudiante A
Estudiante B
Ahora aplicamos la fórmula correspondiente
Volumen de ácido medido (cm 3̂)Estudiante A 8 12 7 9 3 10 12 11 12 14Estudiante B 7 6 7 15 12 11 9 9 13 11
8.910
1412111210397128 x
1010
111399111215767 x
Solución (Continuación).
Estudiante A
Estudiante B
2 2 2 2 2 2 2 2 2 22 (8 9.8) (12 9.8) (7 9.8) (9 9.8) (3 9.8) (10 9.8) (12 9.8) (11 9.8) (12 9.8) (14 9.8)
10 1s
2 2 2 2 2 2 2 2 2 22 (7 10) (6 10) (7 10) (15 10) (12 10) (11 10) (9 10) (9 10) (13 10) (11 10)
10 1s
2 91.69.16
10s
2 767.6
10s
También llamada desviación típica, es una medida de dispersión usada en estadística que nos dice cuánto tienden a alejarse los valores puntuales del promedio en una distribución.
Específicamente, la desviación estándar es "el promedio de la distancia de cada punto respecto del promedio". Se suele representar por una S o con la letra sigma,σ, según se calcule en una muestra o en la población.
Una desviación estándar grande indica que los puntos están lejos de la media, y una desviación pequeña indica que los datos están agrupados cerca de la media.
DESVIACIÓN ESTÁNDAR (Datos no agrupados)
FÓRMULA2
1
( )
1
n
ii
x xs
n
N
xN
ixi
1
2)(
Muestral
Poblacional
Ejemplo 1.
Si retomamos el ejemplo 1 que corresponde a la varianza:
Calcula la desviación estándar para los siguientes datos
2 1 2 4 1 3 2 3 2 0 5 1
Solución.
Una vez que hemos calculado la media y la varianza, sólo resta calcular la raíz cuadrada de la varianza.
2.16x
2 21.66721.9697
11s
1.40341.9697S
Ejemplo 2.
Considerando nuevamente el segundo ejemplo que estudiaste para calcular la varianza, tenemos:
A continuación se muestran dos conjuntos de datos obtenidos a partir de un experimento químico que realizaron dos estudiantes distintos. Calcular la varianza.
Solución.
Una vez que has calculado la media y la varianza, es necesario calcular la desviación estándar a partir de la obtención de la raíz cuadrada de la varianza.
Estudiante A
Estudiante B
Volumen de ácido medido (cm 3̂)Estudiante A 8 12 7 9 3 10 12 11 12 14Estudiante B 7 6 7 15 12 11 9 9 13 11
2 91.69.16
10s
2 767.6
10s
026.316.9S
756.26.7S
Es una medida de dispersión que se utiliza para poder comparar las desviaciones estándar de poblaciones con diferentes medias y se calcula como cociente entre la desviación típica y la media.
COEFICIENTE DE VARIACIÓN
FÓRMULA
100%S
CVx
Muestral
Poblacional
100%CV
Ejemplo 1.
En dos cursos los promedios que sacaron sus alumnos fueron 6.1 y 4.3 y las desviaciones estándar respectivas fueron 0.6 y 0.45 respectivamente. ¿En qué curso hay mayor dispersión?
Solución
Para responder esto, debemos obtener el coeficiente de variación aplicando la fórmula
Claramente, el curso A tiene una dispersión menor que el B, pese a presentar una mayor desviación estándar.
%8.9%)100(1.66.0 ACV
%4.10%)100(3.445.0 BCV
100%S
CVx
Cuando los datos están agrupados en tablas de frecuencias, el significado de las medidas de dispersión es el mismo, sin embargo la manera de calcularlas es diferente.
Enseguida se muestra la fórmula para la varianza, pero recuerda que la desviación estándar es igual a la raíz cuadrada de la primera.
VARIANZA Y DESVIACIÓN ESTÁNDAR (Datos agrupados)
FÓRMULA
11
)(1
2
12
1
2
2
nn
fx
xf
n
xxfs
k
i
k
iii
ii
k
iii
21
2
1
2
2)(
N
xf
N
xfk
iii
k
iii
Muestral
Poblacional
Ejemplo 1.
Se han registrado durante 20 días, el número de viajeros que hacen reservaciones a una agencia de viajes pero que no las hacen efectivas:
Calcula las medidas de dispersión de la variable en estudio. Interpreta
iNúmero de viajeros
(xi )Frecuencia
(fi)
1 12 3
2 13 3
3 14 6
4 15 3
5 16 5
Total 70 20
Solución.
Tal como lo indica la fórmula, primero es necesario multiplicar la variable (xi ) por la frecuencia (fi) y añadirlo como una columna a la tabla.
iNúmero de viajeros
(xi )Frecuencia
(fi)xi fi
1 12 3 36
2 13 3 39
3 14 6 84
4 15 3 45
5 16 5 80
Total 70 20 284
......
...1
2
1
2
k
i
k
iii fx
s
Solución (Continuación).
Después se obtiene el cuadrado de la variable x, o sea, (x i )2.
iNúmero de viajeros
(xi )
Frecuencia
(fi)xi fi xi
2
1 12 3 36 144
2 13 3 39 169
3 14 6 84 196
4 15 3 45 225
5 16 5 80 256
Total 70 20 284 990
...
......1
2
2
k
iix
s
Solución (Continuación).
Ahora se multiplica el cuadrado de la variable por la frecuencia, es decir, (fixi
2).
iNúmero de
viajeros(xi )
Frecuencia (fi)
xi fi xi2
fixi2
1 12 3 36 144 432
2 13 3 39 169 507
3 14 6 84 196 1176
4 15 3 45 225 675
5 16 5 80 256 1280
Total 70 20 284 990 4070
.........
1
2
2
k
iiixf
s
Solución (Continuación).
Una vez obtenidos todos los datos anteriores, se procede a aplicar la fórmula
iNúmero de
viajeros(xi )
Frecuencia (fi)
xi fi xi2
fixi2
1 12 3 36 144 432
2 13 3 39 169 507
3 14 6 84 196 1176
4 15 3 45 225 675
5 16 5 80 256 1280
Total 70 20 284 990 4070
11
2
12
2
nn
fx
xfs
k
i
k
iii
ii
Solución (Continuación).
iNúmero de
viajeros(xi )
Frecuencia (fi)
xi fi xi2
fixi2
1 12 3 36 144 432
2 13 3 39 169 507
3 14 6 84 196 1176
4 15 3 45 225 675
5 16 5 80 256 1280
Total 70 20 284 990 4070
3992.19579.1
9579.11920284
40702
2
s
s
Ejemplo 2.
De acuerdo a la siguiente tabla, calcula la varianza y la desviación estándar:NOTA
xFREC. ABSOLUTA
fFREC. ABSOLUTA
ACUMULADA FREC. RELATIVA %
FREC RELATIVA ACUMULADA %
1.2 1 1 0.1 0.11.4 2 3 0.2 0.31.6 3 6 0.3 0.61.8 8 14 0.8 1.42.0 14 28 1.4 2.82.2 18 46 1.8 4.62.4 19 65 1.9 6.52.6 22 87 2.2 8.72.8 25 112 2.5 11.23.0 26 138 2.6 13.83.2 27 165 2.7 16.53.4 31 196 3.1 19.63.6 35 231 3.5 23.13.8 38 269 3.8 26.94.0 45 314 4.5 31.44.2 46 360 4.6 36.04.4 48 408 4.8 40.84.6 52 460 5.2 46.04.8 58 518 5.8 51.85.0 60 578 6.0 57.85.2 56 634 5.6 63.45.4 54 688 5.4 68.85.6 51 739 5.1 73.95.8 50 789 5.0 78.96.0 46 835 4.6 83.56.2 44 879 4.4 87.96.4 40 919 4.0 91.96.6 32 951 3.2 95.16.8 31 982 3.1 98.27.0 18 1000 1.8 100
TOTAL 1000 4717 23970.12
Solución.
El primer paso es calcular xi fi:NOTA
xFREC. ABSOLUTA
fFREC. ABSOLUTA
ACUMULADA FREC. RELATIVA %
FREC RELATIVA ACUMULADA % xi fi
1.2 1 1 0.1 0.1 1.21.4 2 3 0.2 0.3 2.81.6 3 6 0.3 0.6 4.81.8 8 14 0.8 1.4 14.42.0 14 28 1.4 2.8 282.2 18 46 1.8 4.6 39.62.4 19 65 1.9 6.5 45.62.6 22 87 2.2 8.7 57.22.8 25 112 2.5 11.2 703.0 26 138 2.6 13.8 783.2 27 165 2.7 16.5 86.43.4 31 196 3.1 19.6 105.43.6 35 231 3.5 23.1 1263.8 38 269 3.8 26.9 144.44.0 45 314 4.5 31.4 1804.2 46 360 4.6 36.0 193.24.4 48 408 4.8 40.8 211.24.6 52 460 5.2 46.0 239.24.8 58 518 5.8 51.8 278.45.0 60 578 6.0 57.8 3005.2 56 634 5.6 63.4 291.25.4 54 688 5.4 68.8 291.65.6 51 739 5.1 73.9 285.65.8 50 789 5.0 78.9 2906.0 46 835 4.6 83.5 2766.2 44 879 4.4 87.9 272.86.4 40 919 4.0 91.9 2566.6 32 951 3.2 95.1 211.26.8 31 982 3.1 98.2 210.87.0 18 1000 1.8 100 126
TOTAL 1000 4717 23970.12
Solución (Continuación).
Después se obtiene el cuadrado de la variable x, o sea, (x i )2.NOTA
xFREC. ABSOLUTA
fFREC. ABSOLUTA
ACUMULADA FREC. RELATIVA %
FREC RELATIVA ACUMULADA % xi fi xi
2
1.2 1 1 0.1 0.1 1.2 1.441.4 2 3 0.2 0.3 2.8 1.961.6 3 6 0.3 0.6 4.8 2.561.8 8 14 0.8 1.4 14.4 3.242.0 14 28 1.4 2.8 28 42.2 18 46 1.8 4.6 39.6 4.842.4 19 65 1.9 6.5 45.6 5.762.6 22 87 2.2 8.7 57.2 6.762.8 25 112 2.5 11.2 70 7.843.0 26 138 2.6 13.8 78 93.2 27 165 2.7 16.5 86.4 10.243.4 31 196 3.1 19.6 105.4 11.563.6 35 231 3.5 23.1 126 12.963.8 38 269 3.8 26.9 144.4 14.444.0 45 314 4.5 31.4 180 164.2 46 360 4.6 36.0 193.2 17.644.4 48 408 4.8 40.8 211.2 19.364.6 52 460 5.2 46.0 239.2 21.164.8 58 518 5.8 51.8 278.4 23.045.0 60 578 6.0 57.8 300 255.2 56 634 5.6 63.4 291.2 27.045.4 54 688 5.4 68.8 291.6 29.165.6 51 739 5.1 73.9 285.6 31.365.8 50 789 5.0 78.9 290 33.646.0 46 835 4.6 83.5 276 366.2 44 879 4.4 87.9 272.8 38.446.4 40 919 4.0 91.9 256 40.966.6 32 951 3.2 95.1 211.2 43.566.8 31 982 3.1 98.2 210.8 46.247.0 18 1000 1.8 100 126 49
TOTAL 1000 4717 23970.12
Solución (Continuación).
Ahora se multiplica el cuadrado de la variable por la frecuencia, es decir, (f ixi2).
NOTA x
FREC. ABSOLUTA f
FREC. ABSOLUTA ACUMULADA
FREC. RELATIVA %
FREC RELATIVA ACUMULADA % xi fi xi
2 fixi2
1.2 1 1 0.1 0.1 1.2 1.44 1.441.4 2 3 0.2 0.3 2.8 1.96 3.921.6 3 6 0.3 0.6 4.8 2.56 7.681.8 8 14 0.8 1.4 14.4 3.24 25.922.0 14 28 1.4 2.8 28 4 562.2 18 46 1.8 4.6 39.6 4.84 87.122.4 19 65 1.9 6.5 45.6 5.76 109.442.6 22 87 2.2 8.7 57.2 6.76 148.722.8 25 112 2.5 11.2 70 7.84 1963.0 26 138 2.6 13.8 78 9 2343.2 27 165 2.7 16.5 86.4 10.24 276.483.4 31 196 3.1 19.6 105.4 11.56 358.363.6 35 231 3.5 23.1 126 12.96 453.63.8 38 269 3.8 26.9 144.4 14.44 548.724.0 45 314 4.5 31.4 180 16 7204.2 46 360 4.6 36.0 193.2 17.64 811.444.4 48 408 4.8 40.8 211.2 19.36 929.284.6 52 460 5.2 46.0 239.2 21.16 1100.324.8 58 518 5.8 51.8 278.4 23.04 1336.325.0 60 578 6.0 57.8 300 25 15005.2 56 634 5.6 63.4 291.2 27.04 1514.245.4 54 688 5.4 68.8 291.6 29.16 1574.645.6 51 739 5.1 73.9 285.6 31.36 1599.365.8 50 789 5.0 78.9 290 33.64 16826.0 46 835 4.6 83.5 276 36 16566.2 44 879 4.4 87.9 272.8 38.44 1691.366.4 40 919 4.0 91.9 256 40.96 1638.46.6 32 951 3.2 95.1 211.2 43.56 1393.926.8 31 982 3.1 98.2 210.8 46.24 1433.447.0 18 1000 1.8 100 126 49 882
TOTAL 1000 4717 23970.12 4717 23970.12
Solución (Continuación).
Una vez obtenidos todos los datos anteriores, se procede a aplicar la fórmula
11
2
12
2
nn
fx
xfs
k
i
k
iii
ii
7217.11100010004717
12.239702
2
s
3121.17217.1 s
Varianza
Desviación estándar
Fuentes de información• http://medicina.unimayab.edu.mx/propedeutico/2009/semana1/chpt04.ppt.• http://beta.upc.edu.pe/matematica/mbcc/paginas/recursos/semana14/Clase01_Sema
na14.ppt• http://www.demre.cl/text/doc_tecnicos/p2009/estadistica_descriptiva.pdf• http://www.cgonzalez.cl/archivos/estadistica2.ppt.• http://repositorio.utpl.edu.ec/bitstream/123456789/3013/1/estadisticasegundobimestr
e-090305174953-phpapp02.ppt.
• netdrive.puiying.edu.hk/~ms/f7it/MATHS.PPT
Créditos
Título : Medidas de dispersión
Colaborador: M. en C. Mario Arturo Vilchis Rodríguez
Nombre de la Asignatura: Estadística aplicada a la mercadotecnia
Programa Académico Lic. Mercadotecnia