Medidas de Variación - EDUG531 | Just another WordPress ... · Son medidas que indican cuánto...
-
Upload
doankhuong -
Category
Documents
-
view
217 -
download
0
Transcript of Medidas de Variación - EDUG531 | Just another WordPress ... · Son medidas que indican cuánto...
Medidas de
Variación o
DispersiónDra. Noemí L. Ruiz
© 2007
Derechos de Autor Reservados
Revisada 2010
Objetivos de la lección
Conocer cuáles son las medidas de
variación y cómo se calculan o se
determinan
Conocer el significado o interpretación
de cada una de las medidas
Aplicar las medidas de variación en un
conjunto de datos
Conocer los diagramas de caja y bigotes
y su aplicación
Medidas de Variación o
Dispersión
Son medidas que indican cuánto varía o
cuánto se dispersa un grupo de datos.
Algunas de estas medidas son: rango, rango
intercuartil, desviación intercuartil,
desviación promedio, varianza, desviación
estándar y coeficiente de variación.
Estas medidas miden el grado de dispersión,
desviación, o variación, que tienen las
puntuaciones, entre sí , o en relación al
centro de una distribución.
Medidas de Variación
Ayudan a determinar cuán homogéneo es
un grupo de datos.
Las puntuaciones que están relativamente
juntas tienen una medida de variación más
pequeña.
Las puntuaciones que están más dispersas
tienen una medida de variación más grande.
Menos dispersión significa que el grupo de
datos es más homogéneo.
Más dispersión implica mayor
heterogeneidad.
Medidas de Variación
Los valores en la muestra C son iguales, por
lo tanto, no existe variabilidad entre ellos.
Al calcular cualquier medida que
cuantifique la variabilidad de esta muestra,
el resultado sería igual a cero.
Medidas de VariaciónMuestras Valor 1 Valor 2 Valor 3 Valor 4 Valor 5
Muestra A 5 15 25 25 58
Muestra B 15 16 16 17 19
Muestra C 5 5 5 5 5
Si se comparan los valores de la muestra A
con los de la muestra B se puede observar
que en la Muestra A los valores están más
lejanos unos de otros.
Medidas de VariaciónMuestras Valor 1 Valor 2 Valor 3 Valor 4 Valor 5
Muestra A 5 15 25 25 58
Muestra B 15 16 16 17 19
Muestra C 5 5 5 5 5
Si se fuese a calcular cualquier medida que
cuantifique la variabilidad en cada una de
estas muestras, el resultado sería mayor
para la muestra A que para la muestra B.
En general, mientras mayor es la
variabilidad entre los datos, mayor será la
medida de dispersión
Medidas de VariaciónMuestras Valor 1 Valor 2 Valor 3 Valor 4 Valor 5
Muestra A 5 15 25 25 58
Muestra B 15 16 16 17 19
Muestra C 5 5 5 5 5
Medidas de Variación o
Dispersión
El rango es la medida que indica
cuánto se dispersa un grupo de datos.
Se le conoce también, como: alcance,
amplitud, recorrido, o campo de valores
Es la medida más sencilla pero menos
confiable.
Se determina restando el valor mayor
menos el valor menor.
Rango = (Valor mayor) – (Valor menor)
Rango
Dice cuál
es la
dispersión
total del
grupo de
datos
Aunque la mayoría de las veces se
determina con la fórmula:
Rango = (Valor mayor) – (Valor menor)
Para propósitos del libro de Hinkle se
utilizará la siguiente fórmula que
ajusta la inclusión de ambos
extremos:Rango =[ (Valor mayor) – (Valor menor) ] + 1
Rango
Si el valor mayor es 5 y el menor es 3,
al restar 5 – 3 se obtiene 2.
5 – 3 = 2 indica que hay dos
unidades de diferencia entre estos
valores.
Si se suma 1, (5-3) + 1, tenemos el total
de valores que hay en ese intervalo de
5 a 3.
(5-3) + 1 = 2 + 1 = 3
Hay 3 valores: 5, 4, 3
Rango
Las medianas de ambos grupos es 23,
pero los rangos varían.
El rango del grupo 1 es 27 (37 – 11 +1 = 27)
El rango del grupo 2 es 12 (29 – 18 + 1 = 12)
El grupo 1 es más variado que el grupo 2.
RangoGrupo Valor
1
Valor
2
Valor
3
Valor
4
Valor
5
Valor
6
Valor
7
Grupo 1 11 16 18 23 29 31 37
Grupo 2 18 19 21 23 24 26 29
Se afecta por valores extremos.
Si el último valor del grupo 1
hubiera sido 64 en vez de 37, el
rango se duplacaría.
Se afecta por el tamaño de n, o sea, la
cantidad de sujetos en la muestra.
Los rangos de dos grupos que tienen
diferente número de sujetos (n) no se
pueden comparar.
Limitaciones del Rango
Indica cuánto se dispersan los valores que
están en el centro de un grupo de datos.
Se considera el centro como los valores que
se concentran entre el primer y tercer
cuartil.
El rango intercuartil no es afectado por
valores extremos.
Se determina usando la siguiente fórmula:
Rango Intercuartil= Q3 – Q1
Rango Intercuartil
Dice cuál
es la
dispersión
de los
valores que
están en el
centro
Es la distancia promedio que existe entre
el primer y tercer cuartil.
Esta medida nos dice, en promedio, cuán
amplio o dispersos están los datos que se
concentran en el centro (de Q3 a Q1).
El centro se concentra entre el primer y
tercer cuartil.
La fórmula para hallarlo es: Q3 - Q1
2
Desviación Intercuartil
Representa
el punto
medio del
rango
intercuartil
Es una representación visual simple pero
que brinda gran información sobre la
dispersión de un grupo de datos.
Utiliza la mediana y el rango intercuartil
(Q3 – Q1) para el análisis.
Lo desarrolló el prominente estadístico
llamado Tuckey.
Se puede usar para determinar valores que
representan valores inusuales llamados
“outliers” que requieren consideración
especial.
Diagramas de Caja y Bigotes
Para trazar el diagrama se necesitan 5
números o valores.
Por eso a veces se le conoce como el
análisis de los 5 números.
Estos 5 valores son:
Valor mayor (puntuación máxima)
Q3
Mediana
Q1
Valor menor (puntuación mínima)
Diagramas de Caja y Bigotes
Ejemplo:
Traza el diagrama de caja y bigotes usando los
siguientes valores:
Valor mayor = 69
Q3 = 56.26
Mediana = 49.26
Q1 = 43.36
Valor menor = 24
Diagramas de Caja y Bigotes
20 30 40 50 60 70 80
Son valores inusuales que podrían considerarse
extremos y que requieren consideración especial.
Para determinar estos valores se utiliza el rango
intercuartil: (Q3 – Q1) .
El límite superior razonable de una distribución
está dado por la fórmula:
Límite Superior Razonable (LSR) = Q3 + 1.5 (Q3 – Q1)
El límite inferior razonable de una distribución está
dado por la fórmula:
Límite Inferior Razonable (LIR) = Q1 - 1.5 (Q3 – Q1)
“Outliers”
Si un valor dado cae fuera de estos límites
razonables , el valor se considera un extremo y
habría que considerarlo cuando se tomen
decisiones sobre el grupo.
Determine si los valores a continuación son
razonables:
68 , 75 , 32, 21
“Outliers”
20 30 40 50 60 70 80
LSR LIR
Es la suma de los valores absolutos de las
desviaciones de los valores respecto a la
media aritmética de la muestra.
La fórmula para hallarlo es:
Desviación Media
Representa
el
promedio
de las
desviacio-
nes de
todos los
valores
respecto a
la media
n
xxn
i
i
1Desviación media
Desviación Media
n
xxn
i
i
1
86.2
7
2341163
7
2341163
9 3 3
12 6 6
7 1 1
5 -1 1
2 -4 4
3 -3 3
4 -2 2
Totales = 42 = 0 = 20
ix xxixxi
n
xxn
i
i
1
Se puede usar la desviación media para
comparar la variación de distintas
distribuciones.
Las distribuciones con mayor desviación
media serán las que tengan la variación
mayor.
Sin embargo, la utilidad de esta medida es
limitada debido a que se usa el valor absoluto
como medio para hallarla.
Los análisis estadísticos más avanzados
requieren manejo algebraico más complejo,
como la varianza.
Desviación Media
Es una medida que representa una unidad
cuadrada.
Esta medida promedia los cuadrados de las
desviaciones de los valores respecto a la media
aritmética.
La varianza toma en consideración cada valor de la
muestra.
La fórmula para hallar la varianza de una población
es:
Varianza
2
2 ix
n
La varianza
no se
interpreta
por ser una
unidad
cuadrada
Fórmula 1
es desviación estándar de la población
es media aritmética de la población
La fórmula para hallar la varianza de
una muestra es:
La fórmula anterior es equivalente
también a la siguiente fórmula:
Varianza
2
2
1
ix xs
n
2
2
2
1
i
i
xx
n
sn
Fórmula 2
Fórmula 3
Ver cuando
se usa cada
fórmula
Se usa la fórmula 1 cuando se va a
determinar la varianza de una población.
Se usa la fórmula 2 y fórmula 3 cuando se va
a determinar la varianza de una muestra.
Se usa la fórmula 2 cuando se tiene una
muestra pequeña y la media aritmética es
un número entero, ya que se torna más
compleja y difícil de utilizar cuando hay
muchos valores o cuando la media
representa un valor decimal.
En este caso, se usa mejor la fórmula 3.
Varianza
Más adelante se presentarán ejemplos de
cómo se utilizan estas fórmulas.
El elevar al cuadrado las desviaciones de
las puntuaciones respecto a la media
aritmética, es un método alterno al uso del
valor absoluto para eliminar los signos
negativos antes de sumar las desviaciones.
Cuando se utilizan los cuadrados en vez de
los valores absolutos de las desviaciones
se facilita el manejo algebraico y se elimina
la restricción que tiene la desviación media.
Varianza
Desviación Media
9 3 9 1
12 6 36 16
7 1 1 1
5 -1 1 9
2 -4 16 36
3 -3 9 25
4 -2 4 16
Totales = 42 = 0 = 76 = 104
ix xxi
2
xxi
2
8ix
6x Ejemplo
Es una medida que representa una
unidad lineal.
Se halla extrayendo la raíz cuadrada
de la varianza.
La fórmula para hallar la desviación
estándar es:
Para hallar la desviación estándar de
una población se usa la última fórmula.
Desviación Estándar
2 2 ó s s
Es un
promedio
que mide
cuánto se
desvían
todos los
datos en
relación a
la media
aritmética
Cuando los datos están agrupados se
utiliza la siguiente fórmula:
Varianza y Desviación Estándar
para datos agrupados
Fórmula 4
2
2
1
1
2
2
1
ss
n
n
fx
fx
s
n
i
iin
i
ii
Ver las columnas que se necesitarían
añadir en una tabla de distribución de
frecuencias para poder aplicar la fórmula 4.
Varianza y Desviación Estándar
para datos agrupados
2
2
1
1
2
2
1
ss
n
n
fx
fx
s
n
i
iin
i
ii
Representa una medida relativa (por ciento)
que permite comparar grupos distintos.
Relaciona la desviación estándar con la
media aritmética.
Nos dice cuál es el por ciento de variación de
un grupo respecto a la media aritmética.
La fórmula es:
desviación estándar
media aritmética
Coeficiente de Variación
x
s
Ejemplos para aplicar
las fórmulas
Halla el rango, varianza y desviación
estándar usando fórmula 2.
Rango = 10-6 = 4
Ejemplo 1: Datos Crudos
Segundos de reacción antes de consumir un
gramo de droga THC
X (segundos) (x – ) (x - )2
10 10-8= 2 4
10 10-8 = 2 4
10 10-8 = 2 4
9 9-8 = 1 1
9 9-8 = 1 1
8 8- 8 = 0 0
7 7 – 8 = -1 1
7 7 – 8 = -1 1
6 6 - 8 = -2 4
6 6 – 8 = -2 4
6 6 – 8 = -2 4
88 28
x x
888
11x
2
2
2
2
1
28
11 1
282.8
10
2.8 1.67
ix xs
n
s
s
s x
El mismo ejercicio anterior pero
usando la fórmula 3 para calcular s.
Ejemplo 2: Datos Crudos
Segundos de reacción antes de
consumir un gramo de droa THC
X (segundos) x2
10 100
10 100
10 100
9 81
9 81
8 64
7 49
7 49
6 36
6 36
6 36
88 732
2
2
2
2
2
2
1
88 7744732 732
11 11
10 10
732 704 282.8
10 10
2.8 1.67
i
i
xx
n
sn
s
s
s x
Halla la desviación intercuartil
Q3 = 3(n+1) = 36 = 9 ó 9na posición
4 4
Q3 = 10
Q1 = n+1 = 12 = 3 ó 3era pos.
4 4
Q1 = 6
= = 2
Interpreta este resultado
Ejemplo 3
Segundos de reacción antes de
consumir un gramo de droa THC
X (segundos) x2
10 100
10 100
10 100
9 81
9 81
8 64
7 49
7 49
6 36
6 36
6 36
Q3 - Q1
2
Q3 - Q1
2
10 - 6
2
DI =
Halla el coeficiente de variación
Coeficiente de Variación =
Desviación estándar =
Media aritmética
Interpreta este
resultado
Ejemplo 4
Segundos de reacción antes de
consumir un gramo de droa THC
X (segundos) x2
10 100
10 100
10 100
9 81
9 81
8 64
7 49
7 49
6 36
6 36
6 36
1.67 = 0.20875 = 0.21=21%
8
x
s
Halla la varianza y desviación estándar del grupo de
datos a continuación (Completar Tabla)
Ejemplo 5: Datos en Clases
Resultados de examen de estadística
Clases f x x . f x2 . f
35-41 1 38 38 1444
42-48 2 45 90 4050
49-55 2 52 104 5408
56-62 3 59 177 10443
63-69 7 66 462 30492
70-76 11 73 803 58619
77-83 9 80 720 57600
84-90 8 87 696 60552
91-97 6 94 564 53016
98-104 1 101 101 10201
50 3755 291825
Ver qué
columnas
se
necesitan
x, xf, x2f
Halla la varianza y desviación estándar del grupo de
datos a continuación (Clic para ver proceso)
Ejemplo 5: Datos en Clases
Resultados de examen de estadística
Clases f x x . f x2 . f
35-41 1 38 38 1444
42-48 2 45 90 4050
49-55 2 52 104 5408
56-62 3 59 177 10443
63-69 7 66 462 30492
70-76 11 73 803 58619
77-83 9 80 720 57600
84-90 8 87 696 60552
91-97 6 94 564 53016
98-104 1 101 101 10201
50 3755 291825
Continuación Ejemplo 52
2
2
2
2
2
( )
( 1)
(3755) 14,100,025291,825 291,825
50 50
49 49
291,825 282,000.5 9824.5200.5
49 49
200.5 14.16
x fx f
nsn
s
s
s
Fin de la Lección