Dr. Mayhuasca Salgado RonaldDocente
Medidas de
dispersión
ESTADÍSTICA2016-I
FACULTAD DE CIENCIAS DE LA SALUD – ESCUELA ACADÉMICO PROFESIONAL DE MEDICINA VETERINARIA
Estadística Descriptiva
• Organización de datos• Representación de datos: Tablas y Gráficos
• Medidas de resumen• Medición de datos numéricos
1. Medidas de posición2. Medidas de dispersión3. Medidas de forma
• Medición de datos nominales1. Proporción2. Razón3. Medición epidemiológica
Grado de variabilidad con que se separan o agrupan los valores de la distribución
MEDIDAS DE DISPERSIÓN
Rango: (recorrido, amplitud) es la diferencia entre los valores máximo y mínimo
Desviación media: promedia los valores absolutos de las desviaciones de la media.
Varianza 𝑺𝟐: promedia los cuadrados de las desviaciones la media. Su unidad está
elevada al cuadrado.
Desviación típica o estándar S: raíz cuadrada de la varianza . Se expresa en las
mismas unidades que la media.
Coeficiente de variación de Pearson: Es la medida de dispersión de elección a la
hora de comparar medidas diferentes.
Son medidas que cuantifican la variabilidad de las observaciones con respecto a
un estadígrafo de tendencia central (generalmente la media aritmética).
Los principales estadígrafos de tendencia central son:
• VARIANZA
• DISPERSIÓN ESTÁNDAR
• COEFICIENTE DE VARIACIÓN
MEDIDAS DE DISPERSIÓN
Describen cuán agrupados o dispersos se hallan los datos de la muestra en torno a los
valores centrales, siendo una expresión de la fluctuación del fenómeno estudiado.
MEDIDAS DE DISPERSIÓN
Varianza ( S2) y Desviación estándar (S o DE)
• Nos informan sobre la magnitud de la variación en los datos , la magnitud con la cual las observaciones se agrupan en torno a las medidas
• Sólo se aplica a variables cuantitativas (medidas en escala de razón)
• Nos indica cuánto varía cada individuo respecto a la media
• Sólo calculables en variables cuantitativas.
• Son de las que más se usan y las que mejor expresan la variabilidaddel fenómeno estudiado.
• Si no se usa la media por NO ser un valor representativo(distribuciones sesgadas), se recomienda no usar la varianza ni ladesviación estándar
Varianza ( S2) y Desviación estándar (S o DE)
Varianza ( S2)
• Se define como el promedio del cuadrado de las desviaciones con
respecto la media.
• Cuando la varianza es muestral, se denota como S2(x); y si la
varianza es poblacional entonces se denota como σ2.
• Estudiaremos la varianza muestral.
1. Para datos no agrupados en tablas.
Obedece a la siguiente fórmula:
S2(X)=n-1
Desarrollando esta sumatoria se puede llegar
a una forma más simple para calcular la
varianza: S2(X)=n-1
Cálculo de la Varianza
2. Para datos agrupados en tablas.
Obedece a la siguiente fórmula:
S2(X)=n-1
De modo semejante al caso anterior,
desarrollando la fórmula se obtiene:
S2(X)=n-1
• Xi: marca de clase
• fi: frecuencia absoluta
• m: número de clases o intervalos
Cálculo de la Varianza
Se define como la raíz cuadrada positiva de la varianza, y como la
varianza está expresada en unidades cuadradas, la desviación
estándar (que está en las mismas unidades de los datos) representa
mejor la variabilidad de las observaciones.
Desviación estándar (S o DE)
𝑆 𝑥 = 𝑆2(𝑥)
• La desviación típica muestral se representa por S. En Medicina clínica se
representa por DE (desviación estándar) y en las revistas inglesas pos SD
(standard deviation)
• Para poder interpretar, con la misma desviación típica, distancias por encima
como por debajo de la media, se requiere que la distribución sea simétrica.
Desviación estándar (S o DE)
• Si la distribución es asimétrica , la desviación típica no puede representar
simultáneamente los desvíos superiores e inferiores, entonces se recurre a
los cuartiles
• Para valorar la dispersión en escala ordinal es muy útil la diferencia entre el
1er y 3er cuartil, conocida como distancia intercuartil (RIQ)
Desviación estándar (S o DE)
“Un cálculo mental aproximado de la desviación típica, en una variable
con distribución simétrica, consiste en dividir entre 2 la distancia entre
el valor más alto (o el más bajo) y la media.”
Desviación estándar (S o DE)
El personal de salud de cierto hospital camina a una velocidad media de
3km/h, siendo los extremos de velocidad 2 y 4 km/h aproximadamente. ¿Qué
valor cree que puede tener la desviación típica?
Ejemplo:
Cobo E, Muñoz P, Gonzales JA. Estadística para no estadísticos. Bases para interpretar artículos científicos. Barcelona: Elsevier; 2007.
Ejemplo: Determine la S y la S2 de: 5 8 8 5 9
Varianza ( S2) y Desviación estándar (S o DE)
𝑆 𝑥 = 𝑆2(𝑥)
S2(X)=n-1
Media: 7
: 3.5
: 1.87
Interpretación:
Existe una variación de 1,87unidades de cada individuo respectoa la media aritmética.
1. Suponga que se ha medido la presión arterial sistólica a 5 pacientes:
115, 117, 124, 135 y 142 mmHg. Sin hacer el cálculo, diga qué valor
aproximado le parece correcto para la media:
1. 115 mmHg
2. 125 mmHg
3. 135 mmHg
MIR 15
2. Suponga ahora que el resultado observado en los 5 pacientes ha sido
106, 117, 124, 135 y 142 mmHg, con una media de 130 mmHg. Sin hacer
el cálculo, diga que valor aproximado le parece correcto para la
desviación típica:
1. 5 mmHg
2. 20 mmHg
3. 35 mmHg
MIR 15
Coeficiente de variación (C.V.)
Es un valor adimensional, que se usa en la comparación de la variabilidad de
distribuciones que usen distintas unidades de medidas.
Coeficiente de variación (C.V.)
Se calcula del siguiente modo:
El C.V. se debe expresar en porcentaje, pues no tiene unidades y sirve como medida
de comparación con otras distribuciones de cualquier tipo de unidad…el C.V. mide
cuán dispersos se hallan los datos.
C.V. < 10% : representa una muestra que tiende a ser homogénea, los datos o
mediciones no son dispersos. Se puede usar la media y la D.E.
10%< C.V. < 20% : presentan una regular o moderada dispersión.
C.V. > 20% : los datos se muestran muy dispersos. Usaremos la mediana y el RIQ
𝑪. 𝑽.=𝑺 (𝒙)
𝑿
EJEMPLO:
Rpta: La primera muestra es más homogénea y la dispersión
es mínima.
Coeficiente de variación (C.V.)
𝑪. 𝑽. =𝑺 (𝒙)
𝑿
Coeficiente de variación (C.V.)
• Proporciona los elementos para comparar la variabilidad en distintos conjuntos de datos
que pueden tener distintas medias
• Indica el porcentaje de datos que están alejados de la media aritmética
• Una desviación estándar de 500 en una distribución con una media de 5000, sugiere una
variabilidad mayor que una desviación de 50 en una distribución de media 5000
• Generalmente se expresa en porcentaje
𝑪. 𝑽.=𝑺 (𝒙)
𝑿x 100%
Los siguientes datos corresponden a 20 lecturas de temperatura (en °F) tomadas en
varios puntos de una esterilizadora de calor seco.
415 460 510 475 430 410 425 490 500 470
450 425 485 470 450 455 460 480 475 465
Determine el coeficiente de variación e interprete.
Rpta: 6,07% .
Interpretación: El 6,07% de los datos se hallan alejados de la media. Los
datos son poco dispersos.
Resuelva
En una muestra de 360 personas el nivel medio de glucemia es 5mmol/L y
la desviación estándar es 0.5 ¿cuál es el coeficiente de variación?
1. 10%
2. 25%
3. 12,5%
4. 5%
5. 2,5%
MIR 93
Para comparar la variabilidad relativa de la tensión arterial diastólica de
una serie de individuos y la de su edad, tenemos:
1. Las desviaciones estándar
2. Los coeficientes de variación
3. Los rangos (recorrido)
4. Las varianzas
5. Las desviaciones medias
MIR 91
Observen como piden comparar la variabilidad de dos distribuciones de unidades distintas (mmHg y años). Usaremos el C.V. por ser adimensional.
Se desea comparar dos métodos de determinación de las colesterolemias
que usan unidades de medidas diferentes ¿cuál de las siguientes
medidas de dispersión le permitiría comparar más correctamente su
variabilidad?.
1. Las desviaciones estándar
2. Los coeficientes de variación
3. Los rangos (recorrido)
4. Las varianzas
5. Las desviaciones medias
MIR 96
• Las principales medidas de dispersión son: varianza, desviación estándar y
coeficiente de variación de Pearson
• El C.V. es adimensional
• La desviación típica o estándar representa el alejamiento prototípico del centro
• Cuando la distribución es simétrica la DE recorre la misma distancia hacia la
izquierda que a la derecha
Conclusiones: