Download - 4ta veter medidas de dispersion

Dr. Mayhuasca Salgado RonaldDocente

Medidas de

dispersión

ESTADÍSTICA2016-I

FACULTAD DE CIENCIAS DE LA SALUD – ESCUELA ACADÉMICO PROFESIONAL DE MEDICINA VETERINARIA

Estadística Descriptiva

• Organización de datos• Representación de datos: Tablas y Gráficos

• Medidas de resumen• Medición de datos numéricos

1. Medidas de posición2. Medidas de dispersión3. Medidas de forma

• Medición de datos nominales1. Proporción2. Razón3. Medición epidemiológica

Grado de variabilidad con que se separan o agrupan los valores de la distribución

MEDIDAS DE DISPERSIÓN

Rango: (recorrido, amplitud) es la diferencia entre los valores máximo y mínimo

Desviación media: promedia los valores absolutos de las desviaciones de la media.

Varianza 𝑺𝟐: promedia los cuadrados de las desviaciones la media. Su unidad está

elevada al cuadrado.

Desviación típica o estándar S: raíz cuadrada de la varianza . Se expresa en las

mismas unidades que la media.

Coeficiente de variación de Pearson: Es la medida de dispersión de elección a la

hora de comparar medidas diferentes.

Son medidas que cuantifican la variabilidad de las observaciones con respecto a

un estadígrafo de tendencia central (generalmente la media aritmética).

Los principales estadígrafos de tendencia central son:

• VARIANZA

• DISPERSIÓN ESTÁNDAR

• COEFICIENTE DE VARIACIÓN


Describen cuán agrupados o dispersos se hallan los datos de la muestra en torno a los

valores centrales, siendo una expresión de la fluctuación del fenómeno estudiado.


Varianza ( S2) y Desviación estándar (S o DE)

• Nos informan sobre la magnitud de la variación en los datos , la magnitud con la cual las observaciones se agrupan en torno a las medidas

• Sólo se aplica a variables cuantitativas (medidas en escala de razón)

• Nos indica cuánto varía cada individuo respecto a la media

• Sólo calculables en variables cuantitativas.

• Son de las que más se usan y las que mejor expresan la variabilidaddel fenómeno estudiado.

• Si no se usa la media por NO ser un valor representativo(distribuciones sesgadas), se recomienda no usar la varianza ni ladesviación estándar


Varianza ( S2)

• Se define como el promedio del cuadrado de las desviaciones con

respecto la media.

• Cuando la varianza es muestral, se denota como S2(x); y si la

varianza es poblacional entonces se denota como σ2.

• Estudiaremos la varianza muestral.

1. Para datos no agrupados en tablas.

Obedece a la siguiente fórmula:

S2(X)=n-1

Desarrollando esta sumatoria se puede llegar

a una forma más simple para calcular la

varianza: S2(X)=n-1

Cálculo de la Varianza

2. Para datos agrupados en tablas.

Obedece a la siguiente fórmula:

S2(X)=n-1

De modo semejante al caso anterior,

desarrollando la fórmula se obtiene:

S2(X)=n-1

• Xi: marca de clase

• fi: frecuencia absoluta

• m: número de clases o intervalos

Cálculo de la Varianza

Se define como la raíz cuadrada positiva de la varianza, y como la

varianza está expresada en unidades cuadradas, la desviación

estándar (que está en las mismas unidades de los datos) representa

mejor la variabilidad de las observaciones.

Desviación estándar (S o DE)

𝑆 𝑥 = 𝑆2(𝑥)

• La desviación típica muestral se representa por S. En Medicina clínica se

representa por DE (desviación estándar) y en las revistas inglesas pos SD

(standard deviation)

• Para poder interpretar, con la misma desviación típica, distancias por encima

como por debajo de la media, se requiere que la distribución sea simétrica.


• Si la distribución es asimétrica , la desviación típica no puede representar

simultáneamente los desvíos superiores e inferiores, entonces se recurre a

los cuartiles

• Para valorar la dispersión en escala ordinal es muy útil la diferencia entre el

1er y 3er cuartil, conocida como distancia intercuartil (RIQ)


“Un cálculo mental aproximado de la desviación típica, en una variable

con distribución simétrica, consiste en dividir entre 2 la distancia entre

el valor más alto (o el más bajo) y la media.”


El personal de salud de cierto hospital camina a una velocidad media de

3km/h, siendo los extremos de velocidad 2 y 4 km/h aproximadamente. ¿Qué

valor cree que puede tener la desviación típica?

Ejemplo:

Cobo E, Muñoz P, Gonzales JA. Estadística para no estadísticos. Bases para interpretar artículos científicos. Barcelona: Elsevier; 2007.

Ejemplo: Determine la S y la S2 de: 5 8 8 5 9


𝑆 𝑥 = 𝑆2(𝑥)

S2(X)=n-1

Media: 7

: 3.5

: 1.87

Interpretación:

Existe una variación de 1,87unidades de cada individuo respectoa la media aritmética.

1. Suponga que se ha medido la presión arterial sistólica a 5 pacientes:

115, 117, 124, 135 y 142 mmHg. Sin hacer el cálculo, diga qué valor

aproximado le parece correcto para la media:

1. 115 mmHg

2. 125 mmHg

3. 135 mmHg

MIR 15

2. Suponga ahora que el resultado observado en los 5 pacientes ha sido

106, 117, 124, 135 y 142 mmHg, con una media de 130 mmHg. Sin hacer

el cálculo, diga que valor aproximado le parece correcto para la

desviación típica:

1. 5 mmHg

2. 20 mmHg

3. 35 mmHg

MIR 15

Coeficiente de variación (C.V.)

Es un valor adimensional, que se usa en la comparación de la variabilidad de

distribuciones que usen distintas unidades de medidas.


Se calcula del siguiente modo:

El C.V. se debe expresar en porcentaje, pues no tiene unidades y sirve como medida

de comparación con otras distribuciones de cualquier tipo de unidad…el C.V. mide

cuán dispersos se hallan los datos.

C.V. < 10% : representa una muestra que tiende a ser homogénea, los datos o

mediciones no son dispersos. Se puede usar la media y la D.E.

10%< C.V. < 20% : presentan una regular o moderada dispersión.

C.V. > 20% : los datos se muestran muy dispersos. Usaremos la mediana y el RIQ

𝑪. 𝑽.=𝑺 (𝒙)

𝑿

EJEMPLO:

Rpta: La primera muestra es más homogénea y la dispersión

es mínima.


𝑪. 𝑽. =𝑺 (𝒙)

𝑿


• Proporciona los elementos para comparar la variabilidad en distintos conjuntos de datos

que pueden tener distintas medias

• Indica el porcentaje de datos que están alejados de la media aritmética

• Una desviación estándar de 500 en una distribución con una media de 5000, sugiere una

variabilidad mayor que una desviación de 50 en una distribución de media 5000

• Generalmente se expresa en porcentaje

𝑪. 𝑽.=𝑺 (𝒙)

𝑿x 100%

Los siguientes datos corresponden a 20 lecturas de temperatura (en °F) tomadas en

varios puntos de una esterilizadora de calor seco.

415 460 510 475 430 410 425 490 500 470

450 425 485 470 450 455 460 480 475 465

Determine el coeficiente de variación e interprete.

Rpta: 6,07% .

Interpretación: El 6,07% de los datos se hallan alejados de la media. Los

datos son poco dispersos.

Resuelva

En una muestra de 360 personas el nivel medio de glucemia es 5mmol/L y

la desviación estándar es 0.5 ¿cuál es el coeficiente de variación?

1. 10%

2. 25%

3. 12,5%

4. 5%

5. 2,5%

MIR 93

Para comparar la variabilidad relativa de la tensión arterial diastólica de

una serie de individuos y la de su edad, tenemos:

1. Las desviaciones estándar

2. Los coeficientes de variación

3. Los rangos (recorrido)

4. Las varianzas

5. Las desviaciones medias

MIR 91

Observen como piden comparar la variabilidad de dos distribuciones de unidades distintas (mmHg y años). Usaremos el C.V. por ser adimensional.

Se desea comparar dos métodos de determinación de las colesterolemias

que usan unidades de medidas diferentes ¿cuál de las siguientes

medidas de dispersión le permitiría comparar más correctamente su

variabilidad?.

1. Las desviaciones estándar

2. Los coeficientes de variación

3. Los rangos (recorrido)

4. Las varianzas

5. Las desviaciones medias

MIR 96

• Las principales medidas de dispersión son: varianza, desviación estándar y

coeficiente de variación de Pearson

• El C.V. es adimensional

• La desviación típica o estándar representa el alejamiento prototípico del centro

• Cuando la distribución es simétrica la DE recorre la misma distancia hacia la

izquierda que a la derecha

Conclusiones: