Biostadistica Varianza

27
CLASE 7 Klga.Melissa Muñoz G MEDIDAS DE DISPERSIÓN O VARIABILIDAD Y DE FORMA

Transcript of Biostadistica Varianza

Page 1: Biostadistica Varianza

CLASE 7

Klga.Melissa Muñoz G

MEDIDAS DE DISPERSIÓN O VARIABILIDAD Y DE FORMA

Page 2: Biostadistica Varianza

ESTADÍGRAFOS DE VARIABILIDAD

Estudiaremos :

• Recorrido

• Varianza y desviación estándar

Page 3: Biostadistica Varianza

3

MEDIDAS DE VARIACIÓNLa variación es la cantidad de dispersión o “separación” que presentan los datos entre sí.

Muestra AMuestra B

Los edificios B están más separadosque los de grupo A. La dispersión en B es mayor que en A.

Page 4: Biostadistica Varianza

ESTADÍGRAFOS DE VARIABILIDAD

Alumno Promedio

Pedro 4.0 4.0 4.0 4.0 4.0 4.0 4.0 4.0

Pablo 2.0 3.0 7.0 4.0 6.0 5.0 1.0 4.0

Consideremos las calificaciones en bioestadística de dos alumnos: Pedro y Pablo

Como es observa, tanto Pedro como Pablo tienen idéntico rendimiento promedio. Sin embargo ¿quién tiene rendimiento mas homogéneo? La respuesta la encontramos en los estadígrafos de variabilidad o dispersión

Page 5: Biostadistica Varianza

RECORRIDO O RANGO

Alumno Promedio

Pedro 4.0 4.0 4.0 4.0 4.0 4.0 4.0 4.0

Pablo 2.0 3.0 7.0 4.0 6.0 5.0 1.0 4.0

Se llama recorrido de una variable a la diferencia entre el MAXIMO y el MINIMO :

RecorridoX(n)-X(1)

Aquí:

Recorrido(Pedro)=4.0-4.0=0

Recorrido(Pablo)=7.0-1.0=6

Page 6: Biostadistica Varianza

RECORRIDO

Alumno Promedio

Pedro 1.0 4.0 4.0 4.0 4.0 4.0 7.0 4.0

Pablo 2.0 3.0 7.0 4.0 6.0 5.0 1.0 4.0

•Puede ser una medida muy exagerada de variabilidad

Aquí:

Recorrido(Pedro)=7.0-1.0=6

Recorrido(Pablo)=7.0-1.0=6

Sin embargo Pedro sigue teniendo un rendimiento mas homogeneo

Page 7: Biostadistica Varianza

Para definir la desviación estándar, previamente presentaremos lo que se llama desviación de un dato respecto al promedio, que denotamos por

d, es decir la diferencia entre cada dato y el promedio. XXd ii

En consecuencia definimos la Desviación Estándar, denotada por Sx

Page 8: Biostadistica Varianza

DESVIACION ESTANDAR: Cuando la media es usado como medida de

tendencia central, la medida más común de dispersión es la desviación estándar (S).

Como la media, la desviación estándar hace uso de la información contenida en todas las observaciones

Se define como la raíz cuadrada del promedio de las desviaciones al cuadrado de las observaciones con respecto a la media.

Puede ser interpretada como “la distancia promedio de las observaciones con respecto a la media”.

11

...

2

122

221

n

XX

n

dddS

n

ii

nx

Page 9: Biostadistica Varianza

9

X

1

)(1

2

2

n

XXS

n

ii

Es el cuadrado de la desviación estándar,La varianza es la suma de los cuadrados de las diferencias con relación a la media aritmética dividida entre el cuadrado de la muestra menos 1

VARIANZA

S2 Ξ Varianza Xi Ξ Dato u observación Ξ Media Aritmética n Ξ Tamaño de la muestra

V(x), Var(X), S2

Page 10: Biostadistica Varianza

VARIANZA

1. Se calcula la media aritmética2. A cada dato de la muestra se le resta el valor de media

aritmética3. El resultado de la resta se eleva al cuadrado4. Se suman todos los cuadrados obtenidos5. Dividir el resultado entre total de muestra menos 1

10

El proceso para calcular la varianza se resume así:

Page 11: Biostadistica Varianza
Page 12: Biostadistica Varianza

Por ejemplo calculemos la desviación estándar para las notas de Pablo, para ello dispongamos las notas así:

Alumno Promedio

Pedro 1.0 4.0 4.0 4.0 4.0 4.0 7.0 4.0

Pablo 2.0 3.0 7.0 4.0 6.0 5.0 1.0 4.0

Page 13: Biostadistica Varianza

La interpretación de la desviación estándar, bajo ciertas condiciones de regularidad, es que

“la mayoría de los datos está entre EL PROMEDIO MENOS LA DESVIACION y EL PROMEDIO MAS LA DESVIACION”, lo que en el ejemplo es que las notas de Pablo están entre

4,0 -2,0 y 4.0 + 2.0 , es decir entre 2.0 y 6.0, lo que es bastante real.

Page 14: Biostadistica Varianza

2-2

00

8

SE DEFINE EN MINUTOS EL TIEMPO QUE LE LLEVA A UN KINESIÓLOGO ATENDER A UN PACIENTE, DESDE QUE LLEGAN AL CONSULTORIO ,HASTA QUE SE VAN DE LA CONSULTA A SU CASA. A LO LARGO DE 10 DÍAS HÁBILES CONSECUTIVOS, USTED RECABA LOS TIEMPOS (REDONDEADOS A MINUTOS) QUE SE MUESTRA A CONTINUACIÓN

39 29 43 52 39

44 40 31 44 35

14

Page 15: Biostadistica Varianza

15

29 31 35 39 39 40 43 44 44 52

                   

Rango = 52 - 29 =   23    

Para determinar el rango de los tiempos necesario para arreglarse, los datos se ordenan de menor a mayor

Page 16: Biostadistica Varianza

16

min6.3910396

1035443140443952432939

10

10

1

X

X

X

xX i

i

El tiempo que tarda es aproximadamente 40 minutos cada día

Para calcular la varianza de la muestra de los tiempos que tardó durante 10 días se sigue el siguiente proceso:(1) Calcular la media aritmética(2) Calcular la varianza

29 31 35 39 39 40 43 44 44 52

1)

Page 17: Biostadistica Varianza

17

Xx 2)( Xx Tiempo (x)

Paso 1 Paso 2

29 29 - 40 = -11 (-11)2 = 121

31 31 - 40 = -9 (-9)2 = 81

35 35 - 40 = -5 (-5)2 = 25

39 39 - 40 = -1 (-1)2 = 1

39 39 - 40 = -1 (-1)2 = 1

40 40 - 40 = 0 (0)2 = 0

43 43 - 40 = 3 (3)2 = 9

44 44 - 40 = 4 (4)2 = 16

44 44 - 40 = 4 (4)2 = 16

52 52 - 40 = 12 (12)2 = 144

Sumatoria   414

Page 18: Biostadistica Varianza

18

46

9

414110

4141

)(

2

2

2

1

2

2

S

S

S

n

XXS

n

ii

1) La varianza es de 46 minutos cuadrados1) La varianza es de 46 minutos cuadrados

7823.6

46

1

)(

2

1

2

S

S

SS

n

XXS

n

ii

2) La desviación estándar

con respecto a la media aritmética es de 6.78 minutos por día.

2) La desviación estándar

con respecto a la media aritmética es de 6.78 minutos por día.

varianza desviación estándar

Así que usando la desviación estándar tenemos una manera "estándar" de saber qué es normal, o extra grande o extra pequeño.

Page 19: Biostadistica Varianza

COEFICIENTE DE VARIACIÓN

19

A diferencia de las medidas que hemos estudiado hasta ahora, el coeficiente de variación es una indicación relativa de la variación. Siempre se expresa en porcentajes, no en términos de la unidad de medida de los datos estudiados.

Mide la dispersión en los datos con relación a la media .Es más útil cuando se trata de hacer comparaciones entre muestras.

%100.. X

SVC x

desviación estándar y el promedio

Page 20: Biostadistica Varianza

29 31 35 39 39 40 43 44 44 52

min6.3910

10

1

X

xX i

i

7823.61

)(1

2

Sn

XXS

n

ii

20

Para calcular el coeficiente de variación de la muestra de los tiempos que tarda durante 10 días se divide la desviación estándar entre la media

aritmética y el resultado se multiplica por 100.

•El valor de la media aritmética es 40* El valor de la desviación estándar es 6.7823

%96.16

)100)(016956(

)100(40

7823.6

CV

CVX

SCV

El coeficiente de variación es 16.96% homogénea

Page 21: Biostadistica Varianza

Criterio para determinar si los datos son homogéneos o Heterogéneos:

Page 22: Biostadistica Varianza

COEFICIENTE DE VARIABILIDAD

El C.V. sirve para comparar descriptivamente las dispersiones de una variable desagregada por otra.

. sum edad if sexo==0

Variable | Obs Mean Std. Dev. Min Max-------------+-------------------------------------------------------- edad | 63 64.95238 9.258699 38 84

. display r(sd)/r(mean)*10014.254595

. sum edad if sexo==1

Variable | Obs Mean Std. Dev. Min Max-------------+-------------------------------------------------------- edad | 279 60.51971 12.81294 23 89

. display r(sd)/r(mean)*10021.171511

La edad de los hombres es mas homogénea

Page 23: Biostadistica Varianza

DESVIACIÓN ESTÁNDAR

. sum edad,d

años cumplidos------------------------------------------------------------- Percentiles Smallest 1% 31 23 5% 40 2410% 45 31 Obs 34225% 51 31 Sum of Wgt. 342

50% 63 Mean 61.33626 Largest Std. Dev. 12.3445675% 71 8490% 76 86 Variance 152.388195% 78 88 Skewness -.394680999% 84 89 Kurtosis 2.615453

Varianza

Desviación estándar

Page 24: Biostadistica Varianza

EDAD (xi)

FRECUENCIA (fi) Percent Cum

10–19 2 6,67 6,6720–29 5 16,67 23,3330–39 13 43,33 66,6740–49 7 23,33 9050–60 3 10 100TOTAL 30 100  

Media aritmética= 36 años La edad promedio de los 30 estudiantes es 36 ,3 años

xi(xi) x (fi)

15 3025 12535 45545 31555 165

1090

1090=36,330

c) Media o media aritmetica

d)Calcular la varianza y desviacion estandar.

Page 25: Biostadistica Varianza

EDAD (xi)

FRECUENCIA (fi) Percent Cum

10–19 2 6,67 6,6720–29 5 16,67 23,3330–39 13 43,33 66,6740–49 7 23,33 9050–60 3 10 100TOTAL 30 100  

Media aritmética= 36 años La edad promedio de los 30 estudiantes es 36 ,3 años

xi(xi) x (fi)

15 3025 12535 45545 31555 165

1090

1090=36,330

c) Media o media aritmetica

d)Calcular la varianza y desviación estándar.

1

)(1

2

2

n

XXS

n

ii

15 – 36=–21

21 2 =441

Xx 2)( Xx

varianza Desviación estándar

Page 26: Biostadistica Varianza

 LAS EDADES INDICADAS A CONTINUACIÓN CORRESPONDEN A 30 PACIENTES ATENDIDOS EN LA SALA DE URGENCIAS DE UN HOSPITAL UN VIERNES POR LA NOCHE.

a) Clasifique la variable según tipo y escala de medida de la variable.

b) Calcule e interprete la moda (Mo=45)

c)Calcule la mediana de las edades, interprete (Me =43)

d) Calcule la media aritmética ( X =39,7)

Page 27: Biostadistica Varianza