Biostadistica Varianza
-
Upload
gustavo-aravena -
Category
Documents
-
view
83 -
download
0
Transcript of Biostadistica Varianza
CLASE 7
Klga.Melissa Muñoz G
MEDIDAS DE DISPERSIÓN O VARIABILIDAD Y DE FORMA
ESTADÍGRAFOS DE VARIABILIDAD
Estudiaremos :
• Recorrido
• Varianza y desviación estándar
3
MEDIDAS DE VARIACIÓNLa variación es la cantidad de dispersión o “separación” que presentan los datos entre sí.
Muestra AMuestra B
Los edificios B están más separadosque los de grupo A. La dispersión en B es mayor que en A.
ESTADÍGRAFOS DE VARIABILIDAD
Alumno Promedio
Pedro 4.0 4.0 4.0 4.0 4.0 4.0 4.0 4.0
Pablo 2.0 3.0 7.0 4.0 6.0 5.0 1.0 4.0
Consideremos las calificaciones en bioestadística de dos alumnos: Pedro y Pablo
Como es observa, tanto Pedro como Pablo tienen idéntico rendimiento promedio. Sin embargo ¿quién tiene rendimiento mas homogéneo? La respuesta la encontramos en los estadígrafos de variabilidad o dispersión
RECORRIDO O RANGO
Alumno Promedio
Pedro 4.0 4.0 4.0 4.0 4.0 4.0 4.0 4.0
Pablo 2.0 3.0 7.0 4.0 6.0 5.0 1.0 4.0
Se llama recorrido de una variable a la diferencia entre el MAXIMO y el MINIMO :
RecorridoX(n)-X(1)
Aquí:
Recorrido(Pedro)=4.0-4.0=0
Recorrido(Pablo)=7.0-1.0=6
RECORRIDO
Alumno Promedio
Pedro 1.0 4.0 4.0 4.0 4.0 4.0 7.0 4.0
Pablo 2.0 3.0 7.0 4.0 6.0 5.0 1.0 4.0
•Puede ser una medida muy exagerada de variabilidad
Aquí:
Recorrido(Pedro)=7.0-1.0=6
Recorrido(Pablo)=7.0-1.0=6
Sin embargo Pedro sigue teniendo un rendimiento mas homogeneo
Para definir la desviación estándar, previamente presentaremos lo que se llama desviación de un dato respecto al promedio, que denotamos por
d, es decir la diferencia entre cada dato y el promedio. XXd ii
En consecuencia definimos la Desviación Estándar, denotada por Sx
DESVIACION ESTANDAR: Cuando la media es usado como medida de
tendencia central, la medida más común de dispersión es la desviación estándar (S).
Como la media, la desviación estándar hace uso de la información contenida en todas las observaciones
Se define como la raíz cuadrada del promedio de las desviaciones al cuadrado de las observaciones con respecto a la media.
Puede ser interpretada como “la distancia promedio de las observaciones con respecto a la media”.
11
...
2
122
221
n
XX
n
dddS
n
ii
nx
9
X
1
)(1
2
2
n
XXS
n
ii
Es el cuadrado de la desviación estándar,La varianza es la suma de los cuadrados de las diferencias con relación a la media aritmética dividida entre el cuadrado de la muestra menos 1
VARIANZA
S2 Ξ Varianza Xi Ξ Dato u observación Ξ Media Aritmética n Ξ Tamaño de la muestra
V(x), Var(X), S2
VARIANZA
1. Se calcula la media aritmética2. A cada dato de la muestra se le resta el valor de media
aritmética3. El resultado de la resta se eleva al cuadrado4. Se suman todos los cuadrados obtenidos5. Dividir el resultado entre total de muestra menos 1
10
El proceso para calcular la varianza se resume así:
Por ejemplo calculemos la desviación estándar para las notas de Pablo, para ello dispongamos las notas así:
Alumno Promedio
Pedro 1.0 4.0 4.0 4.0 4.0 4.0 7.0 4.0
Pablo 2.0 3.0 7.0 4.0 6.0 5.0 1.0 4.0
La interpretación de la desviación estándar, bajo ciertas condiciones de regularidad, es que
“la mayoría de los datos está entre EL PROMEDIO MENOS LA DESVIACION y EL PROMEDIO MAS LA DESVIACION”, lo que en el ejemplo es que las notas de Pablo están entre
4,0 -2,0 y 4.0 + 2.0 , es decir entre 2.0 y 6.0, lo que es bastante real.
2-2
00
8
SE DEFINE EN MINUTOS EL TIEMPO QUE LE LLEVA A UN KINESIÓLOGO ATENDER A UN PACIENTE, DESDE QUE LLEGAN AL CONSULTORIO ,HASTA QUE SE VAN DE LA CONSULTA A SU CASA. A LO LARGO DE 10 DÍAS HÁBILES CONSECUTIVOS, USTED RECABA LOS TIEMPOS (REDONDEADOS A MINUTOS) QUE SE MUESTRA A CONTINUACIÓN
39 29 43 52 39
44 40 31 44 35
14
15
29 31 35 39 39 40 43 44 44 52
Rango = 52 - 29 = 23
Para determinar el rango de los tiempos necesario para arreglarse, los datos se ordenan de menor a mayor
16
min6.3910396
1035443140443952432939
10
10
1
X
X
X
xX i
i
El tiempo que tarda es aproximadamente 40 minutos cada día
Para calcular la varianza de la muestra de los tiempos que tardó durante 10 días se sigue el siguiente proceso:(1) Calcular la media aritmética(2) Calcular la varianza
29 31 35 39 39 40 43 44 44 52
1)
17
Xx 2)( Xx Tiempo (x)
Paso 1 Paso 2
29 29 - 40 = -11 (-11)2 = 121
31 31 - 40 = -9 (-9)2 = 81
35 35 - 40 = -5 (-5)2 = 25
39 39 - 40 = -1 (-1)2 = 1
39 39 - 40 = -1 (-1)2 = 1
40 40 - 40 = 0 (0)2 = 0
43 43 - 40 = 3 (3)2 = 9
44 44 - 40 = 4 (4)2 = 16
44 44 - 40 = 4 (4)2 = 16
52 52 - 40 = 12 (12)2 = 144
Sumatoria 414
18
46
9
414110
4141
)(
2
2
2
1
2
2
S
S
S
n
XXS
n
ii
1) La varianza es de 46 minutos cuadrados1) La varianza es de 46 minutos cuadrados
7823.6
46
1
)(
2
1
2
S
S
SS
n
XXS
n
ii
2) La desviación estándar
con respecto a la media aritmética es de 6.78 minutos por día.
2) La desviación estándar
con respecto a la media aritmética es de 6.78 minutos por día.
varianza desviación estándar
Así que usando la desviación estándar tenemos una manera "estándar" de saber qué es normal, o extra grande o extra pequeño.
COEFICIENTE DE VARIACIÓN
19
A diferencia de las medidas que hemos estudiado hasta ahora, el coeficiente de variación es una indicación relativa de la variación. Siempre se expresa en porcentajes, no en términos de la unidad de medida de los datos estudiados.
Mide la dispersión en los datos con relación a la media .Es más útil cuando se trata de hacer comparaciones entre muestras.
%100.. X
SVC x
desviación estándar y el promedio
29 31 35 39 39 40 43 44 44 52
min6.3910
10
1
X
xX i
i
7823.61
)(1
2
Sn
XXS
n
ii
20
Para calcular el coeficiente de variación de la muestra de los tiempos que tarda durante 10 días se divide la desviación estándar entre la media
aritmética y el resultado se multiplica por 100.
•El valor de la media aritmética es 40* El valor de la desviación estándar es 6.7823
%96.16
)100)(016956(
)100(40
7823.6
CV
CVX
SCV
El coeficiente de variación es 16.96% homogénea
Criterio para determinar si los datos son homogéneos o Heterogéneos:
COEFICIENTE DE VARIABILIDAD
El C.V. sirve para comparar descriptivamente las dispersiones de una variable desagregada por otra.
. sum edad if sexo==0
Variable | Obs Mean Std. Dev. Min Max-------------+-------------------------------------------------------- edad | 63 64.95238 9.258699 38 84
. display r(sd)/r(mean)*10014.254595
. sum edad if sexo==1
Variable | Obs Mean Std. Dev. Min Max-------------+-------------------------------------------------------- edad | 279 60.51971 12.81294 23 89
. display r(sd)/r(mean)*10021.171511
La edad de los hombres es mas homogénea
DESVIACIÓN ESTÁNDAR
. sum edad,d
años cumplidos------------------------------------------------------------- Percentiles Smallest 1% 31 23 5% 40 2410% 45 31 Obs 34225% 51 31 Sum of Wgt. 342
50% 63 Mean 61.33626 Largest Std. Dev. 12.3445675% 71 8490% 76 86 Variance 152.388195% 78 88 Skewness -.394680999% 84 89 Kurtosis 2.615453
Varianza
Desviación estándar
EDAD (xi)
FRECUENCIA (fi) Percent Cum
10–19 2 6,67 6,6720–29 5 16,67 23,3330–39 13 43,33 66,6740–49 7 23,33 9050–60 3 10 100TOTAL 30 100
Media aritmética= 36 años La edad promedio de los 30 estudiantes es 36 ,3 años
xi(xi) x (fi)
15 3025 12535 45545 31555 165
1090
1090=36,330
c) Media o media aritmetica
d)Calcular la varianza y desviacion estandar.
EDAD (xi)
FRECUENCIA (fi) Percent Cum
10–19 2 6,67 6,6720–29 5 16,67 23,3330–39 13 43,33 66,6740–49 7 23,33 9050–60 3 10 100TOTAL 30 100
Media aritmética= 36 años La edad promedio de los 30 estudiantes es 36 ,3 años
xi(xi) x (fi)
15 3025 12535 45545 31555 165
1090
1090=36,330
c) Media o media aritmetica
d)Calcular la varianza y desviación estándar.
1
)(1
2
2
n
XXS
n
ii
15 – 36=–21
21 2 =441
Xx 2)( Xx
varianza Desviación estándar
LAS EDADES INDICADAS A CONTINUACIÓN CORRESPONDEN A 30 PACIENTES ATENDIDOS EN LA SALA DE URGENCIAS DE UN HOSPITAL UN VIERNES POR LA NOCHE.
a) Clasifique la variable según tipo y escala de medida de la variable.
b) Calcule e interprete la moda (Mo=45)
c)Calcule la mediana de las edades, interprete (Me =43)
d) Calcule la media aritmética ( X =39,7)