CURSO TALLER: HERRAMIENTAS ESTADISTICA
PARA LA EVALUACION DE INDICADORES
EPIDEMIOLÓGICOS EN SALUD
Mg. Wilmer Fuentes Neira
Data Scientist
Esto lo que quiero decir. Vea Ud. si lo puede probar con estadística.
Several informal definitions are offered in the book A Career in Statistics: Beyond the Numbers by Gerald Hahn and Necip Doganaksoy: The science of learning from (or making
sense out of) data The theory and methods of extracting
information from observational data for solving real-world problems
The science of uncertainty The quintessential interdisciplinary science The art of telling a story with [numerical] data
4http://www.worldofstatistics.org
Uso
s de la
Est
adís
tica
en e
l Sect
or
Salu
d• Elaboración de
políticas
• Investigación científica
• Toma de decisiones
Lic. Luis Infantes OblitasCOESPE Nº 421
Est
adís
tica
en
Salu
d
Proveer información continua
sobre la producción de servicios
de salud y la morbimortalidad;
mediante las acciones de registro,
control de calidad, procesamiento
y consolidación de las actividades
de recuperación y preventivo
promocionales.
Las personas mas importante del
Sistema de Información en Salud,
son los Profesionales y no
Profesionales responsables del
llenado de los registros
hospitalarios.
Estos son los insumos que los
estadísticos necesitan para
transformarlos en información.
Lic. Luis Infantes OblitasCOESPE Nº 421
Prin
cipale
s Fu
ente
s de D
ato
s POB
RENAES PERS
NAC DEF
HIS
INMUN
Población Estimada
Registro Nacional EstablecimientosInformación de Recursos Humanos
Consulta ExternaAtención por DiscapacidadEgresos HospitalariosEmergencia
InmunizacionesSalud Sexual y ReproductivaSalud MentalEnfermedades Metaxénicas
SALUD SEXUAL
METAX
NacimientosDefunciones
HIS DIS EGRESO EMERG
SALUD MENTAL
METODOS ESTADISTICOS”
11
Se adaptan métodos y
según el campo de aplicación”Epidemiologia, Gestión,
Sistemas de Calidad, Data
Science, Planeamiento
Espacial, etc.
Mg. Wilmer Fuentes
Métodos Estadístico en un diseño Experimental
13
14
MUESTREO ESTADISTICO
Concepto:
Procedimiento para seleccionar una o
más muestras estadísticamente representativas de la población o poblaciones.
Ejemplo de uso del muestreo:a. Encuestas.b. Diseño y análisis de experimentos.c. Control de calidad
15
Ejemplo: Control de Calidad en Investigación: Validación de Instrumentos (encuestas, test) Validación de Metodologías, etc.
HIPERTENSIÓN
Ciudad XTiempo 1
Ciudad X tiempo 2
Total
n % n % n %
No hipertensos 351 65.2 332 65.5 683 65.4
Hipertensos 187 34.8 175 34.5 362 34.6
Total 538 100.0 507 100.0 1045 100.0
p = 0.935, Chi cuadrado
16
Muestras
La muestra debe ser representativa de la población Debemos evitar sesgos sistemáticos Controlar variables de confusión El tamaño muestral juega un papel fundamental La muestra debe contener suficiente información
para que la inferencia que realicemos sea una
generalización aceptable
17
CRITERIOS DE ACEPTACION DE UN METODO DE MUESTREO
a. Representatividad: Significa atribuir a cada unidad de muestreo (persona, vivienda, ...) una probabilidad, conocida y diferente de cero, de ser elegida.
b. Precisión de las estimaciones: La precisión o confiabilidad de las estimaciones derivadas de la muestra debe ser suceptible de medir. Así: = p ± precisión
c. Viabilidad: El método de muestreo debe ser práctico. La teoría y la práctica deben estar juntas.
d. Economia y eficiencia: Un buen método de muestreo (muestra) debe proporcionar la mayor cantidad de información a menor costo.
18
TERMINOS ESTADISTICOS (RECORDAR)
a. Población b. Unidad de muestreoc. Marco muestral d. Muestrae. Unidad de análisisf. Parámetrog. Estadígrafo o estadístico.
19
Población.- Colección de elementos acerca
de los cuales se desea hacer inferencia. Unidad de muestreo.- Son la
colección no traslapada de elementos de la población que cubren la población completa.
Marco muestral.- Un marco es la lista de unidades de muestreo.
20
Muestra: Es una colección de unidades seleccionadas de un marco o de varios marcos.
Unidad de análisis: es cada uno de los elementos requeridos para hacer inferencia.
21
Población
En población tiene una característica de interés en particular. Individuos expuestos a HIV Individuos diabéticos Individuos vacunados contra la gripe Fumadores
Población objetivo (diana): Población a la que nos corresponde
extender las conclusiones del trabajo
22
TÉCNICAS DE MUESTREO
• Intencional• Sin norma• Accidental (casos)• Voluntarios
• MAS• MS• ME• M de C
No probabilísticos
Probabilísticos
METODOS
(prácticos y económicos
23
Tamaño muestral
Es algo medio complicado, primero es necesario distinguir
entre: Encuesta descriptiva.- Diseñado para proporcionar
estimaciones de algunas características simples.
(prevalencia, incidencia) Encuesta analítica.- Para investigar asociaciones entre
variables. (asoc. fumar y riesgo de eventos cardiovasculares)
24
Para estimar una proporción poblacional
Nnn
n
NconoceseSiE
qpzn
f
ee
1
:22
2
25
Ejemplo:
En una población grande se desea estimar la prevalencia de DM con 95% de confianza. De la literatura se sabe que p =10%, si se asume un error muestral de 5%, calcular n.
Solución: Datos:Z /2 = 1,96pe =0,1qe =0,9E = 0,05
n= (1,96)2 (0,1)(0,9) = 138,3
(0,05)2
n 139Interpretación: Si se desea estimar la prevalencia poblacional con 95% de confianza y con un E de 5%, se debe evaluar 139 sujetos.
26
Para estimar una media poblacional
Nnn
n
NconoceseSiE
szn
f
e
1
:2
2
22
27
Ejemplo: En cierta población de 1200 escolares se desea estimar el nivel promedio de Hb con 95% de confianza. Al realizar un estudio piloto se encontró: x= 12,3 s = 1,6. Si los investigadores estan dispuestos a asumir un E = 0,5 , calcular n.Solución:Datos:
Z /2 = 1,96N= 1200Se = 1,6E = 0,5
n= (1,96)2 (1,6)2 = 39,33 (0,5)2
nf = 39,33 = 38,05 1 + 39,33/1200
nf 39
28
SPSS e INFORMACIÓN
R, SPSS, STATA
SQL, ORACLE, MySQL
R, MathLab
ESTADISTICA DESCRIPTIVA
31
ESTADÍSTICA DESCRIPTIVAOrdenando la Información
Al ordenar datos muy numerosos, es usual resumirlos o agruparlos en clases o categorías. Al determinar cuántos pertenecen a cada clase, establecemos la frecuencia. Construimos así una tabla de datos llamada tabla de frecuencias y si es cuantitativa se pueden emplear promedio y otras medidas
FRECUENCIA ABSOLUTA
(cantidad de casos, recuento de eventos,
etc)
FRECUENCIA RELATIVA
(%, proporciones)
PROMEDIOS, DESVIACION ESTANDAR,
PERCENTILES, ETC.
Variables Una variable es una característica o atributo observable que varía entre los
diferentes individuos de una población. La información que disponemos de cada individuo es resumida en
variables.
En los individuos del curso de bioestadistica es variable: El grupo sanguíneo
{A, B, AB, O} Var. Cualitativa
Su nivel emocional “declarado” {Deprimido, Regular, Muy Feliz} Var. Ordinal
El número de hijos {0,1,2,3,...} Var. Numérica discreta
La altura {1’62 ; 1’74; ...} Var. Numérica continua
35
5. ¿Está unido sentimentalmente a una pareja? SI ( ) NO ( )
6. Usted lee el diario:Comercio ( )República( )Expreso ( )Peru21 ( )
36
6. Que diarios ha leído en al último mes:
6.1 Comercio si ( ) no ( )6.2 República si ( ) no ( )6.3 Expreso si ( ) no ( ) 6.4 Peru21 si ( ) no ( )6.5 Especifique: ___________________
37
Cualitativas
Si sus valores (modalidades) no se pueden
asociar naturalmente a un número (no se
pueden hacer operaciones algebraicas con
ellos)
Nominales: Si sus valores no se pueden ordenar Sexo, Grupo Sanguíneo, Religión, Nacionalidad, Fumar (Sí/No)
Ordinales: Si sus valores se pueden ordenar Mejoría a un tratamiento, Grado de satisfacción, Intensidad del dolor
Tipos de variables
38
Presentación ordenada de datos (ej. Tesis)
Hombre Mujer
0
1
2
3
4
5
6
7
Las tablas de frecuencias y las representaciones gráficas son dos maneras equivalentes de presentar la información. Las dos exponen ordenadamente la información recogida en una muestra.
Género n %
Varones 4 40.0
Mujeres 6 60.0
Total 10 100.0
39
Gráficos para v. cualitativas
Diagramas de pastel (pie) No usarlo con variables ordinales. El área de cada sector es proporcional a su frecuencia (abs. o rel.)
27.3
72.7HipertensosNo hipertensos
Note las etiquetas de las categorìas (modalidades) y etiqueta de valores
Gráficos para v. cualitativas
Diagramas de barras (tipo tesis) Alturas proporcionales a las frecuencias (abs. o rel.) Se pueden aplicar también a variables discretas
<1 1 - 4 5 - 9 10 - 150
15
30
45
60
75
6.7 10.016.7
66.7
Grupo de edad (años)
Po
rce
nta
je (
%)
¿Que se mide en las ordenas? ¿Se
describen bien la categorias?
¿Presencia de etiquetas de valor?
Prevalencia de hipertensión arterial en el Perú. TORNASOL II
Prevalencia de la presión arterial según VII Reporte (JNC VII)
Tornasol I(n=14256)
Tornasol II(n=14508)
0
10
20
30
40
50
60
70
80
90
100
43.935.8
32.436.9
17.9 20.7
5.8 6.6
HTA estadio II
HTA estadio I
Prehipertensiòn
No hipertenso
Porc
en
taje
(%)
La mala salud, comportamientos poco saludables y características desfavorables de trabajo influyen en la salida del trabajo entre los trabajadores de más edad en Europa: Un estudio de cuatro de seguimiento
Nota: No se emplean gràficas en el articulo publicado
Robroek SJ, Schuring M, Croezen S, Stattin M, Burdorf
A.Poor health, unhealthy behaviors, and unfavorable work characteristics influence pathways of exit from paidemployment among older workers in Europe: a four yearfollow-up study
Scand J Work Environ Health. 2012 Sep 3.
44
Si sus valores son numéricos (tiene sentido
hacer operaciones algebraicas con ellos)
Discretas: Si toma valores enteros Número de hijos, Número de cigarrillos por día, Num. de
“cumpleaños”
Continuas: Si entre dos valores, son posibles infinitos valores
intermedios. Altura, Presión intraocular, Dosis de medicamento administrado,
edad, Hb
Cuantitativas o Numéricas
45
Cuantitativas o Numéricas
Si sus valores son numéricos (tiene sentido hacer
operaciones algebraicas con ellos) Escala de intervalo
El cero no es una cantidad absoluta.
Escala de razón El cero es una cantidad absoluta.
Tipos de variables
Figura 2. Promedio de los marcadores de riesgo cardiovascular
según control de la HbA1c.¥
Desarrollo psicomotor , entre pequeños para la edad gestacional: Impacto de la suplementación con zinc, peso al nacer y las prácticas de crianza.Cognitive and Motor Development Among Small-for-Gestational-Age Infants: Impact of Zinc Supplementation, Birth Weight,and Caregiving Practices
PEDIATRICS Vol. 113 No. 5 May 2004
Diagramas de barras (tipo publicación)
Celso Iglesias-García. Quality of life in depressed women over 40 years old. Actas Esp Psiquiatr 2012;40(4):221-7
Figure 1 Q-LES-Q scores
Densidad mineral ósea en mujeres durante campaña de Hospital de la
Solidaridad.
50
Gráfica de dispersión
Permite observar la relación entre dos variables cuantitativas.
En este caso cada punto corresponde a un individuo y la ubicaciòn de cada punto depente del valor de PAI y el valor de Hb glicosilada
Salud en relación con el conocimiento y las preferencias en jardines de niños de bajo nivel socioeconómico.
Int J Behav Nutr Phys Act. 2012 Jan 10;9:1.Health-related knowledge and preferences in low socio-economic kindergarteners.Nemet D, Geva D, Meckel Y, Eliakim A.
El objetivo del presente estudio fue determinar la actividad física (AF) y el conocimiento de nutrición en jardines . . .
Estadística inferencial
Usa la teoría de la probabilidad para extraer
conclusiones acerca de una población, a
partir de los datos obtenidos en una muestra. Es muy difícil estudiar a toda la población,
por lo que estudiamos muestras. Métodos para hacer estimaciones y probar
hipótesis son fundamentales para obtener
inferencias.
Estadística inferencial-Ejemplos
En una encuesta nacional acerca de los peligros del tabaquismo, no se entrevista a toda la población, sólo se hace en una muestra de ella.
Para medir la prevalencia de amebiasis en una población, se estudia una muestra aleatorizada. Con la prevalencia de la muestra, se puede inferir la prevalencia de amebiasis en la población.
54
Número de hijos
419 27,8 27,8
255 16,9 44,7
375 24,9 69,5
215 14,2 83,8
127 8,4 92,2
54 3,6 95,8
24 1,6 97,3
23 1,5 98,9
17 1,1 100,0
1509 100,0
0
1
2
3
4
5
6
7
Ocho+
Total
Frec.Porcent.(válido)
Porcent.acum.
Ejemplo ¿Cuántos individuos tienen
menos de 2 hijos? frec. indiv. sin hijos
+ frec. indiv. con 1 hijo = 419 + 255= 674 individuos
¿Qué porcentaje de individuos tiene 6 hijos o menos? 97,3%
¿Qué cantidad de hijos es tal que al menos el 50% de la población tiene una cantidad inferior o igual? 2 hijos
≥50%
55
Recomendaciones para un gráfico Si es estético, fomenta la lectura y comprensión. Sencillez y claridad, el uso del color debe ser
moderado y bien elegido. Usar líneas finas, eliminar las superfluas Usar grid si es necesario Balance entre el espacio en blanco y datos Idealmente no hay que acudir al texto . Balance entre texto, tablas e imágenes, Combinar texto y tablas insertas
56
Introducción de datos de las variables
¿Qué es lo correcto?PRESION ARTERIAL SISTOLICA
SEXO CLAS_IMC PAS_DIUR PAS_NOCT
Varon Sobrepeso 154 156Varon Obeso 156 154Mujer Obeso 154 160Varon Sobrepeso 134 126Mujer Obeso 146 136Mujer Sobrepeso 160 150Mujer Sobrepeso 146 140
Varon Sobrepeso 154 156Mujer Obeso 154 156Varon Obeso 156 154Mujer Obeso 154 160Mujer Sobrepeso 134 126Varon Sobrepeso 146 136 . . . . . . . . . . . .
DIURNA NOCTURNA DIURNA NOCTURNA
134 126 162 160146 136 132 136160 150 136 140146 140 140 136154 156 156 154156 154 134 130154 160 120 124
134 126 162 160146 136 132 136160 150 136 140146 140 140 136154 156 156 154156 154 134 130154 160 120 124
GRUPO SOBRESO GRUPO OBESOS
Var
on
esM
uje
res
A BSe muestra la PAS de individuos con determinadas
caracteristica ¿Cuántas Variables Hay?
Top Related