Calculo Del TamaÑo de La Muestra

12

Click here to load reader

Transcript of Calculo Del TamaÑo de La Muestra

Page 1: Calculo Del TamaÑo de La Muestra

Rev. Col. Psiquiatría, Vol. XXVII, No. 2, 1998. 131

Tamaño de la muestra

CALCULO DEL TAMAÑO DE LA MUESTRAEN PSIQUIATRIA Y SALUD MENTAL(principios básicos para su estimación)

Carlos Gómez Restrepo1.Ricardo Sánchez Pedraza2 .

El presente trabajo tiene por objeto repasar los conceptos subyacentes alcálculo del tamaño de la muestra necesarios en la etapa de planeación decualquier estudio en Psiquiatría y Medicina. Se revisan conceptos tales comoel de error tipo I o alfa, error tipo II o beta , poder del estudio, variabilidad de losresultados y diferencias estadística y clínicamente significativas. Estos son loselementos básicos a utilizar en las fórmulas que ayudan a establecer el númerode pacientes necesarios en un estudio.

Palabras clave:Palabras clave:Palabras clave:Palabras clave:Palabras clave: Cálculo, Tamaño de muestra

This work deals with concepts related with sample size estimation that arenecessary when planing any study in Psychiatry or Medicine. Concepts suchas type I error or alpha error, type II error or beta error, Power, variability andclinical and statistical significative differences are revised. These elements areneeded to apply statistical formulas useful to determine the number of patientsneeded in a study.

Key words: Key words: Key words: Key words: Key words: Estimation, Sample size

INTRODUCCIONINTRODUCCIONINTRODUCCIONINTRODUCCIONINTRODUCCION

Una vez el investigador ha definido qué pregunta desea responder y cómo lova hacer, surge el cuestionamiento acerca del tamaño de la muestra.¿Cuántos pacientes se requieren para el estudio?, ¿Cuál sería el númeromínimo de pacientes con los cuales podría llegar a conclusiones válidas?,¿Cómo se calcula el tamaño de la muestra?, ¿en qué consiste el poder y elnivel de significancia de un estudio?, ¿Qué diferencia habría entre 12, 25 o máspacientes en cada grupo?, ¿Qué ocurre si se sobreestima la muestra?,¿Cuánto tiempo puede durar el estudio de acuerdo con la muestra calcula-da?, ¿Es factible el estudio dada la cantidad de pacientes requeridos? Estasy otras preguntas son a menudo un obstáculo para colegas interesados en lainvestigación o en evaluar de una manera más responsable y adecuada laliteratura y la evidencia clínica disponible.

1 Médico-Psiquiatra. Profesor Asistente . Departamento de Psiquiatría y Salud Mental y Unidad deEpidemiología Clínica y Bioestadística. Pontificia Universidad Javeriana.

2 Médico-Psiquiatra . Profesor Asociado. Departamento de Psiquiatría y Centro de Epidemiología Clínica.Universidad Nacional de Colombia.

Page 2: Calculo Del TamaÑo de La Muestra

Gómez C. y Sánchez R.

132 Rev. Col. Psiquiatría, Vol. XXVII, No. 2, 1998.

Desde hace algunos años los editores de revistas médicas internacionales, yen ciertos casos nacionales, exigen a los autores de un determinado artículoque expliquen con mayor detenimiento los lineamientos metodológicosutilizados y la forma en que se realizó el muestreo y el cálculo del tamaño dela muestra. Este cambio de actitud, que en un principio se pudo habercalificado como sorprendente, persecutorio o inclusive innecesario, obedecióa las pruebas cada vez más concluyentes de parte de la EpidemiologíaClínica, de la Epidemiología General y de otras especialidades médicas, dela necesidad de garantizar que estudios rigurosamente planeados y realiza-dos no fallaran en encontrar diferencias significativas debido a tamaños demuestra insuficientes.

En esta línea se ha demostrado que múltiples experimentos clínicos contro-lados han errado en encontrar diferencias entre grupos por falta de muestraslo suficientemente grandes que permitan discriminar entre determinadascaracterísticas(1). Este detalle, que podría sonar para algunos como unaminucia epidemiológica, tiene consecuencias éticas de gran relevancia. Sípor ejemplo, estamos probando una nueva droga que fuera útil para laEsquizofrenia Desorganizada, para la cual no existe un tratamiento del todoexitoso y por falta de una muestra suficientemente grande concluyéramos queeste medicamento no es diferente del placebo, esta droga útil sería descar-tada del mercado y perderíamos una opción terapéutica para estos pacien-tes. Por otro lado, si existe un extracto floral que en realidad no tiene ningunautilidad para pacientes esquizofrénicos y lo comparamos con un antipsicóticotradicional, podemos llegar a la falsa conclusión de que es un tratamientoadecuado, debido a que una muestra muy pequeña me permite detectardiferencias con el tratamiento convencional.

Para el adecuado cálculo del tamaño de la muestra se requieren algunosconceptos fundamentales que facilitan aproximarse a la lógica y a la mecá-nica del procedimiento (2,3,4). Los autores consideran que el objetivo de unescrito sobre este tema no debe ser el presentar una o más formulas mágicasque permitan estimar muestras para proporciones, medias, validación deescalas, evaluación de pruebas diagnósticas u otros procedimientos estadís-ticos. Lo fundamental es conocer los conceptos subyacentes al procedimien-to con el fin de saber qué es lo que se busca, qué diferencias clínicamenterelevantes se espera encontrar y finalmente cuál es el procedimiento mate-mático más adecuado para la aproximación al tamaño de muestra requerido.En otras palabras, más importante que la fórmula, es conocer los aspectosque determinan las diferencias en el tamaño de la muestra para el estudio quese realizará. De no ser así, un estudio bien concebido alrededor de unahipótesis de gran interés en nuestra área, podría venirse abajo por no tener encuenta los tópicos que se describirán posteriormente.

Todo libro o artículo que trate sobre el tema del cálculo del tamaño de lamuestra tiene como base los siguientes conceptos :

- Error Tipo I o Alfa.

- Error Tipo II o Beta.- Poder.

Page 3: Calculo Del TamaÑo de La Muestra

Rev. Col. Psiquiatría, Vol. XXVII, No. 2, 1998. 133

Tamaño de la muestra

- Variabilidad.

- Diferencia clínica y estadísticamente significativa.

El presente trabajo no pretende agotar el tema sino dar las bases para que ellector pueda profundizar en esta área, sugiriendo a los intesados algunabibliografía de profundización. (5 ,6 ,7 ,8).

CONCEPTOS BASICOSCONCEPTOS BASICOSCONCEPTOS BASICOSCONCEPTOS BASICOSCONCEPTOS BASICOS

Siempre que un investigador inicia un estudio debe tener una pregunta bienestablecida de la cual deriven hipótesis susceptibles de ser rebatidas oconfirmadas.

Por ejemplo, un investigador se plantea la siguiente pregunta: ¿Entre lapsicoterapia cognoscitiva y la psicoterapia de orientación dinámica, cuál esmás efectiva para el tratamiento a mediano plazo (1 año) de pacientes conTrastorno Hipocondríaco?

A partir de esta pregunta se puede postular una hipótesis de trabajo entérminos que se pueda rebatir, lo cual equivale a lo que conocemos en ellenguaje médico y estadístico como Hipótesis Nula. Esta podría plantearseasí:

Ho: �No hay diferencias en la eficacia de la psicoterapia cognoscitiva y la deorientación dinámica para el tratamiento a mediano plazo del TrastornoHipocondríaco�.

A su vez la Hipótesis Alternativa, que aceptaríamos en caso de rechazar lanula, podría ser planteada de las siguientes forma:

H1: �La psicoterapia cognoscitiva es más eficaz que la psicoterapia deorientación dinámica para el tratamiento a mediano plazo del TrastornoHipocondríaco�

H2: �La psicoterapia de orientación dinámica es más eficaz que la psicotera-pia cognoscitiva para el tratamiento a mediano plazo del Trastorno Hipocon-dríaco�

H3: �Existen diferencias significativas entre la eficacia de la psicoterapiacognoscitiva y la psicoterapia de orientación dinámica para el tratamiento amediano plazo del Trastorno Hipocondríaco�.

De acuerdo con esto podemos construir una tabla que nos represente todaslas opciones, teniendo en cuenta que existe una verdad absoluta a la cual cadaestudio intenta aproximarse con mayor o menor éxito (Tabla 1).

En la tabla podemos observar que tomamos la decisión correcta cuando losresultados del estudio corresponden a la verdad en la población. En casocontrario incurriríamos en errores, que son precisamente, los que intentamosminimizar cuando calculamos correctamente el tamaño de muestra. Estosconceptos se describen a continuación:

1 - Error Tipo I, o Falso Positivo, o Error Tipo Alfa1 - Error Tipo I, o Falso Positivo, o Error Tipo Alfa1 - Error Tipo I, o Falso Positivo, o Error Tipo Alfa1 - Error Tipo I, o Falso Positivo, o Error Tipo Alfa1 - Error Tipo I, o Falso Positivo, o Error Tipo Alfa:

Refiriéndonos al ejemplo citado, supongamos que en realidad la terapiacognoscitiva es tan efectiva como la de corte dinámico en el tratamiento del

Page 4: Calculo Del TamaÑo de La Muestra

Gómez C. y Sánchez R.

134 Rev. Col. Psiquiatría, Vol. XXVII, No. 2, 1998.

Trastorno Hipocondríaco, pero que en el estudio concluimos que la primeraes más efectiva que la de corte dinámico. Esto quiere decir que rechazamosla hipótesis nula de no diferencias entre las dos terapias (que es la verdad) yaceptamos erróneamente la hipótesis alternativa que establece una mayorefectividad para la terapia cognoscitiva en el manejo del Trastorno Hipocon-dríaco.

En este caso estamos incurriendo en lo que se denomina un Error tipo I. Seconcluye falsamente que una terapia es mejor que la otra cuando en realidadno lo es. Ahora, este error que medimos a través del nivel Alfa o del nivel designificación P puede ser, de acuerdo con el estudio, más o menos indesea-ble. Por ejemplo, si tenemos un medicamento X que es tan eficaz para eltratamiento de la Esquizofrenia Indiferenciada como los fármacos ya dispo-nibles, pero que es costoso o posee algún potencial de efectos secundariosserios y por error decimos que es mejor que los otros (se rechaza equivoca-damente la hipótesis nula de no diferencias), se podría estar aconsejando unmedicamento que incrementa gastos y otros problemas al paciente, lo cuala todas luces resulta indeseable.

Como se mencionó, el Error Tipo I ha sido medido con el nivel alfa o nivel designificación P que se define como la probabilidad, habitualmente menor del5 %, de obtener un resultado tan extremo o más que el encontrado por azar.Dicho de otra forma, la probabilidad de encontrar el resultado del estudio porazar es tan pequeña (menor del 5%) que se puede asumir que esta diferenciaes debida a la intervención o al tratamiento realizado.

Tradicionalmente y por consenso, en la literatura biomédica el nivel de P, onivel de significación, o alfa se ha establecido en el 5 % y ningún resultado porencima de este nivel es aceptado como positivo, por el riesgo de incurrir enError de Tipo I. Este nivel del 5 % (p< 0.05) sería aquel por debajo del cual serechazaría la hipótesis nula de no diferencias entre grupos. Por otra parte, paraestudios con comparaciones múltiples, se ha establecido que la realización depruebas estadísticas repetidas lleva a que por simple azar alguna de ellas sea

Tabla 1

RESULTADOS POSIBLES EN UN ESTUDIO

VERDAD EN LA POBLACI ÖN

RESULTADOSDEL

ESTUDIO

HIPOTESIS NULACORRECTA

( X=Y)

HIPOTESIS ALTERNACORRECTA

( X ¹ Y )

HIPOTESIS NULACORRECTA

( X=Y)Verdadero Negativo

Error Tipo II oFalso Negativo o

Beta

HIPOTESIS ALTERNACORRECTA

( X ¹ Y )

Error Tipo I oFalso Positivo o

AlfaVerdadero Positivo

Page 5: Calculo Del TamaÑo de La Muestra

Rev. Col. Psiquiatría, Vol. XXVII, No. 2, 1998. 135

Tamaño de la muestra

positiva. Por tal razón hay una tendencia cada vez mayor a disminuir el valorde p a nivel de p< 0.001 (1 %) (9).

Para reducir el Error Tipo I se requiere incrementar el tamaño de la muestra,cuestión que implica un costo adicional para el investigador. De esta forma,una sencilla regla es que a menor Alfa o p se incrementa el número de sujetosrequeridos para el estudio.

2- Error Tipo II, o Falso Negativo, o Error Tipo Beta:2- Error Tipo II, o Falso Negativo, o Error Tipo Beta:2- Error Tipo II, o Falso Negativo, o Error Tipo Beta:2- Error Tipo II, o Falso Negativo, o Error Tipo Beta:2- Error Tipo II, o Falso Negativo, o Error Tipo Beta:

Como se planteó anteriormente, resulta inconveniente concluir que haydiferencias estadísticamente significativas cuando en realidad no las hay. Sinembargo lo contrario también es cierto. ¿Qué ocurriría si teniendo un trata-miento altamente efectivo para el manejo de Trastornos Fóbicos específicosconcluyéramos que no es diferente o que es equivalente a otros tratamientosconvencionales? Este es el que llamamos Error Tipo II o Beta que simplementesignifica que falsamente aceptamos la Hipótesis Nula y descartamos laHipótesis Alterna cuando realmente existen diferencias entre los grupos. Estasituación traería, como es obvio, consecuencias éticas evidentes.

Podemos definir el error tipo Beta como la máxima probabilidad que se estadispuesto a arriesgar por un resultado falso negativo. Al igual que con el Alfa,se ha establecido un nivel máximo de Beta tolerable, que de acuerdo con lacomunidad científica es del 0.20 (20 % ). Dicho de otra manera, es buenodesconfiar de todo estudio que nos sugiera una probabilidad mayor del 20 %de que sus resultados sean falsos negativos.

Por otra parte, y al igual que con el Error Tipo I, en la medida en que deseemosdisminuir la posibilidad de error de falsos negativos, por ejemplo, un Beta del10 % (0.1) en lugar del 20% (0.2), se requiere un tamaño de muestra mayor. Esel precio por disminuir el margen de error y tener así mayor certeza en losresultados.

3- Poder del Estudio:3- Poder del Estudio:3- Poder del Estudio:3- Poder del Estudio:3- Poder del Estudio:

Intimamente ligado al concepto de Error Tipo II esta el de Poder de un estudioque matemáticamente lo podríamos definir como:

Poder = 1 - Beta

Como puede verse, el Poder depende enteramente del nivel de Beta fijado porel investigador. Teniendo en cuenta un máximo tolerable del 20% (0.2), setendrá un poder del 80% (0.80). La anterior fórmula también permite apreciarque al disminuir el Error Tipo II se aumentará el Poder del estudio para detectardiferencias.

Otra forma de interpretar el Poder o Sensibilidad es considerarlo como lacapacidad del estudio para detectar diferencias significativas entre los gru-pos, sí es que estas existen. Por ejemplo, un estudio con un poder del 80% tieneuna probabilidad de 0.8 de detectar diferencias sí las hay. Ahora, si deseamostener un poder mayor (0.9, 0.95, etc.) se requerirían muestras de un tamañosuperior.

Page 6: Calculo Del TamaÑo de La Muestra

Gómez C. y Sánchez R.

136 Rev. Col. Psiquiatría, Vol. XXVII, No. 2, 1998.

Algunos autores (10 ,11 ,12) sugieren la importancia de determinar como noconclusivos aquellos trabajos o estudios que no hubiesen podido rechazar lahipótesis nula y que tengan un poder menor del 60%. En esta línea Freiman,Chalmers y Colaboradores (1) reportan que 50 de 71 ensayos clínicos contro-lados publicados en el New England Journal of Medicine carecían del podersuficiente para detectar amplias diferencias entre grupos. Lo anterior nosobliga a pensar en el concepto de poder del estudio cada vez que se debantomar decisiones clínicas basadas en artículos o publicaciones médicas.

4- Variabilidad:4- Variabilidad:4- Variabilidad:4- Variabilidad:4- Variabilidad:

Esta se refiere a la dispersión de los datos que se esperan encontrar.Estadísticamente se representa por la varianza y su raíz cuadrada (desviaciónestándar). A menor dispersión de los resultados, será más fácil diferenciar ungrupo de otro, puesto que cada uno conformará conglomerados alrededordel promedio y así no se confundirán los hallazgos de un grupo y del otro.

Estadísticamente se ha comprobado que al incrementar el número desujetos, los resultados tienden a agruparse con mayor probabilidad alrededordel promedio y a variar cada vez menos. A la inversa, con pocos sujetos, lasmediciones tienden a variar más y por lo tanto a confundirse, más fácilmente,con las mediciones del otro grupo.

De esta forma podemos concluir que a mayor variabilidad esperada de losresultados se requerirá de un mayor tamaño de muestra que lleve a discrimi-nar los grupos participantes y evidenciar las diferencias entre estos. Por otrolado, si se espera un desenlace con escasa variación, la muestra requeridatenderá a ser menor.

5- Diferencias estadística y clínicamente significativas:5- Diferencias estadística y clínicamente significativas:5- Diferencias estadística y clínicamente significativas:5- Diferencias estadística y clínicamente significativas:5- Diferencias estadística y clínicamente significativas:

Tradicionalmente se nos ha enseñado la importancia de hallar una diferenciaestadísticamente significativa y es así como muchos colegas se enorgullecendiciendo que los resultados de su estudio lo son. Habremos oído o leídorepetidamente que se da un gran valor a un hallazgo que resulte significativoa un nivel de p menor al 5 o 1% (p< 0.05 ó 0.01).

Tabla 2RESULTADOS: ESTUDIO COMPARATIVO DE DOS ANTIDEPRESIVOS

PARA EL MANEJO DE LA DEPRESIÓN MAYOR

Puntajes dedepresión-escala de

Hamilton paradepresión

Tratamientoantidepresivo A

Tratamientoantidepresivo B

Nivel Basal - HAM-D 28 28

Nivel Final - HAM-D 10 8

N = 130 pacientes en cada Grupo

Page 7: Calculo Del TamaÑo de La Muestra

Rev. Col. Psiquiatría, Vol. XXVII, No. 2, 1998. 137

Tamaño de la muestra

Antes de discutir estas afirmaciones, sería útil comentar un estudio quecomparaba la eficacia de dos antidepresivos para el tratamiento de laDepresión Mayor y cuyo desenlace fue medido a través de los puntajesobtenidos en la Escala de Hamilton para depresión arrojando los resultadosque se presentan en la Tabla 2:

El estudio informaba diferencias estadísticamente significativas (p< 0.05) quefavorecían la terapia con el antidepresivo B, a partir de lo cual concluyeron losautores que se debería utilizar este medicamento como tratamiento deelección.

En este punto vemos que ciertamente ambos antidepresivos fueron útilespara reducir los puntajes en la Escala de Hamilton (de 28 a 10 y de 28 a 8). Sinembargo se podría plantear: ¿es relevante clínicamente una diferencia de 2puntos (10 vs 8) en el HAM-D? Posiblemente la mayoría de colegasresponderán que no. Con este ejemplo se quiere ilustrar que no siempre lo quees estadísticamente significativo tiene importancia clínica. No obstante, todadiferencia que sea clínicamente relevante lo debe ser desde el punto de vistadel análisis estadístico. Si complicamos un tanto el ejemplo y agregamos quela droga A tiene un costo 3 veces menor que la droga B, ¿Cuál se recetaría?.

Con lo anterior se intenta demostrar que para el cálculo del tamaño de lamuestra se debe conocer de antemano, no sólo el valor de la diferencia queestadísticamente consideremos significativa y que está fijada por el alfa o valorde p en 1 o 5 %, sino la diferencia que se espera encontrar entre los grupos,también relevante clínicamente. Así, en el ejemplo anterior, dado el costodiferencial de las drogas (mayor 3 veces para el medicamento B), se podríasuponer que una diferencia de menos de 7 a 10 puntos a favor del tratamientoB no sería clínicamente importante. Esta última (mínima diferencia clínica-mente significativa ) es determinada por el investigador o por el consenso queexista en la literatura médica en ese momento, consideración que, obviamen-te, repercute en el tamaño de la muestra escogida.

En resumen, cuando deseamos detectar diferencias grandes entre grupos senecesitan pocos pacientes o muestras pequeñas y si se desea detectardiferencias pequeñas se requieren muestras grandes.

PROCEDIMIENTOS BÁSICOS PARA CALCULAR EL TAMAÑO DE LAPROCEDIMIENTOS BÁSICOS PARA CALCULAR EL TAMAÑO DE LAPROCEDIMIENTOS BÁSICOS PARA CALCULAR EL TAMAÑO DE LAPROCEDIMIENTOS BÁSICOS PARA CALCULAR EL TAMAÑO DE LAPROCEDIMIENTOS BÁSICOS PARA CALCULAR EL TAMAÑO DE LAMUESTRAMUESTRAMUESTRAMUESTRAMUESTRA

El proceso de selección de una muestra se basa en dos aspectos:

1. Se desea conocer alguna característica de una población y el tamaño deesa población es tan grande que resulta muy difícil hacer la medición en cadauno de los miembros de ella.

2. Trabajar con una muestra puede tener una buena aproximación a lacaracterística de la población que se quiere conocer, con la ventaja de ahorrartiempo y recursos.

Por ejemplo, si el propósito es conocer la estatura promedio de los colombia-nos, se pueden hacer dos cosas:

Page 8: Calculo Del TamaÑo de La Muestra

Gómez C. y Sánchez R.

138 Rev. Col. Psiquiatría, Vol. XXVII, No. 2, 1998.

1. Tomar la estatura de todos y cada uno de los colombianos y calcular el valorpromedio.

2. Tomar una muestra de colombianos y calcular el valor promedio de esamuestra.

El valor encontrado en el primer caso es el valor real y se denominaParámetroParámetroParámetroParámetroParámetro.

En el segundo caso tendremos un valor aproximado al valor real que sedenomina EstimadorEstimadorEstimadorEstimadorEstimador.

En la notación utilizada en publicaciones sobre estos temas los Parámetros serepresentan con letras griegas y los Estimadores con letras latinas. En elejemplo que se vinen manejando el valor real del promedio de estatura de loscolombianos se denota como m y el valor que arroja la muestra, es decir elEstimador, se denota como x.

Vemos que en muchos casos obtener el verdadero valor de una población(Parámetro) es prácticamente imposible debido a lo difícil que resulta hacerla medición en un número muy grande de personas. Por esta razón se debetrabajar con una muestra que permita obtener un Estimador lo más cercanoposible al Parámetro. Para lograrlo se deben dar dos condiciones:

1. Asegurar un adecuado proceso de muestreo: Los resultados del procesode muestreo serán válidos sólo si se parte de la certeza de contar con unamuestra que satisfaga las condiciones exigidas por la inferencia (13). Porejemplo, si en una muestra se incluye únicamente los habitantes de Neiva, oexclusivamente mujeres, no se obtendrá un buen Estimador del Parámetro.

2. Obtener un buen tamaño de muestra: Entre mayor el número de sujetosseleccionados más cerca estará el Estimador del Parámetro. La clave en estasituación es obtener un número suficientemente grande de casos de maneraque se logre un satisfactorio nivel de precisión.

El obtener un buen Estimador permite sacar conclusiones que sean aplicablesa toda la población de la cual se obtuvo la muestra. Los estudios en los cualesse maneja este propósito se pueden enmarcar dentro de dos categorías:

1. Estudios para estimar alguna característica de la población: Por ejemploconocer el porcentaje de personas esquizofrénicas que hay en Bogotá(estimación de una proporción) o la edad promedio de inicio del primerepisodio depresivo en los habitantes de Cali (estimación de una media).

2. Estudios para evaluar diferencias: Es el caso de un estudio que buscadiferencias en los puntajes promedio de una escala de depresión luego deadministrar un tratamiento farmacológico (diferencia de medias), o de unestudio que pretende evaluar cambios en la prevalencia de hechos violentosdespués de aplicar un programa educativo en las escuelas de una ciudad(diferencia de proporciones).

Con base en lo anterior se plantearán las estrategias elementales para elcálculo del tamaño de la muestra en estas dos situaciones (14) :

Page 9: Calculo Del TamaÑo de La Muestra

Rev. Col. Psiquiatría, Vol. XXVII, No. 2, 1998. 139

Tamaño de la muestra

11111. Estudios de estiEstudios de estiEstudios de estiEstudios de estiEstudios de estimación de características poblacionalesmación de características poblacionalesmación de características poblacionalesmación de características poblacionalesmación de características poblacionales:

Los Estimadores de estas características deben tener un determinado nivel deprecisión. Esta precisión se mide con los intervalos de confianza: entre másestrecho el intervalo, mayor será la precisión. Un intervalo de confianza del 95%entre «x» y «y» quiere decir que si se repite el procedimiento de selección demuestra y de medición 100 veces, en 95 oportunidades el verdadero valor seencontrará entre las cantidades «x» y «y».

1.1. Estimación de un promedio: para calcular el tamaño de la muestra en estacircunstancia se necesita conocer:

1.1.1 La amplitud del intervalo de confianza (∆).

1.1.2. Un estimativo de la desviación estándar de las observaciones (S)

1.1.3. El nivel de confianza (100 (1-α )%). Generalmente se establece enel 95 ó 99 %.

1.1.4. Los valores de f (1-α): son valores constantes que, dependiendodel nivel de confianza se establecen en:

Para el 90% de nivel de confianza 2,706.

Para el 95% de nivel de confianza 3,842.

Para el 99% de nivel de confianza 6,635.

La fórmula utilizada para el cálculo respectivo es:

n=S 2/∆2 f (1-α)

Como ejemplo para ilustrar este cálculo, supongamos que se ha diseñado unestudio en el cual se pretende determinar la edad promedio de los consumi-dores de basuco en un sector de Bogotá. Se desea que el estimativo delpromedio tenga una probabilidad del 95% de estar 3 años por encima o pordebajo del verdadero valor. Con estos datos efectuamos los siguientescálculos:

n=152/32 x 3,842= 225/9 3,842= 96

para este estudio se necesita una muestra de 96 habitantes del sector.

1.2. Estimación de una proporción (15)): para este cálculo se necesita conocer:

1.2.1 La amplitud del intervalo de confianza (∆).

1.2.2 Un estimativo de la desviación estándar de las observaciones (S)

1.2.3 El nivel de confianza (100 (1-α )%). Generalmente se establece enel 95 ó 99 %.

1.2.4 Los valores de f (1-α ) mencionados previamente.

La fórmula utilizada es la siguiente:

n= P(100-P)/∆2 f(1-α)

Page 10: Calculo Del TamaÑo de La Muestra

Gómez C. y Sánchez R.

140 Rev. Col. Psiquiatría, Vol. XXVII, No. 2, 1998.

A manera de ejemplo, supongamos que se desea conocer la proporción defumadores en el grupo de estudiantes que ingresan a primer semestre en unauniversidad. Se cree que el estimativo de esa proporción será de aproxima-damente 30% y se espera que el resultado tenga una probabilidad del 95% deestar 4% por encima o por debajo del verdadero valor. Con estos datos serealizan los siguientes cálculos:

n=30(100-30)/42 x 3,842= 2100/16 x 3,842= 504

Se necesita una muestra de 504 estudiantes.

22222. Estudios para evaluar diferenciasEstudios para evaluar diferenciasEstudios para evaluar diferenciasEstudios para evaluar diferenciasEstudios para evaluar diferencias:

2.1. Diferencia entre medias: los datos que se necesitan para el cálculo son:

2.1.1 El tamaño de la diferencia que clínicamente me interesa (∆)

2.1.2 Un estimativo de la desviación estándar de las observaciones (S).

2.1.3 Un nivel de significación o de error tipo I aceptable (generalmente0.05 ó 0.01).

2.1.4 Definir si se pretende establecer diferencia en cualquier sentido, esdecir que no interesa si un promedio es mayor que otro siempre y cuando seandiferentes (Hipótesis a dos colas), o probar una diferencia en un solo sentido,es decir que se está interesado en demostrar que uno de los promedios esmayor que el otro (hipótesis a una cola).

2.1.5 El poder requerido, usualmente 80%.

Con los elementos anteriores se aplica la siguente fórmula:

n=2S 2/∆2 f (α-β)

Los valores f(α,β) se toman de la siguiente tabla (16) :

Nivel de significación alfa

Poder, 1 - βUna cola Dos colas

0.05 0.01 0.05 0.01

0.8 6.18 10.04 7.85 11.68

0.9 8.56 13.02 10.51 14.88

Por ejemplo, se desea evaluar si una intervención educativa puede mejorar en5 puntos el CI de niños de escuelas distritales de Bogotá y se tiene el dato quela desviación estándar del CI en niños de esas características es 10, y lo quese pretende evaluar, es si el CI es mayor después de la intervención educativa,se tiene una hipótesis a una cola.

Usando un nivel de significación del 0.05% y un poder del 80%, los cálculos sonlos siguientes:

n= 2 X 102/ 52 X6,18=50

Page 11: Calculo Del TamaÑo de La Muestra

Rev. Col. Psiquiatría, Vol. XXVII, No. 2, 1998. 141

Tamaño de la muestra

Se requieren 50 niños para hacer el estudio.

2.2. Diferencia entre proporciones: los datos que que requieren para el cálculoson:

2.2.1 Un estimativo de la proporción en cada uno de los grupos (P1 yP2).

2.2.2 El nivel de significación o de error tipo I aceptable (generalmente0.05 ó 0.01).

2.2.3 Definir si se propone establecer diferencia en cualquier sentido, esdecir que no interesa si una proporción es mayor que la otra, siempre y cuandosean diferentes (Hipótesis a dos colas) o interesa probar una diferencia en unsolo sentido, es decir, se pretende demostrar, por ejemplo, que una de lasproporciones es mayor que la otra (hipótesis a una cola).

2.2.4 El poder requerido, usualmente 80%.

Con estos datos se utiliza la siguiente fórmula:

n= P1(100-P1)+P2(100-P2)/(P1-P2)2 X f(α,β)

Se quiere evaluar un programa psicoeducativo para mejorar la adherencia altratamiento en pacientes deprimidos. Calculando que la no adherencia puedareducirse de un 40 a un 35%, se establece una hipótesis a dos colas (tambiénse espera detectar si el programa produce un efecto paradójico), y sedetermina un nivel de significación del 0.005, con un poder del 0.9. Loscálculos son los siguientes:

n= (40X60)+(35X65)/52 X 7,85+ 1.468

En este caso se necesita un número de pacientes muy grande (1.468), por locual es necesario buscar estrategias que reduzcan el tamaño de la muestra.Lo más sencillo seria aumentar el tamaño de la diferencia que se busca,aceptando una disminución del 10%, el tamaño de la muestra resultante seráde 353 pacientes.

Los métodos aquí presentados corresponden a las técnicas básicas aplica-das a diseños de investigación elementales. Existen métodos más precisos yaplicaciones específicas para diseños metodológicos particulares, que so-brepasan la intención del presente escrito pero que pueden ser utilizadas sindificultad cuando se conocen los principios básicos enunciados en este texto(17,18,19) .

Puede agilizarse, e incluso obviarse, los cálculos respectivos utilizando pro-gramas de computación, dentro de los cuales uno de los más ampliamentedifundidos, por su disponibilidad y facilidad, es EpiinfoEpiinfoEpiinfoEpiinfoEpiinfo. Este programapuede descargarse sin ningún costo desde la dirección http://www.cdc.gov/epo/epi/downepi6.htm. También existe una versión española del programaque se puede obtenerser sin ningún costo en la dirección http://www.cica.es/aliens/sveacsa/epiinfo.htm. El programa dispone de varios módulos paracalcular tamaños de muestras tales como Statcalc (permite hacer cálculospara encuestas poblacionales, para estudios transversales, de cohortes y de

Page 12: Calculo Del TamaÑo de La Muestra

Gómez C. y Sánchez R.

142 Rev. Col. Psiquiatría, Vol. XXVII, No. 2, 1998.

casos y controles no apareados), Epitable (dispone de comandos paracalcular tamaño y poder de muestras) y CSample.

REFERENCIAS

1 Freiman JA, Chalmers TC y Cols. The importance of Beta, the type II errors and thesample size in the design and interpretation of the randomized controlled trial. N EnglJ Med 1978; 299: 690-4, .

2 Dupont WD. y Plummer WD. Power and Sample Calculations: A Review and aComputer Program. Controlled Clinical Trials 1990; 11:116-128.

3 Browner WS. Newman TB y Cols. Getting Ready to Estimate Sample Size:Hypothesisand Underlying Principles. En: Hulley, Stephen y Cummings, Steven R. DesigningClinical Research. Baltimore: Williams y Wilkins, 1988; Pp.128 -138.

4 Lachin JM. Introduction to Sampole Size determination and Power Analysis forClinical Trials. Controlled Clin Trials 1981; 2: 93-114,

5 Ingelfinger JA, Mosteller F, Thibodeau LA y Col. Biostatistics in Clinical Medicine. NewYork: Macmillan Publishing Co. Inc.,1983.

6 Kelsey Jl, Thompson W D y Evans A S. Methods in Observational Epidemiology. NewYork: Oxford University Press, 1986.

7 Schlesselman JJ. Case Control Srtudies.New York: Oxford University Press, 1982.

8 Rosner B. Fundamentals of Biostatistics.Belmont: Duxburry Press, 1990.

9 Dennis R. Como estimar el Tamaño de Muestra necesario en InvestigacionesHumanas. Unidad de Epidemiología Clínica. Pontificia Universidad Javeriana.

10 Henneckens C H y Mayrent S L. Epidemiology in Medicine. Boston: Little, Brown andCompany, 1987.

11 Guyatt GH, Sackett DL. y Cols. User´s Guides to the Medical Literature: How to Usean article about Therapy or Prevention. Are the Results of the Study Valid. JAMA 1993;270.(21): 2598-2601.

12 Guyatt GH, Sackett DL. y Cols. User´s Guides to the Medical Literature: How to Usean article about Therapy or Prevention. What were the Results and will they help mein Caring for my Patients? JAMA 1994: 271(1): 59-63.

13 Bautista L. Diseños de Muestreo Estadístico. Bogotá: U.N. de Colombia: 1998.

14 Machin D,Campbell M, Fayers P, Pinol A. Sample Size Tables for Clinical Studies.London: Blackwell Science, 1987.

15 Kahn HA, Sempos CT. Statistical Methods in Epidemiology. New York: OxfordUniversity Press, 1989.

16 Dobson AJ. Calculating Sample Size. Transac. Menzies Found 1984; 7:75-79.

17 Schelesselman JJ. Sample Size Requirements in Cohort and Case-Control Studiesof Disease. Am J Epidemiology 1974;99:381-384.

18 Donner A, Eliasziw M. Sample Size Requirements for Realibility Studies. Statistics inMedicine 1987; 6:441-448.

19 Connett JE,Smith JA, McHugh B. Sample Size and Power for Pair-Matched Case-Control Studies. Statistics in Medicine 1987;6:53-59.