15 conceptos estad´siticos básicos en psicometría y en interpretación de resultados...

7/23/2019 15 conceptos estadsiticos bsicos en psicometra y en interpretacin de resultados psicomtircos

1/7

CAPTULO 15

Conceptos estadsticosbsicos en psicometray en interpretacin

de resultados psicomtricos


2/7

15.1. Practicabilidad o viabilidad (feasibility)

Un instrumento es practicable o viable si, dadas sus caractersticas tcnicas modo de administracin, tiemponecesario para su cumplimentacin,comprensibilidad por parte de los sujetos entrevistados, etc., tiene una ele-

vada probabilidad de ser utilizado de forma correcta.

21115. Conceptos estadsticos bsicos en psicometra y en interpretacin de resultados psicomtricos


3/7


4/7

15.3. Validez (validity)

La validez es el conjunto de pruebas y datos que han de recogerse para garantizar que las inferencias que se rea-lizan a partir de los resultados obtenidos con el instrumento de medida son pertinentes(Muiz J,1998). En realidad,

lo que se valida son las inferencias, ms que el instrumento.

Existen distintos tipos de validez:

Validez de contenido (content validity): se refiere al hecho de que el instrumento de medida es una muestra ade-cuada y representativa de los contenidos que se pretenden evaluar con l.

Para lograr la validez de contenido se suele recurrir a mtodos indirectos, como anlisis racional de los conte-nidos posibles, opinin de los expertos en el rea, listados con los elementos ms importantes del constructoque se va a medir y comprobar que todos estn incluidos proporcionalmente en el instrumento de medida, etc.

La validez aparente es un tipo de validez de contenido que consiste en que el test ha de aparentar que mide lo

que en realidad pretende medir. Los sujetos a los que se les aplica el instrumento han de sentir que es adecuadopara medir lo que se pretende (depresin, funcionamiento, etc.).

Validez predictiva, criterial o de pronstico (predictive validity): es el grado de eficacia con que se puede predeciro pronosticar un criterio (p. ej., enfermo o no) a partir de las puntuaciones obtenidas en el instrumento.

Validez de constructo (construct validity): hace referencia a la existencia de un concepto o constructo que sustente

el instrumento. Existen distintos tipos de validez de constructo:

Validez interna (internal validity): se refiere al nmero de dimensiones clnicas que subyacen al instrumento. Uno de sus indicadores es el coeficiente de homogeneidad de Loevinger, que expresa el grado en que los

tems se ordenan por rangos.

Un valor aceptable de este coeficiente es 0,40; indica unidimensionalidad, es decir, que la suma totalde las puntuaciones en cada uno de los tems del test es un estadstico suficiente.

Validez factorial: se refiere al grado de coherencia o convergencia entre la o las dimensiones del instrumentode medida y el o los constructos que subyacen al instrumento.

Se calcula mediante el anlisis factorial.

Validez convergente: es el grado de convergencia entre las medidas de un instrumento de evaluacin y otrasmedidas con las que se supone que dicho instrumento debe estar relacionado. Se calcula mediante el coeficiente de correlacin.

Validez discriminante (discriminant validity): es la capacidad de un instrumento de evaluacin para detectar dife-rencias entre dos grupos criterio.



5/7

15.4. Curvas de rendimiento diagnstico(curvas ROC o response operating characteristics curve)

Se utilizan para aquellos instrumentos de evaluacin que producen resultados continuos (p. ej., puntuacinen la Escala de Hamilton para la Depresin). El rendimiento de estos instrumentos, entendido como la capaci-

dad de clasificar correctamente a un sujeto determinado como sano o como enfermo, depende de dnde se sitael punto de corte, tal como vemos en el siguiente ejemplo.

El punto de corte recomendado para la versin espaola de la Escala de Hamilton para la Depresin es 7/8, donde

puntuaciones comprendidas entre 0 y 7 son compatibles con no depresin y puntuaciones> 7 son compatiblescon depresin de distinta gravedad.

Si desplazamos este punto de corte a 6/7, estamos considerando como posibles enfermos a personas que pun-ten 7 o ms, con lo que captaremos a ms pacientes que con el punto de corte tradicional. Es decir, estamos

mejorando la sensibilidad del instrumento capacidad del instrumento de identificar a los verdaderamenteenfermos. En contrapartida, al bajar el punto de corte estamos considerando que slo estn sanos los que

punten entre 0 y 6, con lo que incluiremos en el grupo de enfermos a personas sanas; as,estamos reduciendola especificidad de la escala la capacidad del instrumento para detectar a los verdaderos sanos. Sensibilidad y especificidad son dos parmetros que siempre estn inversamente relacionados; al mejorar

uno empeoramos el otro.Sus valores oscilan entre 0 y 1. En el caso hipottico de un test perfecto,que cla-sificara a todos los sujetos bien (a los sanos como sanos y a los enfermos como enfermos), los valores deambos indicadores seran 1.

Las curvas ROC permiten establecer el punto de corte ptimo, definido como aquel que permite clasificar correc-

tamente al mayor nmero de sujetos. Para ello el parmetro que se utiliza es el de rea bajo la curva.

El rea bajo la curva es la probabilidad de que ante 2 sujetos, uno sano y otro enfermo, el test los clasifiquecorrectamente. Los valores posibles del rea bajo la curva oscilan entre 1 (test perfecto) y 0,5 (test intil).

214 Banco de instrumentos bsicos para la prctica de la psiquiatra clnica


6/7

15.5. Tamao del efecto

Recientemente, la American Psychological Association (APA, 1996) inst a los investigadores a caracterizarmejor los tests inferenciales. Es decir, adems del valor de lapse debe proporcionar la direccin y el tamao del

efecto.

El tamao del efecto es un indicador de la magnitud de la significacin estadstica. Proporciona la primeraevaluacin de la importancia prctica de un hallazgo. Algunos autores proponen que debera facilitarse tam-bin aunque lapno sea significativa, y que incluso debera ser el primer dato que se facilitase en cualquierinvestigacin, y no lap(McCartney y Rosenthal, 2000).

Interpretacin del tamao del efecto:

Pequeo: valores< 0,4.

Moderado: valores comprendidos entre 0,4 y 0,79.

Grande: valores 0,8.

A continuacin se describen brevemente algunos ejemplos de indicadores del tamao del efecto:

Coeficiente de correlacin de Pearson: indica la direccin y la magnitud del efecto. Lo da directamente el test.

Ejemplo: el coeficiente de correlacin de Pearson entre la puntuacin global en la Escala de Hamilton parala Depresin y la puntuacin en la dimensin de vitalidad del SF-36 es de 6.547 (p= 0,003). Al ser la

p< 0,05, sabemos que es estadsticamente significativo.El coeficiente de correlacin de Pearson indica quela magnitud de la asociacin entre estas dos variables es moderada y que la direccin es inversa, es decir,

que al aumentar la puntuacin en la escala de Hamilton para la Depresin cabe esperar que disminuya lapuntuacin en la dimensin de vitalidad del SF-36.

Coeficiente dde Cohen: debe calcularse. Es la diferencia estandarizada entre medias. Ejemplo: en un ensayo clnico doble ciego, aleatorizado y controlado con placebo, las puntuaciones en la

Escala de Hamilton para la Depresin del grupo en tratamiento con el principio activo son: visitabasal = 34; visita en la semana 8 = 12. Por su parte, las puntuaciones del grupo tratado con placebo son:visita basal = 33; visita en la semana 8 = 26.

Tamao del efecto = Cambio en las puntuaciones del grupo principio activo cambio en las puntuacio-nes del grupo placebo/desviacin estndar agregada= (34 12) (33 26)/desviacin estndar agre-

gada = 22 7/desviacin estndar agregada.



7/7

REFERENCIAS COMPLEMENTARIAS

American Psychological Association Board of Scientific Affairs.Task Force on Statistical Inference initial report.Was-hington, DC: American Psychological Association, 1996.

Bech P, Licht RW, Stage KB,Abildgaard W, Bech-Andersen G, Sondergaard S, Martiny K. Kompendium.Rating Sca-les for Affektive Lidelser (2., revideret oplag). Hillerod: Psykiatrisk Forskningsenhed, 2005.

McCartney K, Rosenthal R. Effect size,practical importante, and social policy for children. Child Development 2000;

71: 173-180.Muiz J. Teora clsica de los tests. Madrid: Pirmide, 1998.Schmidt FL, Hunter JE. Measurement error in psychological research: lessons from 26 research scenarios. Psychol

Meth 1996; 1: 199-223.

Sijtsma K, Molenaar IW. Introduction to nonparametric item response theory. London: Sage Publications, 2002.Silva F. Evaluacin conductual y criterios psicomtricos. Madrid: Pirmide, 1989.Streiner DL. Starting at the beginning: an introduction to coefficient alpha and internal consistency. J Personality

Assessm 2003; 80: 99-103.

216 Banco de instrumentos bsicos para la prctica de la psiquiatra clnica

15 conceptos estad´siticos básicos en psicometría y en interpretación de resultados...

Documents

Transcript of 15 conceptos estad´siticos básicos en psicometría y en interpretación de resultados...