Post on 07-Jan-2016
description
MASTER EN METODOLOGA DE LAS CIENCIAS DEL COMPORTAMIENTO Y DE LA SALUD
1
INFERENCIA ESTADSTICA
Dra. C. San Lus Costas
Dr. A. Lpez de la Llave
Inferencia Estadstica: es un conjunto de procedimientos basados en los modelos
de probabilidad mediante los cuales se pueden realizar validaciones relativas a la
existencia, explicacin y/o prediccin de algn fenmeno de inters a nivel poblacional
con base en la informacin extrada de una muestra de cumple determinadas
caractersticas. Este conjunto de procedimientos se agrupan en dos categoras:
Estimacin de parmetros y Tcnicas de Contraste de Hiptesis (tambin llamadas
Contrastes de Significacin). Sobre Estimacin de Parmetros (tanto puntual como por
intervalos) nos remitimos al apartado anterior dedicando este a los denominados
contrastes de hiptesis o pruebas de significacin.
En principio vamos a definir un modelo como una aproximacin a la
realidad que permite comprender la estructura del sistema modelizado y,
consecuentemente, ser capaz de generar hiptesis contrastables (sobre esta cuestin
abundaremos en el Tema 3). La construccin de un modelo supone siempre una
simplificacin de la realidad, no tiene sentido, pretender que un modelo acomode todos
los datos conocidos en la actualidad y en el futuro. El puente entre la realidad y el
modelo lo proporcionan los datos, a travs de su estudio y anlisis pormenorizado. Dado
que el modelo genera hiptesis constrastables debemos estudiar los procedimientos de
que disponemos en la metodologa para llevar a cabo el contrastar tales de hiptesis.
Si plantemos la cuestin, validar las hiptesis derivadas de un modelo, en
trminos de incertidumbre, tal y como hicimos en el caso de la estimacin de
paramtros, el problema de validacin de hiptesis hace referencia a la determinacin
de procedimeintos que premitn valorar el riesgo en una tarea que hace referncia a
evaluar la congruencia de las hiptesis que genera o se deducen del modelo (tanto a sus
componentes como a las relaciones establecidas) y los datos que hemos obtenido de la
realidad.
MASTER EN METODOLOGA DE LAS CIENCIAS DEL COMPORTAMIENTO Y DE LA SALUD
2
Como ya hemos comentado en el tema preliminar, existen al menos dos niveles
de hiptesis, las llamadas hiptesis de trabajo, que algunos autores denominan de
investigacin o cientficas y las hiptesis estadsticas.
Las primeras, hiptesis de trabajo, se explicitan de forma lingstica y se deriban
de la teora o del modelo. Estas hipotsis se pueden caracterizar como afirmaciones
acerca de las supuestas relaciones entre constructos o variables implicadas. Deben
explicitarse de tal forma que el modelo que las genera pueda ser falsable y que los
modelos competidores puedan eliminarse (la razn de esta forma de proceder viene
impuesta desde la Filosofa de la Ciencia y concretamente del falsacianismo
popperiano). Su claridad es fundamental para determinar si el resultado obtenido es
similar o no al esperado desde el modelo y su finalidad es servir de gua en el proceso
de investigacin.
Las segundas, hiptesis estadsticas, son conjeturas que realizamos sobre el
como ocurre un suceso (Lpez Cachero, 1991) o, ms claramente, supuestos en los que
se basan algunas operaciones estadsticas y que hacen referencia al valor de un
parmetro, la forma de una distribucin o la ley de probabilidad de un conjunto de
fenmenos (Sierra Bravo, 1991). En otros trminos una hiptesis estadstica es
cualquier conjetura sobre una o varias caractersticas de inters de un modelo de
probabilidad.
La distincin entre hiptesis cientficas y estadsticas es importante: las primeras
se refieren a resultados y relaciones entre los componentes del modelo (sea ste
formalizado o no), las segundas se refieren a subconjuntos de puntos en un espacio
paramtrico.
Las hiptesis estadsticas deben, por tanto, cumplir dos propiedades para
asegurar su correcin:
1. Deben ser congruentes con las hiptesis de investigacin.
2. Deben de ser lo suficientemente especficas como para determinar si los
resultados obtenidos son similares o no al resultado que se haba supuesto.
La hiptesis estadstica especifica que el punto del parmetro buscado se encuentra
en un lugar particular entre dos posibles. El procedimiento del contraste estadstico acta
sobre la base de un conjunto de observaciones (datos) y permite, con ciertas salvedades,
validar o no tal hiptesis.
MASTER EN METODOLOGA DE LAS CIENCIAS DEL COMPORTAMIENTO Y DE LA SALUD
3
Clasificaciones de hiptesis:
Las hiptesis pueden clasificarse, segn diferentes criterios que hacen referencia
al nmero de parmetros o relaciones implicadas; al tipo de relacin que se establece y a
la temporalidad de la relacin, o referencindolas a su formulacin y papel dentro del
proceso de contraste. As, atendiendo a la primara categora podemos hablar de:
Hiptesis simple o compuesta:
Hiptesis Simple: es aquella que especifica completamente la distribucin
(tambin se conoce como hiptesis de igualdad), o lo que es lo mismo es aquella que
asigna valores nicos a los parmetros ( = 1'5, = 10, X = Y ,...). Ej. El rendimiento
medio escolar de los estudiantes de bachillerato espaoles medido mediante un test es
de 47.
Hiptesis compleja: Es la que asigna un rango de valores a los parmetros poblacionales
desconocidos ( > 1'5, 5 < < 10, X < Y ,...). Ej. Los frecuencia del cncer de
pulmn de mayor en los fumadores que en los fumadores, siendo la prevaleca en el
primer caso de 6 por mil y en el segundo de 4 por mil"
Hiptesis direccional o no direccional:
Hiptesis Direccional: La hiptesis direccional establece relaciones asimtricas
entre variables. Ej. "La prctica del deporte es beneficiosa para conseguir un patrn de
sueo satisfactorio en adolescentes entre 12 y 16 aos."
Hiptesis no direccional: Es aquella que establece relaciones simtricas entre
variables. Ej. "Existe una relacin entre el consumo de tabaco y el sueo".
Hiptesis de asociacin o de causalidad:
Hiptesis de asociacin: Es aquella que hace referencia a la variacin conjunta
de las variables (son siempre relaciones simtricas por tanto no pueden establecer
antecedente y consecuente y por ende causalidad). Ej. "Existe una relacin positiva
entre el nmero de accidentes de trfico y el consumo de alcohol.
Hiptesis de causalidad: hacen referencia a variacin conjunta entre variables
pero en la que una de ellas antecede a la ocurrencia de la otra, o lo que es lo mismo la
MASTER EN METODOLOGA DE LAS CIENCIAS DEL COMPORTAMIENTO Y DE LA SALUD
4
primera produce un efecto en la segunda (son siempre por tanto relaciones asimtricas).
Ej. " La aspirina infantil reduce el riesgo de infarto
Atendiendo a la segunda de las categoras mencionadas, es decir al papel que
juegan en el proceso de contratacin hablamos de Hiptesis nula e hiptesis
alternativa.
Hiptesis nula e Hiptesis alternativa:
Hiptesis nula: se denota por H0 y de forme general podemos decir que expresa
la ausencia de relacin (comnmente expresa y recoge la situacin contraria a la
conjetura o hiptesis que la investigacin propone como explicacin del fenmeno en
estudio).
Hiptesis alternativa: Se denota por H1 y es la complementaria de la H0
(coincide generalmente con la propuesta de explicacin). La excepcin a esta
afirmacin se presenta en el caso de los estudios llamados diseos de equivalencia.
Planteamiento del contraste de hiptesis.
El contraste de hiptesis estadstico se basa en las distribuciones muestrales, que
como sabemos son modelos probabilsticos, de ah que el contraste slo est
circunscrito, y as debe entenderse, a un resultado estrictamente probabilstico, por lo
tanto no podr nunca demostrarse su falsedad en trminos absolutos, lo sern
nicamente en trminos probabilsticos. La finalidad de las tcnicas de contraste es
hacer que dicho soporte se mantenga dentro de unos lmites racionales lgicamente
probabilsticos.
El planteamiento de las tcnicas de contraste de hiptesis se debe a Fisher y a
Neyman y Pearson(como veremos inmediatamente a una mezcla entre el planteamiento
de Fisher y la propuesta de Neyman y Pearson) . Si bien todas ellas se fundamentan en
los mismos principios lgicos (modus tolendo tolens) existe un amplio elenco de
pruebas que responde a exigencias demarcadas por: especificidades del diseo
implicado, nmero de poblaciones , tipo de parmetro/s, carctersitcas de las
distrisbuciones de las variables implicadas (supuestos que deben cumplir tales que
normalidad, homocedasticidas, etc.).
Podemos definir un contraste (test de hiptesis) como un conjunto de tcnicas
que nos proporciona la Inferencia Estadstica y que permiten comprobar si la
MASTER EN METODOLOGA DE LAS CIENCIAS DEL COMPORTAMIENTO Y DE LA SALUD
5
informacin que proporciona una muestra observada concuerda (o no) con la hiptesis
estadstica formulada sobre el modelo de probabilidad y, por tanto, se puede validar (o
no) la hiptesis formulada. Esta hiptesis es la que hemos definido anteriormente como
hiptesis nula H0. Si se rechaza, en el sentido de no validacin, la hiptesis nula
implcitamente se asume como plausible la hiptesis alternativa, H1.
El problema del contraste de hiptesis se puede definir:
Dado un punto del espacio muestral x = (x1 , x2, x3, .; xn) conjunto de datos
obtenidos) se define una regla de decisin que siendo funcin de x, permita aceptar o
rechazar la H0 , dividiendo al espacio muestral en dos subconjuntos excluyentes C y Cc
tal forma que:
Si xC rechazamos la H0 (consideramos probado que esa hiptesis
es falsa y por ende admitiendo como plausible la H1 propuesta) a
este subconjunto del espacio muestral se le denomina regin crtica.
.S xCc entonces diremos que hiptesis (siempre refirindonos a
H0) es compatible con los datos.
Es decir, que el criterio que vamos a seguir para decidir si la hiptesis nula se
mantiene o se rechaza, se basa en la particin de la distribucin muestral del
estadstico en dos zonas mutuamente exclusivas y excluyentes que denominamos regin
crtica y regin de aceptacin y definimos:
Regin Crtica (o de Rechazo): Es el rea de la distribucin muestral que
corresponde a los valores del estadstico de contraste que se encuentran tan alejados de
la afirmacin establecida en H0 que es muy poco probable que ocurran, si la hiptesis
nula es correcta. Su probabilidad es (o nivel de significacin o riesgo).
Regin de Aceptacin: Es el rea de la distribucin muestral que corresponde a los
valores del estadstico de contraste prximos a la afirmacin establecida en la hiptesis
nula. Su probabilidad es 1- (o nivel de confianza).
El tamao de las zonas de aceptacin y rechazo se determinan fijando el valor de ?(nivel de significacin). Considerando que se trata de un nivel de error, su valor debe
ser pequeo, de ah que valores para ? considerados en la literatura y utilizados en la investigacin emprica son habitualmente 0.01 y 0.05.
Dado que la H0 y H1 son complementarias es decir exhaustivas y excluyentes
MASTER EN METODOLOGA DE LAS CIENCIAS DEL COMPORTAMIENTO Y DE LA SALUD
6
dependiendo de cmo formulemos H1 y en relacin a las regiones de rechazo y
aceptacin de H0, los contrastes de hiptesis pueden ser bilaterales o unilaterales.
Se dice que un contraste es bilateral, cuando las H1 planteada es simple ( ???'5, ????, X ?? Y ,...), en tales casos la zona crtica se encuentra, generalmente repartida a
partes iguales entre las dos colas de la distribucin muestral. Cuando la H1 compuesta
( < 1'5; 5 < < 10, X > Y ,...) los contraste se dicen unilaterales, en tales casos la
regin crtica se encuentra en una de las colas de la distribucin muestral. (Ver figura 1)
Figura 1
BILATERALBILATERAL UNILATERAL UNILATERAL ((derecha)derecha)
El procedimeinto general para el contraste de hiptesis estadsticas, tal y como
fue introducida por Fisher, se puede resumir en los siguientes pasos:
1) Plantear una hiptesis nula (H0). La hiptesis hace referencia, tpicamente, al
valor de algn parmetro en la poblacin de referencia.
2) Establecer una regla de muestreo. Generalmente, se trata de muestreo
aleatorio simple.
3) Determinar la distribucin muestral del estadstico de inters en funcin de
la hiptesis nula y la regla de muestreo.
4) Determinar una medida de la discrepancia, que no es ms que una diferencia
MASTER EN METODOLOGA DE LAS CIENCIAS DEL COMPORTAMIENTO Y DE LA SALUD
7
estandarizada, entre el estadtico correspondiente y el parmetro (en otros
trminos entre el valor obtenido a partir de la muestra y lo establecido por la
hiptesis nula dividido por el error tpico de la distribubin del estadstico). 1
El ndice de discrepancia d se denomina estadstico de contraste
Es funcin de los datos muestrales
y de la informacin contenida en la hiptesis nula (H0).
5) Establecer un nivel de significacin , en otros trminos especificar que
discrepancias se consideran inadmisibles cuando H0 es vlida.
Tras todo ello, se selecciona la muestra y se calcula la medida de discrepancia; si
la probabilidad de obtener bajo H0 una discrepancia igual o mayor que la obtenida es
menor que , se considerar que se debe rechazar la H0, entendiendo que el trmino
hiptesis nula, tal como fue introducido por Fisher, hace referencia a que es la
hiptesis cuya nulidad (falsedad) se pretende demostrar. Actualmente los paquetes
estadsticos para anlisis de datos incluyen en los resultados el valor de p (probalidad
asociada) que no es ms que la probabilidad de obtener un valor del estadstico de
contraste igual o ms extremo que el obetendio con los datos de la meustra bajo la
condicin de que H0 sea cierta. A los efectos se opera comparando el valor de p con el
nivel de significacin ??????????????????????????????????????n :Si p?????????????????0 Si p?????????????????0
Los dos enfoques del contraste de hiptesis: Fisher y Neyman - Pearson
Para Fisher, un contraste de significacin puede llevar a una de las dos
decisiones siguientes: o bien la H0 se rechaza al nivel de significacin o bien el juicio
se reserva en ausencia de base suficiente. Este autor desarroll los mtodos de contraste
1 Importante tener presente en la definicin del ndice de discrepancia (Estadstico de Contraste) que se trata
de una variable aleatoria cuya distribucun es, por lo ganeral, conocida y es precisamente este caracterstica del ndice
de discrepancia lo que permitir llevar a cabo la toma de decisiones
MASTER EN METODOLOGA DE LAS CIENCIAS DEL COMPORTAMIENTO Y DE LA SALUD
8
de hiptesis estadsticas dentro de una perspectiva puramente popperiana: las nicas
decisiones posibles son rechazar la hiptesis nula o declarar que la evidencia no es
suficiente.
Este enfoque se centra de forma exclusiva en el resultado de la prueba estadstica
y en concreto en la evaluacin del valor p (probabilidad asociada) 2 en relacin al
??????????????????????????????????n arbitrario y previamente fijado), es decir p???????????suficientes indicios para decartar H0, si p??????????????????rminos de la H0 indica queno es concordante con los datos disponibles. En otros trminos, cuando se rechaza la H0
se puede admitir que el valor de la relacin (el efecto) no es cero, pero cuando se acepta
H0 no se puede concluir que el valor de la relacin (el efecto) sea cero (Cohen, 1988),
como ya advertimos en este contexto nulo no quiere cero.
Por su parte la metodologa de Neyman y Pearson, en oposicin a esto, est
orientada a la resolucin de un tipo diferente de problema, una situacin en la que se
debe tomar una decisin partiendo de informacin limitada y en la que se desea
minimizar los costes de una decisin errnea. Su campo de aplicacin ideal es el control
de calidad, donde la situacin tpica consiste en controlar la produccin de cierto tipo de
objetos, es pues un plateamiento centrado en la toma de decisiones, para lo cual
introducen algunas modificaciones en el esquema fisheriano, al considerar
explcitamente la hiptesis alternativa H1 (contrapuesta a la H0) e introducir los
conceptos de error tipo I y II, regin crtica y potencia de la prueba y la necesidad de
????????????????????????????????????????????n) como garantia de de que las decisiones no se toman a posteriorien virtud de los resultados.
Planteemos la cuestin desde el punto de vista de la toma de decisiones para
explicar los los conceptos introducidos en este planteamiento. Dado que existen dos
posibles hiptesis ( H0 y H1) las decisiones que podemos tomar sern: (cyadro 1 y
2 Probabilidad asociada
Se llama nivel crtico p a la probabilidad de obtener una discrepancia mayor o igual que la
observada en la muestra, cuando H0 es cierta. p = P (d d | H0)
Es importante resear que la probabilidad asociada p no es una medida de la magnitud de la
significacin del contraste (tal y como muchas veces se interpreta) ni tampoco una medida de la magnitud
o relevancia del efecto detectado, en otros trminos significacin estadstica no supone significacin
terica ni clnica.
MASTER EN METODOLOGA DE LAS CIENCIAS DEL COMPORTAMIENTO Y DE LA SALUD
9
figura 2)
Cuadro 1
H0 es correcta H0 es incorrecta
Aceptamos H0 Decisin correcta
(1- )
Error tipo II
Rechazamos H0 Error tipo I Decisin correcta
(1- )
Figura 2
Error Tipo I: error cometido al rechazar H0 siendo verdadera. La probabilidad de
cometer este error es ? (nivel de significacin que fija y controla el investigador). Obviamente la probabilidad complementaria (1 ? ??? ??? ??? ?????? ??? ??????????(recuerdese lo visto al presentar la estimacin por intervalos).
MASTER EN METODOLOGA DE LAS CIENCIAS DEL COMPORTAMIENTO Y DE LA SALUD
10
Error tipo II: error cometido al aceptar H0 siendo falsa. La probabilidad de cometer
este error se designa por ?. La probabilidad complementaria (1-?) se denomina potencia del contraste y corresponde a la probabilidad de rechazar una hiptesis nula
que es falsa. Indica la capacidad que tiene un contraste para detectar que una hiptesis
nula concreta es falsa, o bien, la capacidad de aceptar H1 siendo esta verdadera.. Es
obvio que una regin crtica es la mejor o la mas potente cuando, para un ? dado, su potencia es mayor que la de cualquier otra de las infinitas regiones que llevan asociadas
esa misma probabilidad ?.La problemtica del contraste de hiptesis.
Las pruebas de significacin tal y como se aplican usualmente son el resultado
de un procedimiento hbrido en el que se mezclan las dos posturas (encontradas) de la
filosofa subyacente a los procedimientos de contraste que hemos expuesto.
Simplificando mucho se puede decir que la hibridacin consiste en que se toma del
planteamiento fisheriano la concepcin y el procedimiento de contraste de la hiptesis
nula (H0) pero introduciendo la hipotsis alternativa H1 (del enfoque Neyman
Pearson) como contrapuesta estadsticamente a la H0 ( cuesitn esta absolutamente
inaceptable para Fisher) y en consecuencia incluyendo tambin los conceptos de error
d??????? ??? ???? ?? ?????????????????? ???????????? ? ?? ??? ????????????? ??? ????????????n y fijacin del error de Tipo I (??????????????????????????????????????????????????????????????una toma de decisin entre dos contrarios complementarios y excluyentes.
Crticas al contraste Hiptesis
Son muchas y comprenden desde poner en tela de juicio los planteamientos
tericos y su aplicacin y considerarlas poco interesantes e incluso errneas hasta los
que slo se manifiestan en contra del uso inapropiado y de la mala enseanza que se
hace de ellas fruto de las confusiones sobre algunos de sus elementos claves tales que el
concepto de hiptesis nula; el problema de la significacin estadstica y los factores que
la determinan y desde luego, y como el ms destacable de todos los problemas, la
potencia estadstica. Todo ello ha llevado a que actualmente y en nimo a soslayar las
crticas y seguir las recomendaciones de la American Psychological Association
aparecidas en el American Psychology, 54, 594-604, se propone que para garantizar un
buen uso de estas tcnicas se tomen como mnimo las siguientes precauciones:
Determinacin previa del tamao muestral (n) necesario para
MASTER EN METODOLOGA DE LAS CIENCIAS DEL COMPORTAMIENTO Y DE LA SALUD
11
garantizar una determinada potencia, o informar de la potencia
obtenida.
Completar los resultados obtenidos de la aplicacin de las tcnicas de contraste de hiptesis con otros procedimientos
estadsticos que permitan extraer el sentido y la mayor
informacin posible de los datos mustrales, desde el modelo de
la inferencia tal y como lo conocemos (intervalos de confianza y
tamao del efecto).
Contraste de hiptesis desde la perspectiva actual
Conviene aclarar como afirma Frick (1995 y 96) el uso de los contrastes de
hiptesis, tal y como se vena haciendo (y aun se hace) puede ser vlido cuando
planteamos leyes en sentido ordinal o cualitativo y nicamente pretendemos
comprender y estructurar los datos de la realidad (es decir, cuando el valor real de la
relacin, es decir el efecto, no es trascendental) , ms all de este propsito, cuando se
pretenden predicciones cuantitativas o aplicaciones prcticas se hace necesario incluir
otros procedimientos estadsticos complementarios que informan sobre el grado,
direccin e importancia real de los resultados derivados de la aplicacin de las pruebas
de significacin.
Presentamos a continuacin los estadsticos y procedimientos complementarios a
las tcnicas de contrastes de hiptesis y que corresponden tanto a los planteamientos
terico prcticos como a las exigencias que estn imponiendo en las revistas al uso. A
tal efecto retomaremos algunos de los conceptos ya vistos que nos servirn de gua en
este planteamiento.
Comenzamos reproduciendo el cuadro de decisiones estadsticas posibles
relativas a la conclusin que se deriva de la prueba de hiptesis y obviamente
referenciadas a la poblacin/es pero, de forma ms concreta (reproducido de Lipsey,
1990), donde T representa al grupo de tratamiento y C el grupo control (ambos de forma
genrica).
MASTER EN METODOLOGA DE LAS CIENCIAS DEL COMPORTAMIENTO Y DE LA SALUD
12
Referencia Poblacional
Conclusin estadstica
T y C
difieren
T y C
no difieren
Diferencias Significativas
Rechazo de H0
Conclusin correcta
Probabilidad = 1-
POTENCIA
Error tipo I
Probabilidad
Diferencias no significativas
Aceptacin de H0
Error tipo II
Probabilidad
Conclusin correcta
Probabilidad 1-
(coeficiente de confianza)
Error tipo I: error cometido al rechazar H0 siendo verdadera. La probabilidad
de comenter un error Tipo I o riesgo de comenter este tipo de error , que denominamos
nivel de significacin, se define como la probabilidad de obtener en la distribucin
muestral del estadstico de contraste valores de ste que se encuentran tan alejados de la
afirmacin establecida en H0 que es muy poco probable que ocurran, si la hiptesis nula
es correcta.
Error tipo II: Aceptacin de la hiptesis nula siendo falsa, su probabilidad que
???????????????????. Estos dos errores ( y ) estn inversamente relacionados. Para una muestra determinada de tamao n, si disminuye aumenta. ???????????????????????fijado por el investigador, por tanto, se puede decir que el rechazo de las H0 verdaderas
esta controlado. Ahora bien, El error tipo II no se puede conocer hasta que no se
conozca la H1 entendiendo que H1 indica el efecto que el investigador espera, este valor
(que en realidad constituye la hiptesis que le investigador desea evaluar).
MASTER EN METODOLOGA DE LAS CIENCIAS DEL COMPORTAMIENTO Y DE LA SALUD
13
Relacin entre y
A medida que aumenta disminuye
Potencia es la probabilidad de rechazar correctamente la hiptesis nula cuando debe ser
rechazada. Aunque la especificacin alfa establece el nivel de significacin estadstica
aceptable, es la potencia la que dicta la probabilidad de xito en la bsqueda de las
relaciones/diferencias si es que realmente existen. Es importante tener presente que es
posible, para un parmetro determinado obtener su curva de potencia. 3
Factores que influyen en la Potencia Estadstica:
1. ??????????Dado que y estn inversamente relacionados a medida que alfa se vuelve ms restrictivo (menor), la potencia decrece. Esto significa que si reducimos la probabilidad de encontrar un efecto incorrecto significativo, tambin reducimos la probabilidad de detectar un efecto correcto.
2. El tamao de la muestra: Para cualquier valor dado, el incremento del tamao muestral incrementa tambin la Potencia del test estadstico. Pero, un aumento excesivo del tamao de la muestra puede producir demasiada potencia en el sentido de se puede llegar a observar que efectos (valores cuantificados de diferencias o relaciones mnimas pueden llegar ser significativos, hasta que para muestras muy grandes casi cualquier efecto es significativo. As, el tamao de la muestra puede afectar a la prueba estadstica tanto por hacerla insensible (para muestras
3 Curva de potencia: En el contexto que nos ocupa, es una grfica que muestra, para todos los
valores posibles de un parmetro poblacional que contradice la hiptesis nula, la probabilidad, 1 -? ??? ???rechazarla correctamente, dado el tamao muestral y un riesgo a mximo especificado.
MASTER EN METODOLOGA DE LAS CIENCIAS DEL COMPORTAMIENTO Y DE LA SALUD
14
muy pequeas) o demasiado sensible (para muestras muy grandes) 4.
3. Tamao del Efecto: La probabilidad de conseguir significacin estadstica se basa no slo en consideraciones estadsticas sino tambin en la magnitud real del efecto que nos interesa (por ejemplo, una diferencia de medias entre dos grupos o la correlacin entre variables) en la poblacin, denominado tamao del efecto. Como cabra esperar, un efecto grande es ms probable de encontrar que un efecto pequeo y por tanto, afecta a la potencia de la prueba estadstica. Para evaluar la potencia de cualquier prueba estadstica, el investigador debe entender primero el efecto examinado.
Relacin entre y el tamao de la muestra
A medida que aumenta el tamao de la muestra disminuye el error estandar y por lo tanto el
riesgo de
n1 n2
n1 < n2
4. Si la hiptesis alternativa es simple, pro ejemplo H1: ?????????????????valor prefijado de habr un nico valor de ????????????????????????????situacin no es la comn, lo que ocurre normalmente es que la H1 sea del tipo < >, es decir hiptesis compuesta (ms de una distribucin posible) lo cual supone que para cada posible valor del parmetro existe un valor de? ?? ????? ??fico). Siendo estrictos deberamos determinar la curva de ??????????????????????????????????????????????que contradicen la hiptesis nula dado el tamao muestral y prefijado.
4 Es importante resear ahora que para la determinacin del tamao muestral necesario en un estudio se
debe considerar si el inters se centra en la estimacin de parmetros (al respeto lo expuesto en los temas de relativos al
muestreo) o si el inters de la investigacin lleva a planteamientos de contraste de hiptesis referidas a algn parmetro
(problemtica que se plantea en este apartado). Para ms informacin pueden acudir
http://masmatematicas.com/estadisticas/n.html
MASTER EN METODOLOGA DE LAS CIENCIAS DEL COMPORTAMIENTO Y DE LA SALUD
15
Relacin entre el riego y el valor verdadero de H1
Hay tantos valores de como H1 se hayan enunciado
A continuacin se presentan dos ejemplos sencillos para ilustrar los comentarios
anteriores. El primero implica la comprobacin de la diferencia entre las medias de dos
grupos. Suponiendo que el tamao de efecto sea entre pequeo (0,2) y moderado (0,5)
(siguiendo los criterios convencionales sugeridos pos Cohen (1992).
La Tabla 1.1 muestra el impacto tanto del tamao de la muestra como del nivel
sobre la potencia, reacurdese que la potencia se ha definido como 1- ?. Como puede verse, la potencia llega a ser aceptable para tamaos de muestra de 80 o ms en
situaciones en las que el tamao del efecto es mediano para ambos niveles de alfa
prefijados (.70 en el peor caso). Para un tamao de efecto pequeo, obtenemos poca
potencia, incluso con niveles de de 0.01 y muestras de 200 sujetos. Por ejemplo, una
muestra de 200 sujetos en cada grupo con un de 0,05 tiene slo un 50 por ciento de
posibilidades de encontrar diferencias significativas si el tamao del efecto es pequeo.
Lo anterior indica que en el diseo del estudio, si anticipamos los efectos van a ser
pequeos, deberemos trabajar muestras mucho mayores y/o niveles de menos
restrictivos (0,05 o 0,10).
TABLA 2. Niveles de potencia para la comparacin entre dos medias: Tamao de la muestra,
nivel de significacin y tamao del efecto.
MASTER EN METODOLOGA DE LAS CIENCIAS DEL COMPORTAMIENTO Y DE LA SALUD
16
= 0.05
Tamao del
efecto (TE)
= 0.01
Tamao del
efecto (TE)Tamao
muestral
Pequeo
(0.2)
Mediano
(0.5)
Pequeo
(0.2)
Mediano
(0.5)
20 0.095 0.338 0.025 0.144
40 0.143 0.598 0.045 0.349
60 0.192 0.775 0.067 0.549
80 0.242 0.882 0.092 0.709
100 0.290 0.940 0.120 0.823
150 0.411 0.990 0.201 0.959
200 0.516 0.998 0.284 0.992
Grafico3
El Grafico 3 representa la curva de potencia para niveles de significacin
de 0,01; 0,05 para distintos tamaos maestrales y un tamao de efecto de .30.
Ntese que para lograr una potencia de .80 (recomendada por Cohen) para
=.05 son necesarios tamaos muestrales inferiores que los necesarios para =.01.
Cohen ha examinado la potencia para la mayor parte de las pruebas de inferencia
estadstica y ha proporcionado pautas para los niveles aceptables de potencia, sugiriendo
MASTER EN METODOLOGA DE LAS CIENCIAS DEL COMPORTAMIENTO Y DE LA SALUD
17
que los estudios deben disearse para conseguir niveles de alfa de al menos 0,05 con
niveles de potencia??????????????????????????????????????rminos mantener una relacin ?? de 4/1
Determinacin de la Potencia
Existen dos formas: a prior y a posteriori
A Priori: Se hace a partir de las Curvas de Potencia y permite determinar
el nmero de sujetos necesarios para alcanzar una potencia deseada. Si
bien, a partir de la propuesta de Cohen (1992) y por convencin se da por
suficiente potencias de .80, no debe tomarse como un criterio
inamovible, el investigador debe plantear su compromiso con las
probabilidades de error ? ?? ?? ?? ??? ???????? ???? ?????? ?????????? ????relacin inversa.
A posteriori: Muy tiles cuando los resultados de un estudio son
negativos ya que en general se suele interpretar un resultado negativo
como que le fenmeno estudiado no existe cuando lo que puede estar
ocurriendo es que estemos ante un estudio de potencia baja) bien porque
el tamao muestral sea insuficiente o el tamao del efecto pequeo) de
tal forma que el procedimiento no es capaz de detectar la significacin
estadstica.
Como ya hemos visto los cuatro elementos centrales en inferencia
son n; ?? ? y el tamao del efecto, todos ellos mutuamente interrelacionados de tal forma que cada uno es funcin de los otros tres.
As, y siguiendo a Cohen (1998) podemos plantear cuatro tipos de
anlisis de la potencia:
1.- Potencia en funcin de , TE5 (tamao el efecto) y n. Es decir,
conocidos los tres elementos calculamos (normalmente se busca en las
tablas de potencia) la potencia (si la queremos aumentar cambiaremos las
especificaciones preestablecidas).
2.- Se estima el TE (bien a travs del estudio de la literatura al caso o por
aproximacin fundamentada en la propia experiencia), se establece el
5 A partir de ahora designaremos el tamao del efecto por TE
MASTER EN METODOLOGA DE LAS CIENCIAS DEL COMPORTAMIENTO Y DE LA SALUD
18
valor de y la potencia deseada y se calcula n. Este procedimiento es
especialmente relevante en estudios clnicos y en diseos experimentales
ya que permite determinar el nmero de sujetos necesario.
3.- Determinar el TE conocidos los otros elementos en juego (apenas se
utiliza).
4.- Determinacin de conocidos los otros tres, apenas tiene utilidad
ya que la convencin de : 0.05 0.01, esta muy extendida e impuesta
por la convencin.(En algunos estudios clnicos se toma = .10)
A ttulo de resumen:
En condiciones ideales los valores de ? ?? ?? deberan ser especificados y utilizados para fijar el valor de n para la prueba estadstica seleccionada para el
anlisis. En general lo comn es fijar y n lo cual determina la potencia. Cuando el
resultado da una potencia baja, la solucin es incrementar n ya que es la nica manera
de reducir los errores tipo I y II, si bien el criterio de incremento de n debe ser
matizado por criterios de coste tanto econmico como de esfuerzo..
En los estudios en los que TE sea un elemento clave (estudios clnicos y algunos
experimentales) deber tenerse presente y prefijado ? ?? ????????????? ???n necesario, para el TE postulado.6
Actualmente existe software gratuito que permite, para algunas pruebas
especficas determina n TE la potencia. Por ejemplo el SamplePower del SPSS
permite determinar los tamaos maestrales y ajustar los parmetros del diseo,
obteniendo las curvas de potencia para un amplio nmero de tcnicas de anlisis
(medias, proporciones, correlacin, Anova, Ancova y Regresin). El documento
SOFTWARE PARA CALCULAR TAMAOS MUESTRALES Y POTENCIA incluido
en la carpeta COMPELMENTOS BLOUE 1 contiene direcciones web con software
disponible en la red para estos clculos.
6 Para mayor informacin sobre estas cuestiones ver:
Bono, R.; Arnau, J.; (1995) Consideraciones generales en torno a los estudios de potencia. Anales de Psicologa, 11 (2), 193-202.
Cohen, J. (1988). Statiscal power anlisis for the behavioral sciences. ( 2da ed.). Hillsdale, NJ: Erlbaum
Cohen, J. (1992). A power primer. Psychological Bulletin, 112, 155- 159.
MASTER EN METODOLOGA DE LAS CIENCIAS DEL COMPORTAMIENTO Y DE LA SALUD
19
Algunos comentarios relacionados con el TAMAO DEL EFECTO
Cohen define este estadstico como el grado en que el fenmeno en estudio est
en la poblacin. Responde a preguntas el tipo: cual ha sido la magnitud del efecto de
un tratamiento?; cmo de fuerte es la relacin entre las variables?, en otros trminos
facilita no slo el que se conozca que un efecto ocurre, sino tambin su magnitud. Tal y
como ha sido definido (grado en que el fenmeno esta presente en la poblacional)
puede calcularse su intervalo de confianza que indicar el rango dentro del cual es
posible que se encuentre el efecto real en la poblacin (se aplica todo lo visto sobre
intervalos confidenciales dado que se trata de un estadstico con su distribucin
muestral) 7 .
Como ya se comento, para determinar la Potencia Estadstica (ya sea a priori o a
posteriori) es necesario conocer el TE, aunque no esta todo dicho sobre cuales son las
medidas de TE y su interpretacin 8 (cuestin que hoy constituye un campo de
investigacin) Rosenthal (1994) clasifica las medidas del efecto en dos familias:
Familia d: ndices para diferencias entre medias y proporciones (en ambos casos
hay distintos ndices relativos a puntuaciones brutas d de Cohen; la g de
Hedges; la delta de Glass , tipificadas, estadstico CL de McGraw y Wong,
tambin llamado ndice universal del TE; d Cox, para variables dicotomizadas o
trasformaciones a r, en concreto de la de d de Cohen), entre otros.
Familia r: Coeficientes de correlacin de Pearson y sus derivados (correlaciones
cuadrticas o proporciones de varianza explicada. 2; ^2).
A la hora de realizar un estudio completo y, desde la perspectiva presentada, se
hacen una serie de recomendaciones que pueden encontrar en el documento
sugerencias metodolgicas.
7 Importante destacar que las tcnicas que calculan el TE para algunas de las diferentes pruebas estadsticas
de uso comn (ejemplo, t; F) ofrecen una mtrica comn que posibilita la integracin de resultados indispensable en el
Meta-anlisis.
8 Los diferentes ndices sern presentados asociados a las correspondientes pruebas de significacin.
MASTER EN METODOLOGA DE LAS CIENCIAS DEL COMPORTAMIENTO Y DE LA SALUD
20