COMO ESTUDIAR UN ESTUDIO Y PROBAR UNA PRUEBA - La selección de una prueba estadística 2

download COMO ESTUDIAR UN ESTUDIO Y PROBAR UNA PRUEBA - La selección de una prueba estadística 2

of 35

Transcript of COMO ESTUDIAR UN ESTUDIO Y PROBAR UNA PRUEBA - La selección de una prueba estadística 2

  • 8/3/2019 COMO ESTUDIAR UN ESTUDIO Y PROBAR UNA PRUEBA - La seleccin de una prueba estadstica 2

    1/35

    ~~x-w

    Como ejemplo del problema que puede ocurrir cuando se inter-pretan los coeficientes de correlacin, reconsideraremos el ejemplo anterior en el quecalculamos una ecuacin de regresin para estimar la tensin intraocular a partir de I "dosis de un frmaco hipottico para el tratamiento del glaucoma. El extraer una mues-tra de la variable independiente, la dosis, de forma que tuvisemos una representadnuniforme de las dosis dentro del intervalo comprendido entre 1 y 10mg, como se mostranteriormente en la figura 28-2, nos conducira a creer que ex-isteso1ouna moderadacorrelacin negativa entre la dosis y la tensin intraocular (r = -0,66). Por otro lado,podemos tomar la decisin de limitar nuestro estudio a dos dosis del medicamento yasignar aleatoriamente cinco pacientes a 1 mg y cinco pacientes a 10 mg como se mues-tra en la figura 28-5. En este caso, estimaramos un coeficiente de correlacin negativomucho ms elevado en la pobladn (r = -0,95). Sin embargo, las estimadones de lat'Cuacin e re,~rl.'Sinn ambos mtodos de muestreo son exactamente las mismas.Para deddir cul es el mtodo representativo y, de ese modo, le-gitimar el uso del anlisis de la correlacin, necesitamos anticipar las dosis que se uti-lizarn en la prctica clnica. Por ejemplo, redbirn los pacientes todas las dosis entre1 y 10 mg con frecuencias aproximadamente iguales? Si esto es as, el coeficiente de co-rrelacin de -0,66 refleja correctamente la asociacin entre la tensin intraocular y lasdosis que podemos prever que se experimentarn en la prctica. Por otro lado, si lospcJcientes eciben dosis de 1 mg o de 10 mg con 1mismcJ recuencia, el cOt?ficientedecorrelacin de -0,95 estima la relacin dosis-respuesta que puede anticiparse. Si seemplea cualquier otro patrn de administracin del frmco, ninguno de los coefiden-tes de correlacin estima correctamente la relacin previsible entre la dosis ~.la tensinintraocular. Para muchos tipos de datos, es dificil escoger la distribucin apropicJda dela varible ndependiente, especialmente en las relaciones dosis-respuesta. Cuando re-sulta dificil hacerlo, podemos emplear el anlisis de regresin, pero debemos e\itar elde la correlacin.

    ;?:

    ~~~=0:::;~~~>-(:)3::'~;.oJ~::~'C3::..(,1)'-.I-...,~

    VAIUABLE DEPENDIENTE ORDINALAl examinar la figura 28-6 observar que no se considera ia posi-bilidad de una variable dependiente ordinal asociada con una variable indeptc'ndientecontinua, porque esta ltima se debe transformar a una escala ordinal. la situacin essimilar a la que discutamos en el caso de la variable dependiente continua incluida enun anlisis con una variable independiente ordinal. No existen tcnic.Jsestadsticas quese utilicen habitualmente para comparar una variable dependiente ordinal con una \'a-riable independiente continua sin realizar esa transformacin.

    Variable independiente nominalL1 "III.'I~ iI.' \tfa,I11-Whitlll'Ys una prueba de significaC:n estads-tica aplicable a una variable independiente nominal ya una variable dependiente ordi-

    nal. Tambin es aplicable a una variable dependiente continua transform.1.:ia a una es-cala ordinal, con objeto de eludir el supuesto de la prueba de la t de Student. La hiptesisnula considerada en la prueba de f\lann-Whitney es que las dos muestras de la pobla-cin no difieren en la posicin. Dado que es una prueba no paramtrica, en la hiptesisnula no se especifica ningn parmetro de posicin. Muchas veces, omos hablar de lahiptesis nula de la prueba de Mann-Whitney en trminos de la igualdad ~ las media-nas. Esto se aleja de la \'\!rdad, pL'ro 1.1S edianas de los dos grupos de mu~tra~ se pue-?06

  • 8/3/2019 COMO ESTUDIAR UN ESTUDIO Y PROBAR UNA PRUEBA - La seleccin de una prueba estadstica 2

    2/35

    tFIGURA 8-6. Esquemapara seleccionar un mtodo estadfstico bivariante parauna variable dependiente ordinal {continuacin de la figura 26-5)

    VariabledependienlBordinal

    Variab~independientenomflal

    Intelsen la poscM)nIVariable ndependientede una n1J~ alealoriao intenclnadaIMeCiana

    (Sle~e)I

    Mann.WllineyoPruebade la mediana

    Vanao~n~le0IdiIa1I

    IntersenlapGSdnIVariableW1depend~nlede una ~esraa~loriaIICoe/~-nte de conelaOOnde Spearman

    PnJeba e Spearman

    den comparar ms directamente aplicando una Ilrrlel~ de as nedia,UlS.1oa prueba de lasmedianas generalmente tiene menos potencia estadistica que la de Mann-Whitney.

    22:s"'~-~~:~~

    Variable independiente ordinalSi la variable dependiente es ordinal o continua y transfonnada auna escala ordinal, podemos estimar la fuerza de la asociacin entre la variable depen-

    diente y la indl!pendiente mediante un metodo para1elo al anlisis de la correlacin. Enel caso de las variables ordinales, el coeficiente de correlacin ms utilizado es el coefi-cie1rtede orrt'lacin de Speamlan ($pt'Iln,lan'scorrelation coe.fficient).Este coeficiente se puedecalcular sin realizar muchos de los supuestos necesarios para calcular el coeficiente des-crito para las variablL'S continuas. Es importante recordar que todo coeficiente de corre-lacin puede calcularse a partir de muestras en las cuales tanto la variable dependienteco"ro la independiente son representativas de la poblacin. En otras palabras, tenemosque emplear el muestreo aleatorio. No existe ningn mtodo no paramtrico que nosexima de este supuesto.Al igual que ocurre con el coeficiente de correlacin calculado paralas variables continuas, podemos realizar pruebas de significacin estadstica y cons-truir intervalos de confianza del coeficiente de correlacin de Spearman. Tambin po-demos elevar al cuadrado este coeficiente para obtener una estimacin no paramtricadel coeficiente de determinacin o porcentaje de la variacin de la variable dependienteque es explicado por la variable independiente.

    ", Aun'!ul. Id prul.bd de IdSm"didnds "'. r"ti"r" d m"didds de posicin l'Specticas.es una pru~ nu param~trica.pl,r'!ul. l.n l.lId n" "" ,uplml. 'Iu" IdSml-ddndsd" ,,), d"s !\rupos St!dnpar;imetros de una distribucin plmlaci,>-ndl Jl-tl.rminddd ., 0 --,

  • 8/3/2019 COMO ESTUDIAR UN ESTUDIO Y PROBAR UNA PRUEBA - La seleccin de una prueba estadstica 2

    3/35

    .';;:?:;;'7

    VARIABLE DEPENDIENfE NOMINAL ~;~Los mtodos estadsticos bivariantes para las variables dependien~ Gtes nominales se presentan en la figura 28-7.

    Variable independiente nominal: diseos apareadosSi nos interesa obtener informacin sobre una variable depen-diente nominal y una independiente nominal, tenemos la posibilidad de escoger entreun diseo para datos apareados y uno para datos no apareados o independientes.Construido de forma apropiada, la potencia estadstica de un diseo para datos aparea-dos es ms alta que la de un diseo para datos independientes. Recuerde que el apa-reamiento por parejas es un tipo especial de apareamiento en el cual la variable depen-diente y la independiente se miden en cada individuo a partir de un par de individuossimilares, y las observaciones de cada par se analizan conjuntamente. Cuando anali-zaInOS na variable dependiente nominal mediante un diseo apareado, utilizamos unatcnica bivariante en \-ez de una tcnica univariante como hicimos con la variable de-pendiente continua en un diseo para datos apareados.En nuestro ejemplo anterior sobre la tensin arterial medida antesy despus del tratamiento con un frmaco antihipertensivo, utilizamos un mtodo uni-variante para examinar la diferencia entre las mediciones de la tensin arterial. Con unavariable dependiente continua que se mide por datos apareados es apropiado utilizar

    FIGURA28-7. Esquemapara seleccionar un mtodo estadlstico bivariante para una variabledependiente nominal (continuacin de la figura 26-5)Variat~depe~dienle~Wlal

    I I,~:r.~~~~~~:Q~~:...oc~;..V'\;.,"2;~~~~5'-iJl;.,o~u

    Variab~Inoepe~nlenomnaJ

    Intefsen la posr.K)nI I 1

    D;se.,o D~nopara paradatos apal9a(X!s dalOS Idepen

  • 8/3/2019 COMO ESTUDIAR UN ESTUDIO Y PROBAR UNA PRUEBA - La seleccin de una prueba estadstica 2

    4/35

    una tcnica univariante, dado que podemos resumir las observaciones de cada par em-pleando la diferenda entre esas medidas como variable dependiente. Con una variabledependiente nominal medida en grupos apareados, todava estamos interesados encomparar las medidones entre pares, pero no podemos resumir los datos nominales detal forma que nos sea posible utilizar el anlisis unjvariante.Las variables dependientes nominales permiten obtener cuatro re-sultados posibles entre los pares. En dos de estos resultados, ambos miembros del partienen los mismos valores de la variable dependiente nominal. Por ejemplo, si en unensayo clnico en el cual los individuos se aparean segn el sexo y la edad antes de untratamiento asignado al azar y la variable dependiente fuese la supervivenda, ambosmiembros del par podran sobrevivir o morir. los pares de este tipo se denominan JXlresca1lcordantesconcordant Xlirs).lllos dos resultados restantes de las vdriables dependien-tes e independientes nominales son aquellos en los cuales los miembros de los parestienen resultados opuestos. En nuestro ejemplo, estos resultados se produciran cuandoun miembro del par muere y el otro sobrevive. Estos se conocen como JXlres iscordantes{discordant Xlirs) Consideremos con ms detalle el ejemplo de W\ ensayo clnico quecompara la mortalidad entre las personas que fueron tratadas con un determinado fr-maco frente a las que fueron tratadas con placebo. Supongamos que nos interesa la in-fluencia de la edad y el sexo en la supervivencia, as que identificamos 50 pares de pa-cientes de la misma edad y sexo, y asignamos al azar a un miembro del par al grupo querecibe el medicamento y al otro al grupo que recibe placebo. Adems, imaginemos quelos resultados obtenidos de este ensayo son como los representados en la figura 28-8.En ese caso, habramos observado 9 + 11 = 20 pares concordantes y 6 + 24 = 30discordantes. En este ejemplo, si el tratamiento fuera eficaz. esperaramos ob-servar diversos pares en los que el miembro tratado con el medicamento sobrevive y eltratado con placebo muere. Asimismo, esperaramos observar menos pares en los queel miembro tratado muere ~' el tratado con placebo sobrevive. En otras palabras, espe-rariamos observar una diferencia entre las frecuencias de los dos tipos de pares discor-

    ;:;~~~s.~~~"I:L"s p.1res "ncordantcs son .tn.\Joh"'sa un" difcrcncia cntrc p.1r..'SKu,,1 cero para una variable dependientecontlnu" cn un" pru...N .1p"rc"d" ltC I" I de Studcnt. Dcl mismo modo quc el cero no intluye en la magnitud dela m tio1 e I", dif..-rcncias p.1r" un" \'ari"ble dep'-'ndicnte c"ntinu". I"s p'trcs concordantes no contnbuyen .1 "cvalu",ilin dc 1" ntcrprclarilin dc un" v"ri"ble d"p'-'ndientc nomin,,1 p.1reada. 209

  • 8/3/2019 COMO ESTUDIAR UN ESTUDIO Y PROBAR UNA PRUEBA - La seleccin de una prueba estadstica 2

    5/35

    dantes, si fueran distintas las probabilidades de supervivencia de los padentes trata~y los no tratados. Adems, cuanto mayor fuera la diferencia entre esas recuen

  • 8/3/2019 COMO ESTUDIAR UN ESTUDIO Y PROBAR UNA PRUEBA - La seleccin de una prueba estadstica 2

    6/35

    Por ejemplo, considere un estudio en el que estimamos la preva-lencia de cataratas en las personas expuestas a radiaciones ionizantes cincuenta aosdespus de la exposicin. Suponga que la prevalencia de cataratas en 50 personas noexpuestas menores de 40 aos de edad en el momento de la exposicin fue de 2% En100 personas de la misma edad expuestas a cierto nivel de radiacin ionizante la pre-valencia de cataratas fue de 12%, aproximadamente. Como estimacin puntual que reosume estos datos podemos usar la razn de prevalencias, esto es, la prevalencia de ca-taratas en los expuestos dividida por la prevalencia en los no expuestos, que es gual a12%/2% = 6. Por otra parte, tambin podemos calcular la diferencia de prevalencias ola prevalencia entre los expuestos me/lOSa prevalencia en los no expuestos, que es guala 12% -2% = 10%.Desde un punto de vista estadstico, la eleccin de una razn o deuna diferencia entre proporciones o tasas generalmente no tiene importancia. De he-cho, en el anlisis bivariante se emplean los mismos mtodos para construir los inter-valos de confianza y las mismas pruebas de significacin estadstica sin tener en cuentasi la estimacin puntual es una razn o una diferencia. Esto se desprende del hecho deque la hiptesis nula de una diferencia igual a cero equivale a la hiptesis nula de que

    una razn es igual a I. Cuando una razn es igual a I, el numerador tiene que ser igUalal denominador y, por lo tanto, la diferencia entre el numerador y el denominador tieneque ser igual a cero. Sin embargo, en el anlisis multivariante, la distincin entre lasdiferencias y las razones puede ser muy importante, y se tratar en el captulo 29.Es muy probable que en un anlisis bivariante de las variables no-minales independientes ~' dependientes de un diseo para datos no apareados nos en-frentemos con varios mtodos estadsticos. Como en el anlisis univariante de una va-riable dependiente nominal, estos mtodos son de dos tipos: mtodos exactos yuproximaciones ula distribul.in normal. El mtodo exacto para las proporciones biva-riantes es la prueba L'.TUCtllL' Fi..;J,t'r L'.TUCtisl,er's tt'St).I~ Dos mtodos de aproximacinhubitualmente empleados para las proporciones son la aproximacin normal y las prue-bus de ji cuadrudo.'J L.1s tuSuScusi siempre se unalizun utilizundo la aproximadn nor-mal. Las pruebas de significacin estadstica ~' el clculo de los intervalos de confianzapaia la razn de productos cruzados se basan habitualmente en la prueba ii de ,\/alltcl-Hat'1IS=d, ambin una aproximadn normal.l..Variable independiente continua

    Cuando tenemos una variable independiente continua u ordinal yuna variable dependiente nominal, podemos considerar la posibilidad de que varios va-lores de la variable independiente sigan una tl?1fdenciatrt'r!d). Por ejemplo, quiz nos n-terese examinar la hiptesis de l'studio segn la cual la proporcin de individuos quedl'sarrollan un .lccilil'nte vascular cerebralaumenta de forma lineal a medida que se elevala tensin arteri,11 i.lstl)lica,fr1.'1lte la hiptesis nula de que no existe una relacin inealentre esas variables. Este es el mismo tipo de hiptesis que se considera en la regresin:~~~"C;~~~"'C~"C

    I! L.1 pru..ba ..X.1ct.1 .. Fish..r S4.'.mpl...1 CU.1n.!o 1lguna d~ las frecuencias previstas segn la hiptesis nula en unat..bl.1Z x Ze,;m..norqu..5,I) En realidad. l'n 1:1 1n-ili,.;,; biv;)ri;)nt..l.1 ;)proximOJcin nonnal y la prueba de ji cuadrado ,;on equivalente,;, La raizl"Uadr;)d.1 d..ll:st.1di,.tlco ii cu.1dr,ldo ..,. i:u;)1 ;)1estildistico de la ;)proximacin nonnal," Fn.'Cul:nteml:nt... un;) prulob;) dl: ';1:niiic;)l;n estadstica bivariilnte pdra variables normales exigir realizar una"corTl'Ccin d.. continuld.1d" ("lrr",ilt1tl!,'r ,',,"Iilluily), Esta corTeccin ..s un ;)juste de l;)s observaciones nomi-n.1ll'S cuando ,;e tr.1n'.l)rm.1n l'n dislribucionl:s COfllilll.a$, como 1.1 istribucin ;ausi.1n". para fines de anlisis,EI,'".mplo m-is t.1mlli..r ,II: corrl'Cci,)n de continuid.1d ..,; I.. correccin de Y.1tes emple..da en la prueba de ji CU.1-dr..d" Aclu..lml:nll:. 1",.l";I..di"llco" no I:"t.in d.. .1cuerdo sobre 1.1 tilid.1d d.. ..sta corTe.:cin, Por suert... el us.)o no dl. un.1 CorTl'l'cii)n dl' continuidOld r..r..m..nte lil:nc un impdcto imporl.1nte sobre los result.1dus del .1n.ili,;is 211

  • 8/3/2019 COMO ESTUDIAR UN ESTUDIO Y PROBAR UNA PRUEBA - La seleccin de una prueba estadstica 2

    7/35

    lineal simple con la excepcin de que en este caso tenemos una variable deI>endientenominal en lugar de una variable dependiente continua. En lugar de una re~7esin i-neal simple, realizaremos una pntebade i cuadrado ra tendenciaschi-squareest or trend)Si bien se da un nombre especial a la prueba empleada para inves-tigar la posibilidad de que una variable dependiente nominal siga una tendencia lineal,debemos damos cuenta de que la prueba de i cuadrado para tendencias es muy similara una regresin lineal. Por cierto, las estimaciones puntuales de los mtodos que se em-plean con ms frecuencia para investigar una tendencia son la pendiente y el punto deinterseccin de una ecuacin lineal, que son idnticos a las estimaciones que hemos co-mentado para la regresin lineal. 15

    Imagine que deseamos investigar la tasa de mortalidad entre laspersonas con cncer en los estadios 1,2,3 y 4. Como hiptesis razonable de estudio, sepodra plantear que la tasa de mortalidad aumenta a medida que avanzan los estadiosde la enfermedad. Por lo tanto, deseamos investigar la posibilidad de que la variabledependiente nominal, la tasa de mortalidad, siga una tendencia correspondiente al es-tadio de la enfermedad. En estas circunstancias, en que tenemos una variable depen-diente nominal y una independiente ordinal, esespecialmente importante recordar quela prueba de ji cuadrado para tendencias es muy parecida al anlisis de regresin lineal.Cuando examinamos la tendencia de una variable independiente ordinal, deben asig-narse ..'aloresnumricos a lc1s ategoras ordinales."' La manera como se defulan estosvalores numricos determinar el resultado de Id prueba de ji cuadrado paCil enden-cias. Es una convencin c1signarnmeros enteros consecutivos a estas categoras ordi-nales, a no ser que las categorassugieran una escalaordinalaltemativa. De este modo,la variable ordinal se trata como si realmente tuviera categoras uniformemente espa-cic1das, omo sucedera con los datos continuos. Por fortuna, esta es una pn;eba muyrobusta y, en consecuencic1, s improbable que la ..;olacin de este supuesto tenga ungran impacto. 1;-

    ~:r.'.J::J~~z::J~~~'::J~;..'::Ja2~-J~~~a::J'-~'.JQ~~

    RESUMENLos mt!todosbivari,lntt's ."t' J1.tilizanpara iJnalizar un conjunto deobservaciones que contienen una variable dependiente y una independiente. Las varia-bles independientes pueden ser continuas, ordinales o nominales. Las variables inde-pendientes nominales dividen el conjunto de observaciones en doS grupoS. Esto per-mite Comparar as estimaciones de la variable dependiente de loS doS grupoS. En estecaptulo hemos aprendido que la comparacin de las estimaciones de loS grupos en elanlisis bivariante no t.'510mismo que comparar loS ntervalos de confianza univarian-tes de estas variables.Un supuesto universal de las tcnicas estadsticas es que los valo-res representativos de la variable dependiente se han obtenido mediante un muestreoaleatorio. Por o tanto, debemos suponer que la distribucin de la variable dependiente

    " l.i e"l!m.1cin puntu.11 dl! 1..", .-(1eficil!nt..'Sen un.1 prul!b.1 de ii cu,tdr.1do p.1ra tendencias I!S idntic.1 .1 a I!stirna-..,n en 1.1 e~'resln lineal ~Impll!. r.,ra l .J infl!..'ncia y 1.1.'Stim.1cin por intervalo. se ..'atiza un supuesto algodistinto que producl! intl!r\'alos de confianz.1ligeraml!nte m-is .1mplios y valores p un poco m-is altos ,~n a prueba~ ii .."Uadro1do u... I!n 1.1 .~'n""\n linl!al. Esta difl'rencio1 se redUCI! a m~id.J qu... .1Uml!nta el tamao ~ la mul'Stra..Tamb,n se deb..-n a"i~n.1r valon.'S numliricos .1 a v,tnabll! dl'p~nd il!nte nomin.1l. p~ro su 1!11!ccinno influye en1!1 esultado d~ la Infer..'ncia o dl! la ..'Stimacin por int..'rvalo dl!b,do a la naturall!za dicotmlca dl! la vari.1ble.'- S, bien se h.1n dl!';.:ri!t, ut,,"' m..;todo" para ~x.1minar 1.1 enden..;.1 dl! una variable dependiente nomi:tal re"pectod~ 1..15ak,rl!" d~ un.1 vari.1.k. ,n..il!l"'nt.i,l!ntl' (,rdin,tl qul! no I!'i~..'n .1si~nar valorl!" numricos .."'pt.cjfico" a las..-ate"",ria" "rdin.1I..", nt., par '..'n Il!n..'r ...1 1mplit, u""..I..'1 qu~ hl!mo" ~'plic.1do .1qui, Qui~. un.1 dl! 1.1" ,tLonesJI!I u"', inir..,,-u...ntl! J..' ..."" m...It,.,1o' .llt...m.1livos ~a ..Iu~ no 1!"l!m.1n un.1l!cudcin qul! pul-d.1l!mple.1..1! paraI!x.1mln.1r Id re!",'1..'n ...ntrl! 1.1 .dridbl~ JI!pt.'ndil!nt~ y la indl!p..'nJi..'nt~,

  • 8/3/2019 COMO ESTUDIAR UN ESTUDIO Y PROBAR UNA PRUEBA - La seleccin de una prueba estadstica 2

    8/35

    en la muestra es representativa de su distribudn en la pobladn de la que se extrajo lamuestra. Tambin es posible obtener la muestra de valores de la variable independientede forma que sea representativa de la pobladn. El muestreo representativo de la varia-ble independiente se denomina muestreo aleatorio. Por otro lado, podemos escoger adistribudn de los valores de la variable independiente en nuestra muestra de tal formaque maximice la potenda estadstica o garantice la inclusin de catL'gorasde la variableindependiente que raramente ocurren en la pobladn. Este tipo de muestreo se deno-mina muestreo intendonado y con l se obtienen muestras con valores de la variableindependiente que no son representativos de la pobladn de la cual se han extrado.La distindn entre muestreo aleatorio y muestreo intendonado esespecialmente importante en el anlisis bivariante de una variable continua depen-diente o independiente. En nuestro caso, lo que ms interesa es estimar los valores dela variable dependiente para varios valores de la variable independiente. La estimadnreal de los valores de la variable dependiente se consigue mediante el anlisis de regre-sin. La fuerza de la asodadn entre una variable dependiente continua y una inde-pendiente continua se estima por medio del anlisis de la correladc)n. El anlisis de re-gresin es apropiado sea cual fuere el tipo de muestreo de los valores de la variableindependiente. :-.oobstante, el anlisis de la correladn es til solamente cuando lamuestra de la variable independiente se ha obtenido mediante muestreo aleatorio.Como I)CUrreen el anlisis univariante, las variables continuas enlos grupos de datos bivariantes se pueden transformar a una escala ordinal, si sospe-chamos que la pobladn de la que se han extrado no cumple los requisitos de los an-lisis de las variables continuas. Los mtodos para analizar las variables dependientesordinales son, en su mayor parte, paralelos a los anlisis aplicables a las variables de-pendientes continuas. Una excepcin a esta regla es que no existe un mtodo de usogeneral para realizar un anlisis de regresin con variables dependientes ordinales.Algunos de los prindpios generales del anlisis bivariante de lasvariables dependientes nominales son similares a los de las variables dependientes con-tinuas y ordinales. En IJS rL'S. as variables independientes nominales dividen a un con-junto de observadones en grupos para ser comparados. Adems, nos interesa estimaria \-ariabledependiente para \'arios valoresdela variable ndependiente sin tener en cuentael tipo de variable dependiente. Con las variables dependientes nominales, esto se co-noce como anlisis de tendenda en lugar de anlisis de regresin. Sin embargo, la di-ferenda de terminologa no implica que los mtodos sean muy distintos. De hecho, elanlisis de regresin realizado con una variable dependiente continua es bastante si-milar al mtodo ms frecuentemente usado para examinar una tendend con una va-riable dependiente nominal.Otros principios generalesdel anlisis bi\'ariantE'difieren en los trestipos de variables dependientes. Uno de ellos es el anlisis de los datos de un diseopara datos apareados. Con una variable dependiente continua, los datos se analizanusando mtodos univariantes. Sin embargo, los datos nominales apareados se debenanalizar con mtodos bivariantes. Otra diferenda es la forma en q\le se comparan lasestimadones puntuales cuando la variable independiente es nominal. Para una variabledependiente continua, las medias de los grupos definidos mediante la variable inde-pendiente se comparan calculando la diferenda entre esasmedias. No obstante, con lasvariables dependientes nominales es posible comparar propordones o tasas como di-ferendas o como razones, en el anlisis bivariante. Las pruebas de significadn esta-dstica y la construccin de los intervalos de confianza se llevan a cabo utilizando loSmismos mtodos, tanto si se usan las razones como las diferendas. No obst.1nte, asventajas (IXlds)siempre se comparan mediante una razn.

    "2:-~~-"~--2~

    21.

  • 8/3/2019 COMO ESTUDIAR UN ESTUDIO Y PROBAR UNA PRUEBA - La seleccin de una prueba estadstica 2

    9/35

    ,ANLIsIs MULnVARIANfE

    5:::'1;'Z;:::~'1;~~~;..::)3:::'.I\'-J'Z;:::~'1;3::::;..'.I\:.J::)~.-..u

    En el anlisis multivariante tenemos una variable dependiente ydos o ms independientes. Estas variables independientes se pueden medir en .la mismaoen diferentes escalas. Porejemplo, todas las variables pueden ser continuas o, porotrolado, algunas pueden ser continuas y otras nominales. En los esquemas que figuran eneste captulo solo hemos incluido las variables independientes nominales y las conti-nuas. Aunque en el anlisis multivariante se pueden incluir variables independientesordinales, estas deben transformarse antes a una escala nominal.1El uso de los mtodos multivariantes para analizar los datos de lainvestigacin mdica presenta tres ventajas generales. En primer lugar, permite inves-tigar la relacin entre una variable dependiente y una independiente mientras se "con-trola" 0 se "ajusta" segn el efecto de otras variables independientes. Este es ei mtodoutilizado para eliminar la influenlia de las variables de confusin en el anlisis de losdatos de la investigacin mdica. Por ese motivo, los mtodos multivariantes SE'utilizanpara cumplir con la tercera finalidad de la estadstica en el anlisis de los resultados dela investigacin mdica: ajustar segn la influenlia de las variables de confusin.Por ejemplo, si nos interesa estudiar la tensin arterial diastlicade las personas que reciben di\'ersas dosis de un frmaco antihipertensivo, podramosdesear controlar el eft.'Cto potencial de confusin de la edad y del sexo. Para hacer estoen la fase de anlisis de un proyecto de in\"estigacin, utiliz.lramos un anlisis multi-\'ariante con la tensin arteriall.iiastlica como variable dependiente y la dosis, la edady el sexo como variables independientes.L1 segunda \'entaja que ofrecen los mtodos multivariantes es quepermiten realizar pruebas de significacin estadstic;} de diversas variables mante-niendo al mismo tiempo la probabilidad (alfa) escogida de cometer un error de tipo I.2En otras palabras, a veces empleamos los mtodos multivariantes para e\itar el pro-blema de las comparaciones mltiples presentado en la Seccin 1.Como recordatorio del problema de las comparaciones mltiples,imaginemos que tenemos diversas variables independientes que comparamos con una\'ariable dependiente mediante un mtodo bivariante como la prueba de la t de Student.Aunque en cada una de estas pruebas bivariantes aceptemos solo un riesgo de 5% decometer un errlJr de tipo I, la prl.)babilidad de cometer al menos un error de tiF'o 1 entretodas L'StaS omparacionL'S ser algo m.1yor que 5'7c. La probabilidad de cometer un errorde tipo I en alguna comparacin determinada se denomina tasa de error de la prueOO(~tw;St'). L1 probabilidad de cometer un error de tipo I por lo menos en una compara-cin se denomina tasa de error ft'Il'.'(pl'r;'1It'1lto (t'.'(IIt'r;'1It'1IhL';St'). os anlisis bi\.ariantes

    L.1 conversin de un.J escill.J ordin.J1 .J unil nominill produce un.J p.:-rdid.J de mlormilcin qu~ ~ e'S necesariolushficilr. No ob"l.Jnl~. I.J rdn"iurm.JcI..," de lu" d.Jlus d und l',;c.JLl (onlinUd "u~i"re 'lue lus d.JI,-,", cC'nn~nen mds,niormilcin de I.J 1ue re.Jlmenle p')Sl..'n. lu cudl e" .J m"nud,) ,Iiii...il ,le iu"tiii(drDdd,) que Id pn'l-dblliddd de (,)meter un "rr"r de tip') I hdl-Itudlm"nl" "" "il.J en ,,1 5'~ .l'S1~ '

  • 8/3/2019 COMO ESTUDIAR UN ESTUDIO Y PROBAR UNA PRUEBA - La seleccin de una prueba estadstica 2

    10/35

    controlan la tasa de error de la prueba. Por ob'a parte, muchos mtodos multivariantesestn diseados para mantener una tasa consistente de error de tipo I del experimento.La mayor parte de los mtodos multivariantes se aplican para ana-tizar dos tipos de hiptesis nula. La primera se conoce como hipt,esis nula general O1n-nibus). Esta hiptesis nula plantea la relacin entre la variable dependiente y el conjuntode variables independientes considerado como una unidad. La hiptesis nula generales una de las estrategias de los mtodos multivariantes para mantener la tasa de errorde tipo I del experimento en a = 0,05. No obstante, un inconveniente de la hiptesisnula general es que no permite investigar las relaciones entre cada una de las variablesindependientes y la dependiente de forma individualizada. Esto SE!ealiza mediante elsegundo tipo de hiptesis nula planteada en las pruebas parr:llespartia/) o por pares(pairwise). Estas pruebas no siempre mantienen una tasa de error de tipo I del experi-mento igual a a = 0,05.La terceraventajaque ofrece el anlisismultivariante esque se puedeutilizar para comparar por separado a capacidad de dos o ms variables ndependientespara estimar los valores de la variable dependiente. Por ejemplo, supongamos que he-mos llevado a cabo un gran estudio de cohorte para examinar los factores de riesgo dela enfermed~d coronaria. Entre las variables independientes medidas se encuentran latensin arterial diastlica y la concentracin de colesterol srico. Deseamosdeterminarsi ambas variables ~umentan el riesgo de padecer una enfermedad coronaria. Sin em-bargo, el examen de su capacidad par~ explic~r quin desarrollar; la enfermedad co-ronaria mediante un anlisis bivariante puede ser engaoso si los individuos con ten-sin arterial diastlica elevada tienden a ser los mismos que tienen una concentracinde coles e ol srico elevada. Por otro lado, si empleamos mtodos muJtivariantes paracomparar estos factores de riesgo, podremos separar su capacidad como estimadoresdel riesgo de enfermedad coronaria de su a~rt'7lte sociacin con la enfermedad debidaa la asociacin entre ellos mismos.Dadas las ventajas expuestas, los mtodos multivariantes se em-plean con frecuencia para analizar los datos de las investigaciones mdic~s. Examine-mos ahora ms detenidamente esos mtodos as como las formas de interpretarlos para

    apro\'eChar sus ventajas.VARIABLE DEPENDIENTE CONTINUAVariablesndependientes ominales

    2:s~~~~~~~z~

    En el anlisis bivariante de una variable dependiente continua y deuna variable independiente nominal, esta ltima tiene el efecto de dividir la variable de-pendiente en dos subgrupos. En el anlisis multivariante, tenemos ms de una variableindependiente nominal y por eso es posible definir ms de dos subgrupos. Los mto-dos usados con ms frecuenda para comparar las medias de la variable dependienteentre tres o ms subgrupos son tipos de un anlisis estadstico gE!neraldenominadoa,uilisisde a turianza (a,ralysis fturiance) o, a menudo, A1.'lOVAJfigtlra 29-1).El tipo de ANOVA ms simple es aquel en el cual k variables in-dependientes nominales separan la variable dependiente en k + 1 subgrupos o cate-

    r"rece incon~ru"nt.. qu" unm~tl1do par" Compar"r medi"s se denomin.. "n'lisis de I" VJrianza. L1 razl.'nde 0,;tenombre es qu" ,,1,\NOVA "x"min" I" v"n"cin entr" subKrupoS, supt'm"ndo un" v"riacin Ku,,1 "ntro d" ("d"subl:fUPO.Si I" v"ri"nL.l "nt~ k,s sub~rupo,; "xc"d" 1" v"ri"cin denlro d" "StoS, o,; sul'Krupos d"ben dil.rlr "n1" pt",icin m"did" pt,r 1",;med",;. 21.

  • 8/3/2019 COMO ESTUDIAR UN ESTUDIO Y PROBAR UNA PRUEBA - La seleccin de una prueba estadstica 2

    11/35

    AGURA 29-1. Esquemapara seleccionar un mtodo estadlstico multivariante para una variabledependiente continua (continuacin de la figura 26-5)Valiab~~.COnIi1ua

    V8rilK>1es~18SnomiIales

    Val"llb~~!8Scon~as

    Vari;i)jes11depencfen.1contirlJaS o

    noninalesI

    I~en~~

    I I IVariab~ V~

    ~t8S ~~~de una n1J9St13 ~ UIIi lTI*IraalealOlia o aNIOlia

    V1~Onada

    1n-.9senm~I I INo~r.x. ~r.x.

    1"*"111.~~I I I

    Variabes V~~~de una lTIJesUa de una lT1J8SIra

    a~ o a-tOOa.'11IICixIade

    ~t~deregr85aln

    Coefcient~der8gresK)n

    1~C8n.c ,IeITn1laci1I~I IMediasi

    Wisisc8a~1T1~

    CoeOCenlede det8lT11inaci6n

    F .Fpatt8I

    "'~~"'z~~"'~~~~>-~"5~f-jz~~~Q~t-\J')t.oJ~~u

    gorias. Por ejemplo, supongamos que nos interesa ~studiar la relacin entre la glucemiabasa} y la raza. Adems, supongamos que definimos dos variables nominales (k = 2)para indicar la raza: blanca y negra. Estas dos variables nos penniten considerar tres(k + 1 = 3) subgrupos raciales en los cual~s determinamos la glucemia basal. blancos,negros y otros. Este tipo de A."JOVA se conoce como ANOVA le ulra t'Q (OlIe-Uuy 0\-.OVA)..&La hiptesis nula general en un anlisis de la varianza de una va es que las medias delos k + 1 subgrupos son iguales entre si. En nuestro ejemplo, la hiptesis nula generalseria que la media de la glucemia basal de los blancos es igual a la de los negros ya lade las personas de otras razas.Las categorias creadas por las k variables independientes nomi-nales, que definen k + 1 subgrupos, deben ser mutuametlte excluyentes. Esto significaque un individuo no puede pertenecer a ms de una categoria. Por ejemplo, en la in-vestigacin mdica, se suelen contemplar las razas como categorias mutuamente exclu-yentes. Para cada individuo se registra una sola categoria de raza. En este contexto esimposible que un individuo sea considerado blanco y negro a la vez.

    Cuando k = I. en el an.il",s solo se considera una varial-Ie nominal. En este caso, l.'Stamos comrarando "0"' dossubKTUPOS y el analisls de la varianza d~ una va l-'; ~'.lctam~nte lo mismo que una prul.-ba d~ 1.1 d., Studl.'nt enel.1nilsls bvari.tnt~.16

  • 8/3/2019 COMO ESTUDIAR UN ESTUDIO Y PROBAR UNA PRUEBA - La seleccin de una prueba estadstica 2

    12/35

    Cuando analizamos un grupo de variables como la raza y el sexo,las variables individuales muchas veces no son mutuamente excluyentes. Por ejemplo,un individuo puede ser hombre o mujer sea cual fuere su raza. Por o tanto, es necesariodisponer de otra va que permita que las variables independientes nominales definanlos subgrupos. Habitualmente, la solucin de este problema es separar estas variablesen actores factors).Un factor es un conjunto de variables ndependientes nominales quedefine categoriasmutuamente excluyentespero relacionadas.Por E~jemplo, uponga quetenemos dos variables independientes que definen la raza y una que define el sexo delas personas de nuestra muestra en las que hemos medido la glucemia basal. Las tresvariables independientes de este ejemplo represent~n realmente dos factores separa-dos: raza y sexo. En lugar de k + 1 = 4 subgrupos, definimos (kr;lu + I) X (ksew+ I)= 6 subgrupos entre los cuales deseamoscomparar la media de la ,glucemiabasal: hom-bres blancos, mujeres blancas, hombres negros, mujeres negras, hombres de otras ra-zas y mujeres de otras razas. El tipo de ANOVA que considera varios factores, as comolas diferentes categoras dentro de cada factor, se conoce como M.avA frctorial factorialA1\iOVA).

    En el AJ."10VA actorial podemos contrastar el mismo tipo de hi-ptesis nula general que en el A1"10VA e una va. En nuestro ejemplo, la hiptesis nulasera que la media de la glucemia basal de las mujeres blancas es igual a la de los hom-bres blancos. los hombres negros, las mujeres negras, los hombres de otras razas y lasmujeres de otras razas. Adems, podemos contrastar las hiptesis de la igualdad de lasmedias de la glucemia basal entre los subgrupos de un determinado factor. Esto equi-vale a decir que podemos examinar el efecto por separado de la raza sobre la media dela glucemia basal o el efecto del sexo sobre la variable dependiente. Las pruebas esta-dsticas que se emplean para examinar los factores por separado se denominan pruebasde los efectos 7ri//cilWlesIrUli//effrcts).Todas estas hiptesis nulas d(' los A;\OVA se con-trastan utilizando la distribrlci6n ie F (F tiistriI1lItion).

    Los resultados del anlisis de un efecto principal tienen en cuentalas posibles relaciones de confusin de las otras variables indeper:dientes. En nuestroejemplo. si contrastamos la hipmesisnula segn la cual las medias de la glucemia basalson iguales en los tres subgrupos raciales mediante una prueba de A1\iOVA del efectoprincipal de la raza, esta prueba controlara los resultados segn CUllquierdiferencia enla distribucin del sexo de esos grupos raciales. De este modo, el A"OVA factorial nospermite beneficiamos de la capacidad del anlisis multivariante para controlar el efectode las variables de confusin.

    Para nterpretar las pruebas de loSefectos priru:ipales. es necesariosuponer que el factor tiene la misma relacin con la variable dependiente seacual fuereel nivel de 10S0"troSactores. Es decir, suponemos que la diferencia entre las medias dela glucemia basal de loS negros, los blancos y las personas de otras razas es la mismaindependientemente de que el individuo sea hombre o mujer. Esto no es siempre as.Por ejemplo, las mujeres blancas pueden tener una glucemia basal ms elevada que loshombres blancos, pero la glucemia puede ser similar en las mujeres y los hombres ne-gros 0, de forma ms extrema, los hombres negros pueden tener una glucemia ms ele-vada que las mujeres de esa misma raza. Cuando entre los factores existe este tipo derelacin, decimos que existe una interacci6// interaction)entre el sexo y la raza. Usandola terminologa mdica, podramos decir que existe un sinergismo entre la raza y el sexoen la determinacin de los valores de la glucemia basal. Adems ,je la prueba de losefectos principales, el ANOVA factorial puede usarse para contrastar hiptesis sobre asinteracciones.

    ~~~-

    ~IrZ

    .~:2:~

    21-:

  • 8/3/2019 COMO ESTUDIAR UN ESTUDIO Y PROBAR UNA PRUEBA - La seleccin de una prueba estadstica 2

    13/35

    5~~"'z~~"'::::)~;..aQ:J;...VI'"'Z:J~"':::J;...'.n'-.:9

  • 8/3/2019 COMO ESTUDIAR UN ESTUDIO Y PROBAR UNA PRUEBA - La seleccin de una prueba estadstica 2

    14/35

    la prueba utilizada ms ampliamente en grupos de observaciones que incluyen una va-riable dependiente continua y ms de una variable independiente nominal es a pruL'fXlde Student-Newman-Ketlls.Esta prueba permite examinar todos los pares de mediasde los subgrupos mientras se mantiene una tasa de error de tiF>O del experimentoa = 0,05.7 Una reorganizacin algebraica de la prueba de Student..Newman-Keuls per-mite calcular los intervalos de confianza de la variable dependiente para cada valor delas variables independientes.Variables independientes continuas

    Cuando las variables independientes de un estudio son continuas,podemos escoger entre dos enfoques que corresponden a los tratados en el captulo 28,cuando considerbamos el anlisis de regresin y el de la correlad()n. Casi siempre nosinteresa estimar los valores de la variable dependiente para todos los valores posiblesde las variables independientes. En el anlisis bivariante, utilizarr-os la regresin paraestimar el valor de la variable dependiente dado UIJvalor de la variable independiente.Cuando tenemos ms de una variable independiente continua, el inters en la estima-dn se puede mantener utilizando el aluilisisde egresinnltiie (Imtilie regressioll1Itllysis).En la regresin mltiple se estima la media de la variable depen-diente continua mediante una ecuacin lineal que es similar a la de la regresin linealsimple, excepto que incluye dos o ms variables independientes continuas.

    ~'C~'C~~~"1~

    ~"2:;'C

    y = a + 131 I + 132X2 + ...+ 13kX kPor ejemplo, suponga que nos interesa estimar la concentracin decortisol plasmtico a partir del recuento de glbulos blancos (RGB), la temperatura cor-pof]l y la produccin de orina en respuest.l a una sobrecarga de quidos. Para nvesti-gar esta relacin, medimos el cortisol (~g/I00 ml), los glbulos blancos (103), a tempe-f]tura (oq y la produccin de orina (mI) en 20 paaentes. Mediante ura regresin mltiplepodemos ~stimar la siguiente ~cuacin lineal:

    Concentraande cortisol = -36,8 + 0,8 x GB + 1.2 x temperatura +-4,7 x orinaDel mismo modo que en el ANOVA, en la regresin mltiple po-demos contrastar una hiptesis general que tiene una tasa de error de tipo I igual a a.En la regresin mltiple, segn esta hiptesis, 110e puede utilizar el conjunto de \-aria-bles ndependientes para estimar los valores de la variable dependiente. Para evaluar lasignificacin estadstica de la hiptesis nula general se emplea una prueba F. Supon-gamos que, en nuestro ejemplo, obtenemos una F estadsticamente significativa. Estoquiere decir que, si conocemos el recuento de glbulos blancos, a tempef]tura y la pro-duccin de orina de un paciente. podemos estimar o tener una idea aproximada de suconcentracin de cortisol plasmtico.Adems del inters en la hiptesis nula general, en la regresinmltiple casi siempre es deseable examinar individualmente las relaciones entre la va-riable dependiente y las variables independientes.8 Los coeficientes de regresin aso-L;adoscon las variables independientes constituyen una de las formas en las que se re-.~ dispt)ne de "tras pruebas por pares para realizar comparaciones como l'StaS o para efectuar comparacionesdistint.ls entre las ml-Ji.ls de I"s ,u~rupt)s. Un eiemplo de un tipo de comparacin distinta es aquel en el cua]~"'.Imos comparar un ;rupt) de control con un.l serie de gruptJS experiment.lles., EI.ln.ili,is de 1.1 el.ICi,in entre 1.1,van.lbles individu.lles independientes y 1.1 ependiente es anlo!\0 al examendl' 1",; l.lctorlO'; ..-n .-I/\NOVA factori.ll 219

  • 8/3/2019 COMO ESTUDIAR UN ESTUDIO Y PROBAR UNA PRUEBA - La seleccin de una prueba estadstica 2

    15/35

    CUADRO29.1. Pruebas F parciales de los coeficientes de regresin estimadospara variables independientes utilizadas para predecir la concentracin plasmticade cortisol

    Recuento e granulocitosTemperaturaOrina

    t1~jan estas relaciones. LoS coeficientes de regresin Son estimaciones de las ~ de laecuacin de regresin. LoS resultados del anlisis de regresin mltiple permiten efec-tuar una estimacin puntual y calcular loS intervalos de confianza de estos coeficientes.En las pruebas de significacin estadstica de loS coeficientes individuales se utiliza unaprueM F xzrcial para contrastar la hiptesis nula de que el coeficiente es igual a cero. Ecuadro ?9-1 muestra las pruebas F parciales de las variables independientes utilizadaspara estimar la concentracin de cortis01 plasmtico. Aunque en este ejemplo se re-chaz la hiptesis general, observamos que solo los coeficientes de la produccin deorina y la temperatura son estadstica mente significativos.En la regresin bivariante, los coeficientes de regresin estiman lapendiente de loS valores explicativos lineales de la variable dependiente en funcin dela variable independiente en la poblacin de la que se extrajo la muestra. En la regresinmultivariante, la relacin entre la variable dependiente y cualquier variable indepen-diente no es tan directa. El coeficiente de regresin realmente refleja la relacin que existeentre loS cambios que quedan en loS valores numricos de la variable independienteJsociadoS Con cambios de la variable dependiente desplls de IUlI1t'r L'1lido '1!LI~t,l iL"$ am-/,iLJSfe a turiable dept"ldiente asociadosL"0111osambios de os lulores de todas as Jt.mjs ,uriablesi/uiq'L'ndit'1ltes. Es deCir, la contribucin de cualquier variable independiente particular~n la regresin mltiple solo es la contribucin qul.'sesUptrpollt' a las L"O1ltrib-A-i es le todaslas otras luriables i/rdeperldientes. Esto constituye una buena noticia ya la \-ez una malanoticia. La buena noticia es que los coeficientes de regresin mltipe se puel:ien con-siderar como el reflejo de la relacin entre la variable dependiente y las \-ariables inde-pendientes "que controlan" segn loS efectos de las otras variables independientes. Porello, la regresin mltiple se puede utilizar para eliminar el efecto de una \-ariable deconfusin continua.

    :,:::.~~z:J:c:

    ~c.;-o~::;L1 mala noticia es que "controlar" segn el efecto de otras \'aria-bles independientes es sinnimo de eliminar la variacin de la variable dependjente queest asociada con esas otras variables independientes. Si cada una de dos \ariat:-Ies in-dependientes puede explicar por s sola los mismos cambios numricos de la \ariabledependiente, en una regresin mltiple las dos untas no tendrn importancia para ex-plicar los cambios de la variable dependiente.9 No obstante, si se tiene en cuI~nta esteresultado, se puede utilizar la regresin mltiple para examinar por separadc' la capa-

    cidad de las variables independientes para explicar la variable dependiente .

    -z~:.:~:;=:~

    '-'

  • 8/3/2019 COMO ESTUDIAR UN ESTUDIO Y PROBAR UNA PRUEBA - La seleccin de una prueba estadstica 2

    16/35

    """'~'~""-~

    ~-

    Por ejemplo, suponga que nos interesa concxer el gasto cardacodurante el ejercicio. Como variables independientes se estudian el gasto energtico, lafrecuencia cardaca y la tensin arterial sistlica. Sabemosque catja una de estas varia-bles est fuertemente asociada con el gasto cardaco. Sin embargo, en un anlisis deregresin mltiple sera improbable que la asociacin entre cualquiera de ellas y la va-riable dependiente fuera estadsticamente significativa. Este esultado se puede prever,dada la gran cantidad de informacin sobre el gasto cardaco que' comparten estas va-riables independientes.En la regresin mltiple, la construccin de ]os intervalos de con-fianza y el clculo de las pruebas de significacin estadstica para los coeficientes aso-ciados ndividualmente con las variables independientes son paralelos a os anlisis porpares del ANOVA. En el ANOVA, los anlisis por pares se disean para mantener unatasa de error de tipo I del experimento igual a a. En la regresin mltiple, la tasa de errorde tipo I de la prueba es igual a a, pero la tasa de error del expelimento depende delnmero de variables independientes incluidas. Cuantas ms variclbles ndependientesexaminemos en la regresin mltiple, mayor ser la probabilidad de que al menos uncoeficiente de regresin parezca significativo aunque no exista una relacin entre esas

    variables en la poblacin de la que se ha extrado la muestra. Por o tanto, asociacionesestad sticamente significativas entre la variable dependiente y las independientes, queno se esperaba tuvieran importancia antes de analizar los datos, deben interpretarsecon cierto escepticismo. 10Si todas las variables independientes continuas de un grupo de ob-servaciones son el resultado de un muestreo aleatorio de alguna F'Oblacinde inters,podramos estimar la fuerza de la asociacin entre la variable dependiente y todas lasvariables independientes. EStoes paralelo a nuestro inters en el anlisis de la correla-cin bivariante. En el anlisis multivariante, el mtodo utilizado para medir el grado deasociacin se denomina anlisis de la correlacin mltiple. El resultado del anlisis dela correlacin mltiple se puede expresar tanto como un coeficiente mltiple de deter-minacin o como su raz cuadrada, el cOt'ficit'llte ecorrelacinmltiple (multiple correlati011coefficil.'llt),Es mportante recordar que estos estadsticos reflejan el'F;radode asociacinentre ia variable dependiente y todas las variables independientes. Por ejemplo, su-ponga que en nuestro ejemplo obtenemos un coefiCientede deterrninacin de 0,82, loque quiere decir que 82% de la variacin de la concentracin del cortisol plasmtico delos pacientes puede explicarse conociendo el recuento de glbulo~; blancos, la tempe-ratura y la produccin de orina. La prueba F estadsticamente significativa correspon-diente a la prueba de la hiptesis nula de la regresin mltiple tambin contrasta la hi-ptesis nula segn la cual el coeficiente de determinacin poblaciorlal es gual a cero. Apartir de estos mismoS clculos se pueden derivar loS ntervalos de confianza de los coe-ficientes de determin.lcin. ~~~::..-...ooJ

    :::~!I):.q~z""

    Variables independientes nominales y continuas

    Esta perspt'ctiva Lj~ 1.1 nf~r~ncia l'stadstica y de la estimacin por intervalo es un ejemplo de la aproximacinbay~siana. En la infl'rl'ncid bdy~siana. consid~ramos el valor p y la probabilidad antenor. independiente de losdatL)S. de la hipt}tl'sis nlll.l como verd.lder.l p"ra determinar la probabilidad de la hip

  • 8/3/2019 COMO ESTUDIAR UN ESTUDIO Y PROBAR UNA PRUEBA - La seleccin de una prueba estadstica 2

    17/35

    c4

    ejemplo, suponga que diseamos un estudio para explicar el gasto cardaco a partir delgasto energtico durante el ejercicio. Adems, esperamos que la relacin entre el gastocardaco y el energtico seadiferente entre ambos sexos. En este ejemplo, nuestras ob-servaciones comprenderan una variable dependiente continua, el gasto cardiaco; unavariable independiente continua, el gasto energtico; y una variable independiente no-minal, el sexo.

    -::~...::J:G~"~:G~~:):G~>-:):52;J")"-J"2;::J:G-c:-V\"-J:)~ov

    Para examinar estos datos, que contienen una variable depen-diente continua y una mezcla de variables independientes continuas y nominales,utilizamos una prueba denominada anlisis de la cOtUrianza al!Qlysisof COt~riance)A""COVA. Las variables independientes continuas en el ANCOVA se relacionan con la\'ariable dependiente de la misma fonna que en la regresin mltiple. Las variables in-dependientes nominales se relacionan con la variable dependiente de la misma fonnaque las variables independientes nominales se relacionan con la variable dependientecontinua en el Al\!OVA. Por lo tanto, el ANCOVA es un mtodo hlorido que contieneaspectos de la regresin mltiple y del ANOVA.Un uso comn del Ai\!COVA que es similar al del Ai""OVA es el es-tudio de la estimacin de una variable dependiente continua a partir de una variableindependiente nominal mientras se controla el efecto de una segunda variable. En elA.'JCOVA, la variable que se controla es continua. Un ejemplo de esto lo constituye lacapacidad de controlar los efectos de confusin de la edad cuando se estudia 1.3 socia-cin entre una variable independiente nominal, como el tratamiento frente al no trata-miento, y una variable dependiente continua, como la tensin arterial diastlica.El A1\!COVA tambin se puede considerar como un mtodo deanlisis de regresin mltiple en el cual algunas de las variables independientes sonnominales en lugar de continuas. Para ncluir una vriable ndependiente nominal enuna regresin mltiple, tenemos que transformrlaa una escalanumrica. Una varia-ble nominal expresada numricamente se denomina varibleficticino illdiclliora i,ldica-tor o "dul/ll/ll" variable). II

    .Con frecuen.:i.1, os valorL"$ umri.:os asociados con una variablenominal son el cero y ell. En este caso, el valor I se asigna arbitrariamente a las obser-vaciones en las cuales est reprcsent:ld:a una de Isdos categoras potenciaies de ia va-riable nominal; y el cero, a la categora no representada. Por ejemplo, si introdujramosel sexo femenino en una regresin mltiple, podramos asignar el valor I a las mujeresy el cero a los hombres.Para \'er cmo se pueden interpretar las variables indicadoras enla regresin mltiple, reconsideremos el ejemplo anterior: tenemos una variable inde-pendiente nominal para describir el sexo y una "'ariable ndependiente continua, el gastoenergtico, para describir la variable dependiente continua del gasto cardaco. El mO-delo de regr~sil)n mltiple en este ej~mplo se expresa del siguiente modo:

    Aun'!u~ p'-,.j"mll' cllnsid"r..r ~I A\;COVA comll un.. "xt"nsin d~1 ANOVA II d~ I" r~;rl.'5jn multlple. l.'5to no"i;nlfic.. '!u" I.. int..rprelacin dt.-i A\;COVA "'.. dislinla ",,-;un ,,1 m"ll~ ..plicado. En ,,1 ~j"mplu d,,1 g.lSIO car-d..co d"scrit() Cl)mU lunci()n d~1 ...xu y d,,1 ~.."t() "n"r~l:tlcu. p',.jri..m()s r"..liLar un A\;COV/\ cum() un A\;OVAcon un f.ICt()r l.1 "'X(). '1u" (ontn'" ,,1 "il'CI() d,,1 ;..,tu "n"r!\l;tic() cumu "' "si" constituy"ra un" \,..n..bl" d~ con-tusIn. Al h..c"rk). obt~ndri..mus r"sull..d()s jd';nlicus ..I(),. d" una r"Krl".in. En re..lid.ld. ~I A\;OVA. ~IA\;COVA \' 1.1 e~r~si.:)n mulliple sun "j"mpk", d,,1 mi"m() m"I(Id() "st..dslicucunucid() c()mu ",~I..lIl"",/.I:t"'C'Td1(1:..I1.T"III"."r "",I..) El A\;COVA 'e pu"dc rl!pr"Sl'nt..r c()m() Un.1 rl'~r",i,.'n multipl" "n la qu~ I..s \'ariabl~ in-d"pt.ndi"nt", .;.'n r"prl""'nl.lcit)",'S num';ric.." d" \,aridbl"" n()mln..I"" U), .."il'Clus princip"I~.. ,.., mld"n me-di..nt" ...".Iic...n!l.' ..,..".i..d"" c()n I.." \,..ri..bl", Indic..d()r..,,; \' 1.." ..inl~rd.:ci.)nl"'... ml-di..nt" ,,1 pn,.jucllI d" "slas\"..rl..bl", Indic..J,.r.., rl1l.. r"gn"..\n. ",t.." I..mbil:n ,," J"n()min..n Inl"r..cciun..'S.

  • 8/3/2019 COMO ESTUDIAR UN ESTUDIO Y PROBAR UNA PRUEBA - La seleccin de una prueba estadstica 2

    18/35

    Y=.a+~X+~Idondey = gasto cardacoX = gasto energticoI = indicador del sexo masculino(1 para las mujeres, O para los hombres)

    Dado que los hombres estn representados por I = O y cero mul-tiplicado por ~2 es cero, la ecuacin de regresin mltiple para los hombres es igual a lasiguiente ecuacin bivariante de regresin:y = a + ~X

    Tambin podemos representar la ecuacin para las mujeres comouna regresin bivariante. En este caso, la variable indicadora o ficticia es igual a 1 y1 x 132 132.Dado que 132 a son constantes para las mujeres, podemos describir lasreladones entre el gasto cardaco y el energtico entre las mujeres como:y = (a + 13J + 131Si comparamos la ecuadn de regresin para los hombres con lade las mujeres, podemos observar que el coeficiente de regresin asociado con la varia-ble independiente nominal (132) s igual a la diferencia entre los puntos de interseccin(el gasto cardaco, cuando el gasto energtico es igual a cero) para los hombres y paralas mujeres.

    '2::s~"~-..---~'J\~.~:2:"

    Uno de los problemas que surgen cuando usamos la variable in-dicadora para comparar la relacin entre el gasto cardaco y el energtico de los hom-bres con esta relacin en las mujeres es que debemos suponer que los hombres y lasmujeres se diferencian solamente en los puntos de interseccin de sus ecuaciones deregresin individuales. Esda;r, suponemos que un aumento de una unidad en el gasto~nergtico se asocia con el mismo aumento en el gasto cardaco en loShombres yen lasmujeres. Esto implica que la pendiente de la relacin entre el gasto cardaco yel enl"r-getico para los hombres es la misma que para las mujeres. Muchas veces no estamosdispuestos a aceptar este supuesto de la igualdad de las pendientes. Cuando esto su-cede, podemos crear otro tipo de variable en el enfoque de la regresin mltiple delA;\;COVA multiplicando una varidble independiente continua por la nominal transfor-maclaa una escala numerica. Esta nueva variable se denomina tn"ino de ntemccin in-ttTtlctivn tTI/I).I~En nuestro ejemplo, la ecuacin del ANCOVA que incluye un trminode interaccin entre el gasto energtico (X) y el sexo (I) sera:Y = a + ~IX + 1321 ~XI

    Para os hombres, esta ecuacin es de nuevo llna ecuacin de re-gresin bivari,mte, dado que I = Oy, por lo tanto, O x 133 O:Y=a+~XPara as mujeres, dado que I = 1, la ecuacin es

    Y = (a + 13~)+ (131+ ~) Xl.l" Il'rmin(', J.: intl.r,)cci,in n(1 l. "mll,)n ,)1pruducto de un,) v,)riable conlnu,) y un,) nominal Much,)s ,~es~",.jl.mu, ub",rv,)r ntl.r,)cciunl.' qu" ",n ,,1prodUCI" d" d(}s vari..bles nomnall'S. T..mbien 'S posble c"nsid"r,)rlIn.l int"r,)cctin l.nlrl. J", ,...ri,)Nes ."ntinu..s. pt.'ro ,) nterpretaciln de 'Ste producto es muchu m.1s "mplic,)J,). :?23

  • 8/3/2019 COMO ESTUDIAR UN ESTUDIO Y PROBAR UNA PRUEBA - La seleccin de una prueba estadstica 2

    19/35

    FIGURA29-2. ,dependiente ordinal (continuacin de la figura 26-5)Variable~\8OI!i1alValilbles~8SOOIIinales

    Ilrlem en~posmDeeoo paradatos aa19aQ)S

    Ip~~Friedman

    D~ paradat~ ~nt8SI

    p ruea deKAJskal-Wafe

    El coeficiente para la variable indicadora (132)ndica la jiferenciaentre los puntos de interseccin para los hombres y para las mujeres. El coef ciente deltrmino de interaccin (133) os informa de la diferencia entre las pendientes de ambossexos. Por consiguiente, tenemos tres variables independientes: una variable continua,una variable nominal expresada como variable indicadora y un trmino de in teraccin.En esta situacin, un ANCOVA es semejante a tener una regresin bivariarte por se-parado para cada una de las dos categoras dentificadas por la variable inde!)endientenominal. En este ejemplo, podemos estimar mediante regresiones separad)s la rela-cin para los hombres y para las mujeres. Adem.is, el A1'\1COVA os permite compararestas dos ecuaciones de regresin por medio del contraste de las hiptesis dt los coefi-cientes de regresin de las variables indicadoras y de los trminos de interaain.;;:..:J~~z:J~;;::1~>--~~:J,...'-'I..z:J~-.:~2~'"Jo~u

    VARIABLE DEPENDIENfE ORDINALEn los anlisis univariante y bivariante, disponamos de mtodosestadsticos para analizar las variables dependientes ordinales y para po~ibilitar latransformacin de las variables dependientes continuas a una escalaordinal, cuando nose podan cumplir los supuestos necesarios para utilizar los mtodos estadsticos dise-ados para las variables dependientes continuas. Esto tambin es cierto para los mto.dos multivariant~s con v~riabl~s dependientes ordinales.Id~~lmente, desea iamos disponer de mtodos para las variablesdependientes ordinales que fueran paralelos a los mtodos multivariantes p.-ra las va-riables dependientes continuas: ANOVA, ANCOVA y regresin mltiple. Larnentable-mente, esto no es as. L1S nicas tcnicas multivariantes aceptadas para las variables

    dependientes ordinales son aquellas que pueden usarse como equivalentes no para-mtricos de ciertos diseos del A1~OVA.1J or eso, la figura 29-2 se imita a 105mtodosque pueden emplearse '.\"C/USitVlII/t'lltt'on variables ndependientes nominales y una va-Aun'!u" no ..'S " uS() )mpli". ,,1 ,lJilisls J.. rl~rl""\III.~i,II,.1/ (IrJ,11,/,.rJi,Ulil.~ISII' rt'.\'r""si",,) .'S n rl~I",j" pro-m"l"dt)r ,!Ut! p'"jri.. iin"lm,.nt,' ~..n..r ",..'pl..,i,in ...,'m,' ,)rm.. d" m,luir \",1ri..bl..,snd..'f't!nd;.'nl.." , )nllnu..s "n..,I..n.ili,is multi\""n..ntt! d" \""ri..bl..'S ..'p"nJi..'nl"s ,)rdin..I,',:?24

  • 8/3/2019 COMO ESTUDIAR UN ESTUDIO Y PROBAR UNA PRUEBA - La seleccin de una prueba estadstica 2

    20/35

    ariable dependiente ordinal. Para poder aplicar esos mtodos, las vc iables independien-tes continuas u ordinales deben transformarse a escalasnominalE's.Por un momento, reconsideremos el ejemplo anterior de la gluce-mia basal medida en personas de tres categoras raciales (negra, blanca y otras) y deambos sexos. En este ejemplo, nuestro inters se centraba en dete :minar los efectos n-dependientes de la raza y el sexo en la glucemia. Para analizar es os datos, utilizamosun Ai"JOVA actorial. Si estuviramos preocupados por el cumplimiento de los supues-tos del A1~OVA1. n relacin con la glucemia basal, podramos tralsformar estos datosa una escala ordinal mediante la asignacin de rangos relativos a las mediciones de laglucemia basal. Entonces podramos aplicar la prllebadeKruskal-W('llisa los datos trans-formados. Esta prueba es apropiada para realizar las pruebas de ~ignificacin estads-tica de una variable dependiente ordinal y dos o ms variables independientes nomi-nales en un diseo de una va o uno factorial. Tambin existen tcnicas no paramtricaspara realizar comparaciones por pares entre los subgrupos de la v lriable dependiente .Como hemos comentado anteriormente, los rntodos estadsticospara las variables dependientes ordinales se conocen como no para mtricos, porque noexigen realizar supuestos acerca de los parmetros poblacionales. Los mtodos no pa-ramtricos permiten contrastar hiptesis relacionadas principalm~nte con la distribu-cin general de la poblacin. La distincin entre hiptesis paramE'tricasy no param-tricas, por lo tanto, reside en que en las segundas se hacen afrmaciones sobre ladistribucin de los valores para la poblacin gt'1leral,mientras que en las hiptesis pa-ramtricas se realizan afirmaciones sobre medidas l'Specficasesulnidas o parmetroscomo la media poblacional.Al analizar los datos de un estudio en el que ~e mide una variabledependiente continua tres o ms veces en los mismos individuos (I en individuos apa-reados, probablemente L'SCOgeriamosn AJ\iOVA para medidas rept'tidas. Por otro lado,si la variable dependiente fuese ordinal o continud y deseramosc(lnvertirla en ordinalpara obviar los supuestos del A. iOVA, todava podramos beneficia :nos del diseo apa-reado. L"naprueba no paraml!trica paralelaal t\. iOV;-\ para medidas -epetidases a !lr:ILi11de Fril.'Lilllllll.

    Cuando empleamos mt(.iosmultivariantes diseados para \"a-riables dependientes ordinales con objeto de analizar grupos de obs ~rvacionesquetienen una variable dependiente continua transformada a una escalaordnal, debemostener en cuenta una desventaja potencial: que la tcnica no paran\trica tiene menorpotencia estadstica que la parametrica correspondiente si la variable dependiente con-tinua no viola los supuestos de la prueba parametrica. Esto se aplica a todas las tcnicasestadsticas realizadas con variables continuas transformadas a uni escala ordinal. Poreso, si se cumplen los supuestos de una prueba paramtrica, es aconsejable utilizarlapara analizar una vari.lble dependiente continu.l ,lntes que la tecrica no paramtricaparalela" ~"':r:"'~~~.~z~~

    VARIABLE OEPENDIENTE NOMINALEn la investigacin mdica, a menudo nos int.~resan os desenla-ces de vida o muerte, o curacin o no curacin, medidos como dat(IS nominales. Ade-ms, a causa de la complejidad de los fenmenos mdicos, casi siempre es deseableme-

    LI)s supu~slos d~I,\NOVA y dl!l ANCOVA ,;on lo,; mismo'; qul! k),; dl!,;(rilo,; ;nll!riorr,enll! p.>r;rl!!:rl.'.i\n. ;n.lisis J~ . -. >

  • 8/3/2019 COMO ESTUDIAR UN ESTUDIO Y PROBAR UNA PRUEBA - La seleccin de una prueba estadstica 2

    21/35

    ~""~

    FIGURA29-3. Esquemapara seleccionar un mtodo estadfstico multlvariante para una rariable .dependiente nominal {continuacin de la figura 26-5) ,ffi\Variable ""~dependoenfenomInalVnbJes

    ind8!*ldientesnoml1a~sVariables~defend~ntesnoml1a~soCOnll~as

    Inler9sen a poscK\nI I ID8f)8nMnre ~ dependientedel J8fT1IX! del tiemJXJ

    Inleresen la poso6n

    P~KIn.razn o dj819nciao razn de

    pro

  • 8/3/2019 COMO ESTUDIAR UN ESTUDIO Y PROBAR UNA PRUEBA - La seleccin de una prueba estadstica 2

    22/35

    En este caso, a prevalencia del cncer 4e pulmn es a variable de in ters y, por lo tanto,la variable dependiente nominal. Beber caf (s o no) es la variabl~ independiente no-minal. Al mismo tiempo, podramos desear ajustar segn el efecto ie confusin poten-cial del consumo de cigarrillos. Para ello, podemos incluir otra vanable independientenominal que identifique a los fumadores respecto de los no fumadl)res.Cuando tenemos dos o ms variables indepelldientes en un con-junto de datos y todas son nominales o han sido transformadas a lma escala nominal,el enfoque general para ajustar segn las variables independientes :nuchas veceses unanlisis estratificado stratifiedanalysis).Como se ha descrito en la Seccin 1, os mtodosde anlisis estratificado exigen separar las observaciones en subgrupos definidos porlos valores de las variables independientes nominales que se con~ideran variables deconfusin. En nuestro ejemplo sobre la prevalencia del cncer de pulmn y del con-sumo de caf, comenzaramos el anlisis estratificado dividiendo nuestras observacio-nes en dos grupos: uno compuesto por fumadores yotro, por no ftlmadores.Dentro de cada subgrupo, como el de los bebEdores y el de los nobebedores de caf, estimaramos la prevalencia de cncer de pulmc n en los fumadoresy en los no fumadores por separado. Estas estimaciones separadas se conocen comoestimaciones puntuales L'SpecficaselL'Stratostratum-specific). as estimaciones puntua-les especificas del estrato se combinan empleando un sistema de poi deracin U~gllting)de los resultados de cada estrato. Es decir, combinaramos la informacin de cada es-trato utilizando uno de los muchos mtodos disponibles para detl~rminar cunto im-pacto debe tener cada estimacin espefica del estrato en la estim)cin combinada.15La estimacin combinada resultante se considera una estimacin PLntual ajustada o es-tanda rizada para todos los estratos en conjunto con los efectos de LI variable de confu-sin eliminados.

    -~"'~~-:~erodosde segui-miento, lo cual sucede c}si siempre. Estos problemas se pueden s,>lventar si conside-ramos la incidencia como la variable dependiente, ya que la tasa de i ncidencia tiene una

    IS El sist..1nd d" p"nd .,r.1ciun de la" "stim.1cI'm~s ""p"(ificas del "strato es una de las fom .1S n qu~ se diferenci.1nlo" distintos m"tudos de .1nlisis ~stratifi(.1do. En la ~standarizaci6n directa, el sistemi de ponderacin se basa~n la frecuenCl.1 r~l.1tlv.1 d~ cada l'Strato l'n una pobl.1cin de referencia. Desde un pl nto de vista ~sl.1disti(o.lo" ,;i!itl'mas J~ p',ndera.:i,)n mas utlll'S son los qu~ r~ll~ian la pfl'Csin de las estima :iones ~sp'...,ficas de "'sl',;tratu, 227

  • 8/3/2019 COMO ESTUDIAR UN ESTUDIO Y PROBAR UNA PRUEBA - La seleccin de una prueba estadstica 2

    23/35

    unidad de tiempo en el denominador y, de ese modo, toma en cuenta el tiempo de se-guimiento. Lamentablemente, la inddenda es una medida que puede interpretarse defonna errnea. Para a mayora de las personas es difdl comprender intuitivamente elsignificado de casos or ao-personacases erperson-year). or el contrario, es mucho msfdl comprender el riesgo.Recuerde que el riesgo es la propordn de personas que de-sarrollan un desenlace durante un periodo de tiempo determinado. No otstante, ob-serve que el riesgo es una variable dependiente del tiempo, pues se calcula para un pe-riodo de tiempo determinado. Del mismo modo, no es posible interpretar el riesgocalculado a partir de los datos que representan diversos periodos de tiempo, como lo espara la inddenda, porque el riesgo no contiene ninguna dimensin tem :>oral en eldenominador. Si nos interesa el riesgo y los datos contienen observaciones reali-zadas en personas seguidas durante periodos de tiempo distintos, debem.)s empleartcnicas estadsticas especiales para ajustar segn las diferencias en los peri,Jdos de se-guimiento. Cuando todas las variables independientes son nominales, los m ~todos queutilizamos son tipos de anlisis de las tablas de vida (life-table arUllysis). En esto'j mtodos,los periodos de seguimiento, por ejemplo intervalos de 1 ao, se considera 1 como ungrupo de variables independientes nominales. Cada intervalo de 1 ao se lltiliza paraestratificar las observaciones del mismo modo que se estratifican los dato~ segn lascategorias de una variable de confusin como el grupo de edad. La supervi'.encia acu-mulada (cumulatitJe survit"/),l que es igual a 1 menos el riesgo, se detennna combi-nando estas probabilidades ajustadas de sobrevivir cada periodo.Generalmente. se emplean dos mtodos para analizar la tabla de\'ida: el mtodo de Kl1plan-'vII.'tT del producto lmite (1lrl1tiuct limit) y el de Cuter-Ederer oactuarial (acharia/). Estos mtodos se diferencian en la forma de manejar los datos de laspersonas cuyo seguimiento termina en un periodo.'7 En el mtodo de Kap:an-Meier,se supone que el seguimiento termine al final de cierto intervalo de tiempo. P)r su lado.en el mtodo de Cutler-Ederer se supone que los tiempos de finalizacin del segui-miento se distribuyen uniformemente durante el periodo. Como consecuencia de estossupuestos diferentes, las estimaciones de riesgo del mtodo de Cutler-Ederer tienden aser ligeramente ms altas que en el de K.1plan-~leier. Existen mctodos estad~;ticos paracalcular las estimaciones por intervalo y para realizar pruebas de significacic n estads-tica para ambos mtodos.

    5~~"C"Z~~"(:r::J~::..>-::J32j~~"(52:./1;.J...,~

    Variables independientes continuas o nominalesEl anlisis estratificado que hemos presentado para la~ variablesdependientes nominales, dependientes e independientes del tiempo, y para las varia-bles independientes nominales tiene para muchos investigadores el atractivo lie que pa-rece ms simple y controlable que otros tipos de anlisis. No obstante, el an isis estra-tificado presenta algunas limitaciones. Este tipo de anlisis se ha diseado para examinarla relacin entre una variable dependiente nominal y una independiente noml nal mien-

    US tdbldS de vidd se dis..'dron inil-idlmente pdrd consIderar el riesgo de muert~. pero pueden u ilizarse paracalcul.1r ~I riesFp de l-Udl,!ui"r d~s"nl"c~ irr~v~rsibl~En el "nalisls de I" tdbl" d... vId". l.1 ,;e~lmj.,nto dur"nte un peri,~o pul-de findliZdr por dive~; moti,1)S Elmas comn l"' Id t..'rmin"ci"n d~1 ~Iudiu. A menudu. hlS "studios ,;e di~"n p"ra reclutar a los sui~tos durante~ran parte del p'-"riodo de ~studio y suspo.'nder ~l SI.,;ulmientu en un" f..'Ch" concretd. Los sulet~ -eclutados alinicio del peri,~I> contnbulran " los datos d~ c"d" po.'riodo de "nalisi,. de I" tabla d~ vid... Los sujetllS reclutadosh"Cld ~I fin,,1 do..I..',tudio "' ,,;uen durante p'-"ril~OS mas .."l>rtosy su '..';uimi..'ntu lerrnin" ,,1 inaliLIr el ~studioOtros su,..'to" pul'd~n ..po.'rdl'r"l'.. ..turant..' un po..ri,)do de SI.-;uimIento, p""lue ,Ib"ndon,," l'l est\ldIO. porquef"I1..'C~" ~b,du " C.U"I' "l) "'I.clondda,, Con cl ~"tudio. etc28

  • 8/3/2019 COMO ESTUDIAR UN ESTUDIO Y PROBAR UNA PRUEBA - La seleccin de una prueba estadstica 2

    24/35

    tras se controla segn el efecto de una variable de confusin nomI\a1. Este anlisis nopennite examinar directamente variables explicativas alternativa:;, investigarlas inte-racciones o el sinergismo, considerar las variables continuas de co 1fusin sin transfor-marlas a una escala nominal ni estimar la importancia de las variables de confusin.Muchas veces, estas son caractersticasde gran inters para los inVl~tigadores mdicos.Los mtodos de anlisis que penni ten investi~ arsimultneamentelas variables independientes nominales y continuas y sus nteracci(,nes son paralelas ensu enfoque general a la regresin mltiple tratada anteriormente. ~;inembargo, los m-todos que empleamos aqu difieren de la regresin mltiple en tJ"es spectos. La pri-mera diferencia, como se indica en el esquema, es que la regresill mltiple es un m-todo de anlisis de variables dependientes continuas, mientras que ahora estamosinteresados en variables dependientes nominales. La segunda diJerencia es que en lamayor parte de los mtodos aplicables a las variables dependient~ nominales, no seutiliza el mtodo de los mnimos cuadrticos empleado en la regesin mltiple paraencontrar el mejor ajuste de los datos. Casi siempre, los coeficiente) de regresin de lasvariables dependientes nominales se estiman util izando el mtodc, de la mxima 't'Tosi-militud (11IQXimumikeliJIood).ldLa tercera diferencia es quiz la ms importante para los investi-gadores mdicos que interpretan los resultados del anlisis de regresin con variablesdependientes nominales. Aunque este tipo de anlisis proporcionz estimaciones de loscoeficientes de regresin y de sus errores estndares, el resto de la informacin que re-sulta del anlisis es distinto del de la regresin mltiple. La razn cJnsiste en que estoscoeficientes de regresin no proporcionan estimaciones paralelas 1 os coeficientes decorrelacin. Por eso, sin un coeficiente de determinacin, no es p,>sibledetenninar elporcentaje de la variacin de la variable dependiente que es explic Ido por el grupo devariables independientes. 19Para os desenlacesdependientes del tiempo, el mtodo de regre-sin habitualmente empleado es el mOlfeloeCo.\"Coxmodef}.20 n es e modelo, el grupode \-ariables ndependientes ;..,si se desea, sus interacciones, se enlplean para estimarla incidenciazl de la variable dependiente nominal,~ como la incidellcia de la muerte. Se

    puede utilizar una simple combinacin algebraica de los coeficient~s de ciertomod~lude Cox para estimar la curva de supervivencia en una serie de vahlres de variables in-dependientes. Cuando todas las variables independientes son nom I\ales, el modelo deCox estima las curvas de supervivencia que son muy semejantes a las que resultan delanlisis de la tabla de vida de Kaplan-Meier. Por eso, cada vez se o)serva con ms fre-cuencia el uso de este modelo en la investigacin mdica, tanto para la construccinde cun-asde las ablasde vida como para ajustar os datos segn as variablesde confusin.Las variablesdependientes nominales que no d ~pendendel tiempose analizan frecuentemente mediante uno o dos mtodos multivari 1ntes:el anlisisdis-crimi,lllllte (Jiscrimilumt aluliysis) y la regresi/llogstica Iogistic egress~). ~:s:c~~---

  • 8/3/2019 COMO ESTUDIAR UN ESTUDIO Y PROBAR UNA PRUEBA - La seleccin de una prueba estadstica 2

    25/35

    Como se deduce de su nombre, el anlisis discriminalte est di-seado para discriminar entre subgrupos definidos por una variable depeIldiente no-minal. Aqu, nos hemos limitado al anlisis que abarca una variable depend ente y, porlo tanto, solo estamos interesados en discriminar entre dos subgrupos. No obstante,una de las ventajas del anlisis discriminante es la facilidad con que puede ~tenderseal anlisis de ms de dos subgrupos. De este modo, puede utilizarse Jara datosnominales con ms de dos categoras potenciales, como un mtodo estadisticomultivariante. El anlisis discriminante es muy similar a a regresin rr l tiple porel mtodo de los mnimos cuadrticos,~ y permite estimar un coefiente de determi-nan y estadsticos relaonados. Los coeficientes de regresin estimados ,~nel anli-sis discriminante se pueden utilizar para predeCir la probabilidad de pertenena aun subgrupo de individuos con un determinado grupo de valores en las v,riables in-dependientes.

    ~~~z::J"'-c~:)"'~;...:)~-2-'I'oJz::J~~:5::J;...I./\'.J:)rediccio-nes imposibles es un inconveniente del ilnlisisdiscriminante.Como alternativa, a menudo las variables dependiente:; nomina-les que no dependen del tiempo se analizan mediante la regresin logstica. E:cisten resdiferencias importantes entre la regresin logstica y el anlisis discriminan :e. La pri-mera es que la regresin logstica no est tan estrechamente reladonada COl' a regre-sin mltiple como para compartir el supuesto de que una variable dependit'nte sigueuna distribucin gausiana. La segunda es que IJ variable dependiente no se expresadirectamente como la probabilidad de pertenencia a un gru po. La tercera es q ue as tc-nicas de regresin logstica no se pueden ampliar fcilmente para considerar ms deuna variable nominal.En la regresin logstica, la variable dependiente es el ogaritmoneperiano de la ventaja (Olitis)de pertenencia a un grupo.:1 Con esta presentacin de lavariable dependiente, la transformacin resultante para estimar las probabilidades depertenencia a un subgrupo se reduce al intervalo comprendido entre Oy 1.2.'Especifi-~O) De h,'Ch". ~1"n.ilisis dis.:nmin"nte wl"m~nt~ 5e difl'renci" del ml't,ldll J~ llIs minimlls cuddrjtlc,'s ole regre,;l'in

    de un" vilri"ble J~p"ndi~nt~ nllmin.tll'n un mult.plic"JlIr cllnst"nte." Estll se C"nllCe l"llmlllrall';'.lrrfflIClll 1t'.\"1 1l\\"llrall';/ilrnlatu.I1)." Otro mlldelo de ",;resl.:'n qUl' tiene I" pnIpl,-J"d d~ l',;t.m"r I",; p..,b"bllld"d,',; del interv"lo compn ndldll ~ntreO y l ..'5 el.JIltil,,;l; ",,'',1 (I'ro/lll "lIllly,;I"). Este t.po J,. .ln.ilisis n" ". ve con Irl'CU"ncl" ~n I" lit~r"tur" m.:'Jic". ~x-cepto ~n los enS.l\us clin.l-os J~ m,-Ji..."mentos con .ln.m"k.'S J"I,Ib.lr"t"rl"

  • 8/3/2019 COMO ESTUDIAR UN ESTUDIO Y PROBAR UNA PRUEBA - La seleccin de una prueba estadstica 2

    26/35

    FIGURA29-4. Ejemplo de una curva sigmoidea correspondienle a la probabilIdad de pertenenciaa un subgrupo determinada a partir delln de la ventaja (lag adds)

    lO -8 -6 -4 -2 0 2 4 6 8 10In venfaa

    camente, estas transformaciones siguen una curva sigmoide!l entrc) del intervalo com-prendido entre O y 1 (figura 29-4). Por consiguiente, la regresin I,Jgsticasatisface alos estadsticos que se preocupan porque el anlisis discriminante permite valoresimposibles.26 Los coeficientes de regresin que se calculan con el anlisis de laregresin logstica se usan con frecuencia para estimar la razn de productos cruzadoso de ~'entajas odds atio). Veamos, mediante un ejemplo, cmo se nterpretan estas ra-zones de productos cruzados calculadas con la regresin logstica Supongamos quehemos llevado a cabo un estudio transversal en un grupo de personas con arco senil yque las hemos comparado con otro grupo de personas en quienes el mismo oftalrn-logo ha practicado un examen de la refraccin. Hemos registrado 11 dad, el sexo y laconcentracin de colesterol srico de cada sujeto. Supongamos que hemos obtenido loscoeficientes de regresin logstica que aparecen en el cuadro 29-2, al analizar estos da-tos mediante una regresin logstica con la aparicin o no del arco senil como variabledependiente.

    "2:"~":..-~'.I)~~"2:"(

    Algo que podemos decir a partir de los datos del cuadro 29-2 esque la t.'dad, el sexo y la concentradn de coles e rol srico son estimadores estadistica-mente significativos de la aparidn de un arco senil. Sin embargo, nc'es fdl interpretarlos coeficientesde regresin p.1radetenninar la fuerza de la asociacinde la ventaja (aitis)de tener arco senil con, por ejemplo, el sexo. Esto se fadlita si convertimos estos coefi-dentes a una razn de productos cruzados. Para el sexo, el coefidente de regresin lo-gstica de 1,50equivale a una razn de productos cruzados de 4,5. Esto significa que,controlando segn los efectos de la edad y la concentradn de colesterol srico, las mu-jeres tienen 4,5 veces ms ventajas de tener un arco senil que los hombres.NorrnaIrnente no pensamos en las razones de productos cruzadosen reladn con variables continuas. No obstante, la capaddad de incluir variables con-tinuas independientes es una de las ventajas de la regresin logsti(:a sobre el anlisises rati ficado. Tambin pueden interpretarse los coefidentes de regre!,in logstica de las"' Sin ,.mbar~, no ~xist~ nin:una ~aranta de qu~ el modelo logstico sea ';oig".am",,/.' ,'propiado para analiL.lr

    cualquier I\rupo determinad., de .,b,;ervaciones. l.J calidad de las pruebas detenninar "ll\rado con que el an.i-li,;is dlscriminant" y ell"l\,;tico se aiustar.in a un grupo de obst!rvaciont.'S. 231

  • 8/3/2019 COMO ESTUDIAR UN ESTUDIO Y PROBAR UNA PRUEBA - La seleccin de una prueba estadstica 2

    27/35

    CUADRO29-2. Coeficientes de regresin de una regresin loglstlca en la cuallc presenciade arco senil es la variable dependiente

    variables independientes continuas con las razones de productos cruzados. Para ello,debemos seleccionar un incremento de la variable continua para el que se )ueda cal-cular la razn de productos cruzados. Por ejemplo, podemos escoger el c culo de laventaja del arco senil para un incremento de 10aos como el de las personas c )n 60 aosrespecto de las de 50 aos. En este ejemplo, la razn de productos cruzado~;es de 2,7.Adems, el diseo concreto de la regresin logstica implica que podramos obtener lamisma razn de productos cruzados para cualquierdiferencia de lO aos de t'dad.RESUMEN El anlisis multivariante nos permite analizar grupos d,~observa-ciones que incluyen ms de una variable independiente. Al proporcionar un mtodopara tomar en cuenta varias variables independientes a la vez, el anlisis mu ltivarianteofrece tres ventajas: I) poder controlar el efecto de las variables de confusirl, 2) evitarfrecuentemente el problema de las comparaciones mltiples, y 3) poder comparar lacapacidad de las variables independientes para estimar los valores de 1.1variabledependiente. Los mtodos multivariantes aplicbles a vriables dependientescontinuas son, en su mayor parte, extensiones de los nlisis bivariantes que permitenconsiderar ms de una variable independiente. PJra las variables independ lentes no-minales, la extensin de la tcnica bivariante de la t de Student es el anlisi; de la va-rianza (Ai\[OVA). En el ANOVA podemos examinar las variables independ ente... lo-mina les que indican diversas categorasde una caracterstica concreta o anali2ar gruposde variables independientes nominales conocidas como factores. En el Ai"O"A se pue-den contrastar dos tipos de hiptesis nulas. La hiptesis nula general afirma que todaslas medias son iguales, Las hiptesis nulas por pares afirman que las medias de unapareja concreta son iguales. Ambos tipos de hiptesis se contrastan con ulla tasa deerror de tipo 1del experimento igual a alfa = 0,05 independientemente del nmero demedias comparadas.

    ~~~z::1"1:~~~;...oo2~'.,..z::1"1:~o::1;...(,I)'.,..~.~

    Un tipo cspeciul de A;'\JOVAmuy til en la investigacin mdica esel ANOVA para medidas repetidas. Esta tcnica es una extensin de la pru(ba univa-riante de la t de Student aplicada a datos apareados. Mediante el ANOVA para medidasrepetidas se pueden analizar grupos de observaciones en las cuales a variat le depen-diente se mida ms de dos vecesen el mismo individuo o podemos emplearlo para con-trolar segn el efecto de las variables de confusin potenciales, o para ambos F ropsitosa la vez. La asociacin entre una variable dependiente continua y :ioso msvariables independientes continuas se investiga mediante el anlisis de regresin ml-tiple, una extensin de la regresin lineal bivariante. La capacidad de considerar msde una variable independiente en el anlisis de la regresin mltiple permite controlarel efecto de las variables de confusin y comparar la capacidad de varias vaiiables in-32

  • 8/3/2019 COMO ESTUDIAR UN ESTUDIO Y PROBAR UNA PRUEBA - La seleccin de una prueba estadstica 2

    28/35

    dependientes para estimar los valores de la variable dependiente. LiS reladones entrela variable dependiente y las independientes deben interpretarse reconodendo que loscoefidentes de regresin mltiple estn influidos por la capaddad dE as otras variablesindependientes para explicar la reladn. La fuerza de una asodadn entre una variabledependiente continua y un conjunto de variables independientes amtinuas se estimamediante el coefidente de correladn mltiple.Muchas veces enemos una variable dependiente continua, una oms variables independientes nominales y una o ms variables independientes con-tinuas. Este grupo de observadones se analiza mediante el anlisi; de la covarianza(Ai.\JCOVA).El Ai.\JCOVA omparte caractersticas de la regresin m~tiple y del anlisisde la varianza. De la m-isma orma que en el anlisis bivariante, loSmtodos mul-tivariantes para las variables dependientes ordinales se pueden considerar Comopara-lelos no paramtricos de las pruebas para variables dependientes omtinuas. Sin em-bargo, en el anlisis multivariante los nicos mtodos usadoshabitualntente son ~losa loSdel ANOVA. Con las variables dependientes nominales, las p ;uebasque se em-plean son tipos especiales del anlisis de la regresin o mtodos que ~xigen estratificarlos datos. La estratificacin exige que todas las variables independierltes sean nomina-les o que hayan sido transfom1adas a una escala nominal. Las tcr icas de regresinpueden incluir variables dependientes nominales o continuas.Para ambos mtodos, existe una distincin adici Jnal en el anlisisde las variables dependientes nominales que consiste en determinar si las medidas deposicin son dependientes del tiempo o no. El anlisis de la tabla de v:da es una tcnicade estratificacin para las variables nominales que son dependiente~ del tiempo. Unatcnica de regresin paralela es a regresin de Cox. La regresin log ;tica es el mtodoms empleado para analizar las variables dependientes que no dependen del tiempo.Los coeficientes de la regresin logstica se pueden convertir en razones de productoscruzados. Otra tcnica es el anlisis discriminante. Una ventaja del anlisis discrimi-nante es que puede extenderse a ms de una variable dependiente rulminal.

    .,r-z~~~~r--I:J~..I\~:3~z~

    233

  • 8/3/2019 COMO ESTUDIAR UN ESTUDIO Y PROBAR UNA PRUEBA - La seleccin de una prueba estadstica 2

    29/35

    .--

    CAPnJLO 30

    REsUMEN ESQUEM~nco

    ::;9~~~z~~~~'""'-'~:..::)~5'.r,;..z~~~~~;..':)~q

    En este captulo presentamos en su totalidad el esquema 1ecesariopara seleccionar una prueba estadstica. El esquema resumido puede utilizarse de dosmaneras. La primera consiste en empezar en la pgina 317y seguir el esquema hastadescubrir cules son los tipos de tcnicas estadsticas apropiados para una nvestiga-cin determinada. Para usar el esquema de esta manera, primero debe identlficar unavariable dependiente y luego O,10 ms variables independientes. Seguidame1te, ha dedecidir el tipo de la variable dependiente (esto es, nominal, ordinal o continua' .Una vezque haya tomado estas decisiones, usted encontrar un nmero que le concucir a lasiguiente parte del esquema aplicable a sus datos.Todas as partes subsiguientes del esquema se han con~ ruido dela misma forma. Si sus datos contienen variables independientes, deber identificar eltipO.1 A continuacin, en algunos diagramas tendr que decidir cul es el Farmetropoblacional que le interesa, la posicin o la dispersin.! Si existen limitacicnes o su-puestos especialesaplicables a las tcnicasestadsticasapropiadas para analizar sus da-tos, ser nt.'Cesario eterminar si se cumplen. En el caso de que no se cumpln, puedetransformar su variable o variables a una escala nferior y consultar el esquema parabuscar la parte que corresponda a la variable transformada.Siguiendo el esquema, llegar a una medida de sntesis (I a una es-timacin puntual til para sus datos, que muchas veces va seguida de una clasificacingeneral de las pruebas estadsticas. Al final de los esquemas encontrar el nombre delas tcnicas que se emplean ms frecuentemente para las pruebas de signifi,:acin es-tadstica y para la construccin de los intervalos de confianza de datos como los suyos.

    Cuando utilice el esquema observe que:1. las medidas subrayadas con una sola lnea son estimaciones muestralespuntuales.2. las tcnicas subrayadas con una lnea doble se usan para realizar pruebas designificacin estadstica o para construir intervalos de confianz.1.3. El tipo de las pruebas se ndica con lneas horizontales por encima y For debajo.4. La palabr.1 o" indica que cualquiera de las pruebas mencionadas es aceptablepara responder a la misma pregunta; sin embargo, la prueba situada en primerlugar tiene ms potencia estadistica o se US.lms frecent('mente, o 1mbasco-sas a la vez.5. Otr.1Scondiciones que es necesario cumplir para utilizar una determinada tc-nica estadstica aparecen sin lneas por encima o por debajo.

    Rc.:uerde qu~. rolro l iines ..'SIi1dSlicll';. Unol volriolbl~ nl)mnoll ';1)1);e r~iier..' ol d)s Ci1I~g)nol';d~ unol \ i1rol,t...ri,;tiCi1.Si lol ,olr}ct"rish,ol tien" k ,i1tegorii1s. ,;...n..'C~,;iti1rn k-1 vi1nolbl~,; nOminol"'sEl t...rmlno nt~r,; ~n loll"";icin se u,;.) polrol ~I olnli,;s bivi1riolnt~ y multiv.lri.lnle, olsi CI)ffi11p.lri1 ~ univi1rii1nte.~n ~I ,uoli d"h) t\.rmn) li~n~ un ,;ignl...old" m.i,; lntuitVt) En ...1 ln.i",;,. bi\.driolnt~ y multivolriolnt~ n,l'; intereSi1di,;l"'nl.r d,. Unol ml.di,ld q"l. ,;tu~ lol iUl.r"i1 d~ Und r...ld'i,)11 " Id md~nitud d... Und dif~r~n,ioll.n IInol '...rl... d..' vi1-lore,; pl),;ibl..",}-l

  • 8/3/2019 COMO ESTUDIAR UN ESTUDIO Y PROBAR UNA PRUEBA - La seleccin de una prueba estadstica 2

    30/35

    6. Cuando aparece una coma en~ dos pruebas de significacin estadstica, a pri-mera prueba se usa para evaluar una hiptesis nula general yla segunda, paraevaluar las comparaciones por pares.La primera forma de utilizar el esquema es aplic 3blea as personas

    que estn interesadas en seleccionar una prueba estadstica para an lizar un conjuntode datos. Por otra parte, como lectores de la literatura mdica, lo qul? nos interesa msa menudo es comprobar si la prueba seleccionadapor otros es apropada. En este caso,el esquema puede utilizarse como una ayuda para encontrar el nombre de la pruebaseleccionada y, siguiendo el esquema hacia atrs, determinar si la prueba es una elec-cin gica para los datos analizados.

    FIGURA30-1. Esquemaprincipal para determinar cul de los esquemasque si!uen son aplicablesa un conjunto de datos determinados. Los nmeros de la parte inferior indican IJS esquemasque se deben utilizar.

    icEnllfQruna vanable~ndienle

    ..,-~~5j:2;~:~~

    IVariaDe~.nleconrW1lJa VariableOOpendienteoonllnua IVariable Variable Variable.ndieme o pendienle ~deI1leoontW\ua ordinal nominalI[Q I0 I0 I0 Im I[!JI0 I[!] Im 2:>5

    Variable~emeordinalVariable

    OOpendientenominal

  • 8/3/2019 COMO ESTUDIAR UN ESTUDIO Y PROBAR UNA PRUEBA - La seleccin de una prueba estadstica 2

    31/35

    fFIGURA 0-2. Esquema para seleccionar una tcnica estadIstica unlvariante para un2 variable .-dependiente continua.

    Variabledependiente

    continua

    [iJInters8i1ladispe~

    Inl8lsen la

    xJScl6n

    f~

    Ir de saJ~!

    .r:-"-1~yaanu~ -1..~

    Ir de SI\JdeI1I~

    FIGURA30-3. Esquema para seleccionar una tcnica estadistica univariante para un variabledependiente ordinal.~:x:;..:::~~z:::~~~:)~~;..:)"52;J)'"'"Z.:::~~~:-'J1'"''"':E~u

    v 3Iiable~nCienle

    oninal

    0Intersen la

    ~cn

    ~

    Inlersen la

    disoersl6n

    II,AaInud' ~

    ~teI(;\Jaf11Cal

    POJebo el ranQo:je Wdmlon2Prueba~ s~no

    1 .1.1mpliIUd ,;e incluye .1qu St)lo p')r ,;u l"I"ndido uS\,. Sin "mb.1r;o. es difcil inl"rpreti1rl.1. com,' , " (,)m"nl "n,,1 (i1pilul,) 27, L.1'; prul-bi1'; dl. ,;ignific ;,,>n l'Sli1di,;ti(i1 \" I.,,; inll.r,..1I.,,; dc ,.,mfi.1nLi1 no,;., .1pli.:.1n .11.1 1mplilUd i,t"r.:u.1rllici1."xceplo (u.1ndo l'Sl.1 ,;., "mpl"i1 (om" .1pr."lm.,.:I.:'n J 1.1 l'Svi