Cap8
-
Upload
josue-vilcabana -
Category
Education
-
view
180 -
download
0
description
Transcript of Cap8
Capítulo VIII
Análisis de CorrelaciónSimple, Múltiple,Parcial
Correlación
Es la medidadel grado derelación entredos o más variables. Con
variables nominales sueleutilizarseel términoAsociación para
indicar el grado de relación entrelas variables.
Correlación Simple
Lacorrelaciónentredosvariablescuantitativasparaverificarsu
relaciónsellama:CorrelaciónSimple,porquesóloinvolucrauna
variableindependiente.Mientrasquelarelación entrevariasvariables
independientes con una dependiente se le llama: Correlación
Múltiple.
Larelaciónentredosvariablesmanteniendoelrestoconstante
recibeel nombredeCorrelación Parcial.
La correlación con una sola variable independiente se llama: Simple.
La correlación con más de una sola variable independiente se llama:
Múltiple.
Lacorrelacióndeungrupodevariablesdependientesconungrupo
devariablesindependientes,esdecir,entregruposdevariablesse
llama:CorrelaciónCanónica.
Coeficiente deCorrelación segúnlanaturalezade lasvariables
El gradoderelaciónentrevariables dependedela naturaleza delas
variables involucradas en el estudio o investigación.
Enestesentido,siambasvariablessonnominaleslarelaciónserá
descrita con el Estadístico Ji-Cuadrado. Si ambas variables son
92
ordinalessedescribelarelaciónconelCoeficientedeCorrelaciónde
Spearman. Si ambas variables son intercalares mediante el
Coeficiente de Pearson. Siuna variable es nominalyla otra es
intervalar la relación puede ser descrita mediante el Coeficiente
OmegaCuadrado.Siambasvariablessondicotómicasobinariasla relación
puedeestablecerse medianteel CoeficientePhi.
Larelaciónentredosfenómenospuedeser:estricta,funcionalo
nula.Larelaciónentretallaypesonoesestricta,yaquenoexiste
unaproporcionalidadsimpleentreambasvariables;perotampocoes
nula,puesdelo contrarioambasvariablesseríanindependientes
entresí(mientrasqueenestecasoexiste,indudablemente,cierta
correlación:lagentealtaes,engeneral,máspesada).Noobstante,
estarelaciónnoresultafuncional,porquedelocontrariosepodría
captarmatemáticamenteladependenciamedianteunaecuaciónde dos
variables.
La correlación tiene las mismas propiedades de los vectores:
magnitud, direccióny sentido.
Entalsentido,sehabladeCorrelaciónPositiva oDirectacuando
ambascaracterísticas(expresadasmediantevaloresdelasvariables)
presentanlamismatendencia(porejemplo,tallaypeso)porquea
medidaqueunaaumentaseesperaquelaotravariableaumente
peroestarelaciónenlosseresvivosnoesindefinidasinohastacierta edad.
Esdecir, hayuna variablereguladora la edad en estecaso.
Enestemismoordendeideas,sehabladeCorrelaciónNegativao
Inversacuandounavariableaumentaylaotradisminuye,mostrando
tendenciasclaramenteopuestas,eselcasodelaofertayelprecioen
elámbitodelaeconomía.Cuandolaofertaaumenta,elpreciotiende a bajar.
Los diagramas de dispersión o Scattergramas suelenserútilespara
estudiar elgrado de relación entredosvariables.
93
Positiva Negativa Aleatoria Aleatoria Nula
Perfecta perfecta positiva negativa
Correlación como medida de la Confiabilidad de un
InstrumentodemediciónoTest
Lacorrelacióneslabaseutilizadaparaevaluarlaconfiabilidadde
uninstrumentodemediciónotest.Silospuntajesdeuntestfueron
medidosenbaseaunaescalaLikertotipoLikert,seutilizaráel Coeficiente
Cronbach, pero si los puntajes provienen de
alternativasdicotómicasobinarias(si,no)seutilizaráelCoeficiente
deKuder-Richardson.Unainterrogantequesaltaalamentede
inmediatoes¿CómoanalizarunTestquetienepreguntasenescala
(si,no)yenescalaLikert? Porsupuestoqueestasituaciónnos
conduceatrabajarmásenelsentidoquedebeaplicarseeltesten dos
oportunidades diferentes y luego correlacionar mediante un
coeficientedecorrelacióndePearson,larelacióndelospuntajes
totalesdelaprimeraaplicaciónconlosdelasegunda.Sisemantiene
entrelasdosaplicacionesunacorrelaciónqueporlomenosesmayor
que0,70seconcluyequeel testes confiable.
Porotraparte,existeuncoeficientedeparticiónpormitadeso
Correlación de Spearman-Brown que mide el grado de
homogeneidaddeuntest;cuandolas correlaciones entrelaprimeray
lasegundamitaddeltest,oentrepareseimpareseslomáselevada
posibleyentodocasomayorque0,70,seconcluyeigualmenteque el testes
confiable.
94
LaCorrelacióntambiénhaceposibleelcálculodelCoeficientede
Determinación
R2 queseutilizacomomedidadelaBondadde
Ajuste deun ModelodeRegresión,como se verá más adelante.
Engeneral,sielvalordeR-cuadradoesmayorencomparacióna
otromodelo,elmodeloqueposeaunR-cuadradomayorseráelde
mejorajuste.ElR-cuadrado,comienzaaserimportantesisobrepasa el
valor 0,70. Este coeficientesiemprees positivo.
EjemplosdeAplicacióndelaCorrelación
Correlación dePearson
CorrelaciónProductoMomentoconocidatambiéncomoCorrelación
dePearson o Correlación deBravais-Pearson.
El STATISTIXcontieneen su algoritmocomputacional la fórmula:
rxy
(X X)(Y Y)
(X X)2
(Y Y)2
Como se observa en el numerador tenemos la fórmula de
covarianza(X,Y)yeneldenominadorlaraizcuadradadelavarianza deX y Y.
Una vez vaciados los datos en el paquete informático de
computación sesiguela secuencia:
STATISTIX>LINEAR MODELS>CORRELATIONPEARSON
Sea la determinación dela correlación simpleentreX eY:
X 2, 4, 6, 8
Y 3, 6, 9, 12
95
Una vezintroducidos los datos,
Seguimosla secuencia dada anteriormente:
Cuya salida es:
Elresultado anterior revela una correlación alta,directa yperfecta.
96
Altaporqueda mayor de 0,70,directa porqueal crecer, crece Yen la
misma proporción (loindica el signopositivo del coeficientede
correlación dePearson) y perfecta porquedio uno.
Existe una escala parainterpretar el coeficiente decorrelacióndada por
algunos autores:
Rango Significado
0,00a 0,29
0,30a 0,69
0,70a 1,00
Bajo
Moderado
Alto
Sin embargo, no existeun acuerdo entrelos distintos autores,
entreotros (Hernández, 2003, p.532) y encontramos otros baremos
deinterpretación:
Magnituddela Correlación Significado
-1,00
-0,90
-0,75
-0,50
-0,10
0,00
+0,10
+0,50
+0,75
+0,90
+1,00
Correlación negativa perfecta
Correlación negativa fuerte
Correlación negativa considerable
Correlación negativa media
Correlación negativa débil
Correlación nula
Correlación positivadébil
Correlación positivamedia
Correlación positivaconsiderable
Correlación positivamuy fuerte
Correlación positivaperfecta
ValorPdeSignificación deR
Otroaspecto importantea considerares la significanciadelvalor de r,
quevienedadopor el valor P queloacompaña.
97
Si el valor P queacompaña a Res menor que0,05, concluímos que la
correlación es significativa y esto indica quees una correlación o
relación real, no debida al azar. Por ejemplo, si lasalidadel software
muestra un R=0,80; P<0,05,nos indica quela correlación es
significativa.
Varianza defactoresComunes
El valor de Relevado al cuadradoindicael porcentajedela variación
de una variabledebida ala variación delaotra yviceversa.
Por ejemplo, sila correlación entreproductividad y asistencia al
trabajo es de0,80. Esto es,
r 0,80
r2 0,84
Expresa quelaproductividad explica el 64%dela variacióndela
asistencia al trabajoo quela asistenciaal trabajo explica el 64%de la
productividad.
Correlación deSpearman
Esta correlación midela relación entredos variables ordinales. Por
ejemplo, para correlacionar los puntajes dedos test medidos
en una escala Likert.
Ejemplo,sea la determinación de la correlación entrelos ordenes
dellegadadado pordos jueces en 8 competenciasdenatación.
Númerode Competencias
Nadador 1 2 3 4 5 6 7 8
Juez1 10 11 9 13 7 14 6 15
Juez2 11 13 8 10 9 15 7 14
Diferencia
(D)
-1 -2 +1 +3 -2 -1 -1 +1
D2 1 4 1 9 4 1 1 1
98
El coeficientedeSpearman secalcula así:
r 1D
6
s n(n
2
2
1)
r 16(22)2
0,74 S
8(82 1)
Elvalorde0,74nosindicaqueexisteunacorrelaciónpositiva
relativamentealtaentrelapuntuacióndadaporunoyotrojuez,es
decir,queelnadadorqueobtuvounpuestodellegadaaltoenun
jueztambiénloobtuvoconelotro.Yasímismo,elqueobtuvobaja con un
juez, obtuvobaja con elotro.
Con el softwarevaciamos los datos:
Seguimosla secuencia:
99
Aparece la cajadediálogo siguiente:
Mostrando la salida(output) siguiente:
La diferencia en el resultado amano y con el softwareseatribuye a
errores deredondeo. No obstantese interpreta dela mismamanera
el resultado obtenido.
Correlación entre dos variables dicotómicas
Estecoeficientedeasociación queabordaremos midela correlación
entredos variablesnominales(desiy no, o de1 y 0).
El coeficientedeasociación Phi
( )
se calcula de la siguiente manera.
Veamos un ejemplo, sedesea encontrarla asociaciónentreacierto en
la elección delacarrera y haber recibido o no orientación
100
vocacional.Deunamuestra de50estudiantes universitarios se
registróel siguientearreglo en una tabla 2x2:
Éxito Fracaso Total
Orientados 19 11 30
Noorientados 5 15 20
Total 24 26 50
Estearreglo en símbolos es:
Éxito Fracaso Total
Orientados A B A+B
Noorientados C D C+D
Total A+C B+D A+B+C+D
Para Phila fórmulaes:
AxD BxC
(A C)(B D)(A B)(C D)
19x15 11x5
(24)(26)(30)(20)
0,376
Para interpretar Phicomo se sabequeexisteuna relación directa
entrePhi yji-cuadrado (Phi es igualala raíz cuadrada deJi sobreN)
Entoces podemos usar esta relación para afirmar quesiji-cuadrado es
significativo también lo es Phi.Enrealidad Phi es unavariación de la
fórmuladel coeficientedecorrelación r dePearson.
Veamos su determinación usando el software. Para hacerlo no
necesitamos unarchivo como tal, sino introducimoslos datos
medianteelteclado. Así:
101
La opción Two by TwoTables no da elsiguientecuadrodediálogo:
De lo antes expuesto, apreciamos que Phi=0,38y es significativo si
inspeccionamos el valor correspondientea Ji-cuadrado
102
(Ji=7,06;P=0,0079) vemos quetambién Phies significativo con un
P=0,0079.
Correlación Biserial Puntual
Esunamedidadelarelaciónquepuedehaberentreunavariable
continua(convariascategorías)unavariabledicotomizada(queel
investigadorobligóaserdicotómica).Tambiénmidelarelaciónentre una
dicotómica y una dicotomizada. Es un caso particular de la
correlaciónPearsoniana.Nosevaadesarrollarporquelamayoríade
losautoresrecomiendautilizarenestasituaciónlacorrelaciónde
Pearson.
CorrelaciónentreunaVariableNominaldevariascategoríasy
una VariableIntercalar(u ordinal)
Omega Cuadrado(2)
Estecoeficientedeasociaciónsegún Weimer(1996, p.624) está
indicado en aquelloscasos en los cuáles se requiera la asociación en
treuna variablenominal y otra (intervalar u ordinal).
Estecaso puedepresentarseen el ámbito deun ANOVA cuyo valor F
halla dado significativo ysabiendo según estevalor F quehay una
relación entrelas dos variables ahora nuestrointerés radica en
conocer el grado de intensidaddela asociación.
Elestadístico omega cuadrado(2)es un estimadorcomúndela
fuerza delas asociación entrela variabledel tratamiento yla
dependienteen unarreglo deANOVA deun solo criterio de
clasificación. Fuederivado por Hays ytienela siguientefórmula:
ˆ2 SCTRAT (k 1)CMERROR
SCT CMERROR
Donde:
103
(2): Omega cuadradodeHays
SCTRAT: Suma deCuadrados entreTratamientos
CMERROR: Cuadrado medio del error
SCT: Sumadecuadrados totales
K: es el número detratamientos
Elestadístico(2)Omega Cuadradode Hays noestá incorporado
todavía en algunossoftwareperola mayoría deellos proveelos
insumosnecesarios para poder determinarlo en forma indirecta.
Para suinterpretación debeutilizarseel siguientebaremo:
Rango (2) deOmegaCuadrado Intensidad deRelación
0,00a 0,29
0,30a 0,69
0,70a 1,00
Débil
Moderada
Fuerte
Con el Estadístico Omega Cuadrado de Hays no debe hablarse de direccionalidad positivaonegativaporqueno hay forma de saber la direccionalidad
104
Ejemplo de aplicación del Omega CuadradodeHays
Serealizó un experimento para determinar:
(a) Si son distintas las medias del número de cirugías de
pacientes externos realizadas (por semana) en tres
hospitales: General del Sur,Universitario y Coromoto.
(b) Laintensidaddelarelaciónentreelnúmerodecirugíaspor
semana y el tipo dehospital
Hospital General
del Sur
Hospital Universitario
deMaracaibo
Hospital Coromoto
19
19
18
14
12
25
23
22
21
22
25
23
23
13
14
16,4=Media 22,6=Media 19,6=Media
La matriz dedatos(en formato categorical) para el Statistixes:
cirugias hospital
19
25
25
19
23
23
18
22
23
14
21
13
12
22
14
1
2
3
1
2
3
1
2
3
1
2
3
1
2
3
105
Las opciones del menú son:
La caja de diálogo es:
Aunquela Fde Fisher no resultó significativa, serealizará el cálculo
del Omega cuadrado como ejemplo didáctico:
106
Entonces el OmegaCuadrado es:
ˆ2 SCTRAT (k 1)CMERROR
SCT CMERROR
ˆ2 96,13 (3 1)14,8
273,733 14,8
125,73
288,533
0,4357
En consecuencia, el 43,57%dela varianza en el número de
cirugíaspuedeser atribuido a lavariablehospital.
Se hace hincapié enel hecho que sólo debe realizarse el cálculo del Omega Cuadrado cuandoel estadístico F hallaresultado significativo.
Correlación Parcial
La correlación parcial se define como la correlación entre dos
variables manteniendo las variables intervinientes controladas.
Es muy útil cuando entre las variables no se manifiestas las
verdaderascorrelacionesacausadequeunaterceravariableopaca la
correlación entreaquellasdos.
Unejemplodeestetiposeobservaenelefectomediadorque
ejercenlascalificaciones(variableinterviniente)enelefectoquela
motivación del alumno tiene sobre la evaluación que hace del
profesor; los resultados de las investigaciones educacionales
muestran,porejemplo,quelosalumnosconbajamotivaciónhaciael
trabajoacadémicoevaluarán desfavorablementecuandoobtienen
calificacionesbajasyfavorablecuandoobtienenaltascalificaciones. Por lo
tanto, si el interés está dirigido a determinar la relación
verdaderaogenuinaentremotivaciónyevaluación,seránecesario emplear
un control estadístico que permita extraer tanto de la
107
Y2 12
r
r :
: Y2
12
motivacióncomodelaevaluación,elefectodelascalificaciones.Este control
selogra calculando elcoeficientedecorrelación parcial.
Lacorrelaciónparcialesunaestimacióndelacorrelaciónentredos
variablesdespuésderemoverdeellaslosefectosdeotravariables
(variablemediadorao interviniente)
Simbólicamente, ry1.2representalacorrelaciónparcialentreYyX1
después quesehaexcluidodeellas el efecto deX2.
La fórmula queseemplea es:
r rY1 rY2r12
Y1.2
(1 r2 )(1 r2)
Es decir, en elnumeradortenemos:
rY1:es la correlación simpleentreY y X1
rY2 :
es la correlación simpleentreY y X2
r12:es la correlación simpleentreX1y X2
Enel denominador figura:
2 es el coeficientededeterminación entreY y X2
2 es el coeficientededeterminación entreX1y X2
A este coeficiente también se le denomina: Coeficiente de
CorrelaciónParcialdePrimerOrden,debidoaquesólosecontrolóo
parcializóunavariableX2.Sisecontrolapordosvariablessedenota como:
rY1.23
:yselellamaCoeficientedeCorrelaciónParcialdeSegundo
Orden y así sucesivamente.
En el modelo de la regresión lineal múltiple,elcoeficiente de
correlaciónparcial,seconcibecomounarelaciónentrevarianzas
residuales.Enestecontexto,tambiénseempleaelcoeficientede correlación
parcialal cuadrado.
108
r Y2
Paraentendermejorelsignificadodelcoeficientedecorrelación parcial y
su correspondiente coeficiente al cuadrado, resulta útil
emplearelmismodiagramaquepresentanCohenyCohen(1983)y
quecomúnmenteesempleadoparaexplicarlanocióndevarianza
compartida.
Eneldiagramalavarianzadecadavariableserepresentaporun
círculodeáreaigualalaunidad.Lasáreassuperpuestasdedos
círculosrepresentanlarelaciónentrelasdosvariables,cuantificada
por r2.El área total de Y cubierta por las áreas de X1 y X2 representanlaproporcióndelavarianzadeYqueesexplicadapor
dosvariablesindependientesyserepresentapor
R2.
Eldiagrama muestra, queesta proporción es igualala suma delasáreas a, b y c.
Las áreas a y b representan aquella porción de Y explicada
únicamenteporX1yX2,respectivamente;entantoqueeláreac
representalaproporcióndeYqueesexplicadasimultáneamentepor X1y
X2.
ElcoeficientedecorrelaciónparcialalcuadradodeYconX1
parcializando o controlando a X2seexpresa así:
a R R2
2
Y1.2 a m
Y12 Y.2
1 R2
109
R
r Y2
Y2 Donde 2
r2, esdecir, rY2 eselcoeficientedecorrelaciónde
orden ceroentreYy X2. Nótese queen la fórmulaanterior:
a R R2 2
2
Y1.2 a m
Y12 Y.2 , el 1 R2
rY1.2 representa la proporción de la
varianzadeYqueesestimadaoexplicadasóloporX1,esdecir,el
coeficientedecorrelaciónparcialalcuadradorespondealapregunta:
¿cuánto de la varianza en Y que no es estimada por las otras
variables,es estimada por X1?
EjemplodeAplicación deCorrelación Parcial
Acontinuaciónsepresentalainformaciónsuministradapor32
supervisores de la empresa MAXY,en la cualse registró por el gerente
de recursos humanos, la motivación de logro X1 y la
percepcióndelambientedetrabajoX2,ademásdelaevaluacióndel
desempeño Y. El gerentepretendeverificar la hipótesissiguiente:
“La motivación de logro delsupervisor y la percepción que el
mismo tiene del ambiente de trabajo, contribuirán de manera
importantea explicar la evaluación deldesempeño queellos hacen”
MatrizdeDatos
Supervisor Desempeño
Y
Motivación de
LogroX1
Percepción del
AmbienteX2
01
02
03
04
05
06
07
08
09
10
6
9
4
6
3
8
4
2
10
1
5
7
5
6
3
8
2
2
5
1
4
4
6
9
5
4
5
4
7
3
110
R
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
10
6
9
9
6
5
10
7
9
8
10
9
5
2
2
5
10
2
6
8
1
4
8
10
4
3
4
5
9
19
3
4
8
4
10
2
2
5
5
4
4
8
1
5
6
5
7
6
6
7
7
6
5
5
8
6
4
4
5
8
7
6
7
4
2
6
Nota:La escala devaloración fuede01a 10
Enesteejemplo,lascorrelaciones simples (orden cero) son:
rY1 0,529
rY2 0,447
r12 0,247
El coeficientededeterminación múltiplees:
2
Y.12
0,385
111
r Y2
r
El coeficiente de correlación parcial de Y (desempeño) con
motivacióndelogro(X1)controlandoporPercepcióndelambientede
trabajo (X2) es:
a R R2
2
Y1.2 a m
Y12 Y2
1 R2
Sustituyendo en la fórmula anterior:
2
Y1.2
0,385 0,199
1 0,199
0,232, la raíz cuadrada de este valor es la
correlación parcial deY con X1eliminando la influencia deX2:
rY1.2 0,4816,querepresentalaverdaderacorrelaciónentreYyX1 después de
remover X2 y representa una baja correlación entre
evaluacióndeldesempeñoymotivacióndelogrodelossupervisores,
controlando por el efecto dela percepción del ambientelaboral.
EnSTATISTIX,lasecuenciaempleadaparaobtenerestoscoeficientes
es:
Se dejaallectorlatareade
verificar dichoscálculos
112
Coeficiente deConfiabilidad Alphade Cronbach:
Validez Es la eficacia conqueun instrumento midelo quesepretende
medir Confiabilidad Es el grado con queseobtienen resultados similares en distintas aplicaciones
114
S
S
S
S
CoeficientedeConfiabilidad deHoyt:
El coeficientedeconfiabilidaddeHoyt es:
S2
r 1 error tt 2
sujetos
2
r 1Serror
11,08
0,77
tt 2
sujetos 4,75
Donde: 2
error 1,08(varianza del error) 2
sujetos 4,75(varianza debida a los sujetos) De acuerdo a la escala de interpretación dadapor RuizBolivar
(2002;p.70):
Rangos Categoría
0,81a 1,00
0,61a 0,80
0,41a 0,60
0,21a 0,40
0,01a 0,20
Muy alta
Alta
Moderada Baja
Muy baja
Sepuedeconcluir,queel instrumentodemedición en estudio tiene
un coeficientedeconfiabilidad alto.
Nota:el coeficientedeHoyt aparece reseñado en:
RuizBolivar, C. (2002) Instrumentos deInvestigación Educativa.
Procedimientos para su diseñoy validación.Cideg. Lara. Venezuela; pp.68-70