Presentacion slidershare 21 01 16 Josuana Bello

17
Republica Bolivariana de Venezuela Ministerio Del Poder Popular Para La Educación Universitaria Instituto Universitario Politécnico Santiago Mariño Carrera: Ingeniería Industrial Materia: Estadística I Sección: Yv Profesor: Ramón Aray Bachiller: Josuana Bello C.I: 25.257.199 Barcelona, enero de 2016

Transcript of Presentacion slidershare 21 01 16 Josuana Bello

Page 1: Presentacion slidershare 21 01 16 Josuana Bello

Republica Bolivariana de VenezuelaMinisterio Del Poder Popular Para La Educación UniversitariaInstituto Universitario Politécnico Santiago MariñoCarrera: Ingeniería IndustrialMateria: Estadística ISección: Yv

Profesor:Ramón Aray

Bachiller:Josuana Bello C.I: 25.257.199

Barcelona, enero de 2016

Page 2: Presentacion slidershare 21 01 16 Josuana Bello

El coeficiente de correlación de Pearson es una medidade la relación lineal entre dos variables aleatorias cuantitativas. Adiferencia de la covarianza, la correlación de Pearson esindependiente de la escala de medida de las variables. De maneramenos formal, podemos definir el coeficiente de correlación dePearson como un índice que puede utilizarse para medir el gradode relación de dos variables siempre y cuando ambas seancuantitativas.

La covariación es el grado de concordancia de las posicionesrelativas de los datos de dos variables. En consecuencia el coeficientede correlación de Pearson opera con puntuaciones tipificadas (quemiden posiciones relativas). El fundamento del coeficiente de Pearsones el siguiente: Cuanto más intensa sea la concordancia (en sentidodirecto o inverso) de las posiciones relativas de los datos en las dosvariables, el producto del numerador toma mayor valor (en sentidoabsoluto). Si la concordancia es exacta, el numerador es igual a N (o a -N), y el índice toma un valor igual a 1 (o -1).

Page 3: Presentacion slidershare 21 01 16 Josuana Bello

Paso 1: Identifica el dependiente variableque se probará entre dos observacionesderivadas independientemente. Uno delos requisitos del coeficiente decorrelación de Pearson es que las dosvariables que se comparan debenobservarse o medirse de maneraindependiente para eliminar cualquierresultado sesgado.

Paso 2: Calcula el coeficiente decorrelación de Pearson. Para cantidadesgrandes de información, el calculopuede ser tedioso. Además de los variosprogramas de estadística, muchascalculadoras científicas pueden calcularel valor.

Paso 3: Reporta un valor de correlacióncercano a 0 como un indicador de que no hayrelación linear entre las dos variables.Conforme el coeficiente de correlación seacerque al 0, los valores se vuelven menoscorrelacionados, lo que identifica las variablesque no pueden ser relacionadas entre sí.

Paso 4: Reporta un valor de correlacióncercano al 1 como indicador de que existe unarelación linear positiva entre las dos variables.Un valor mayor a cero que se acerque a 1 dacomo resultado una mayor correlaciónpositiva entre la información. Conforme unavariable aumenta cierta cantidad, la otraaumenta en cantidad correspondiente. Lainterpretación debe determinarse de acuerdocon el contexto del estudio.

Page 4: Presentacion slidershare 21 01 16 Josuana Bello

Paso 5: Reporta un valor de correlacióncercano a -1 como indicador de que hay unarelación linear negativa entre las dosvariables. Conforme el coeficiente se acerca a-1, las variables se vuelven negativamentemás correlacionadas, lo que indica queconforme una variable aumenta, la variabledisminuye por una cantidadcorrespondiente. La interpretación, denuevo, debe determinarse de acuerdo con elcontexto del estudio.

Paso 6: Interpreta el coeficiente decorrelación de acuerdo con el contexto de losdatos particulares. El valor de correlación esesencialmente un valor arbitrario que debeaplicarse de acuerdo con las variables que secomparan.

Paso 7: Determina la importancia de losresultados. Esto se logra con el uso delcoeficiente de correlación, grados delibertad y una tabla de valores críticos delcoeficiente de correlación. Los grados delibertad se calculan como el número de lasdos observaciones menos 2. Con este valor,identifica el valor crítico correspondienteen la tabla de correlación para una pruebade 0.05 y 0.01 que identifique 95 y 99 porciento de nivel de confiabilidadrespectivamente. Compara el valor críticoal coeficiente de correlación previamentecalculado. Si el coeficiente de correlaciónes mayor, los resultados son importantes.

Page 5: Presentacion slidershare 21 01 16 Josuana Bello

• Permite predecir el valor de una variable, dadoun valor determinado de otra variable.

• Se trata de valorar la asociación de dos variablescuantitativas estudiando el método conocidocomo correlación .

• Dicho calculo es el primer paso para determinarel valor de dos variables.

• Se usa Para cantidades grandes de informaciónya que el calculo suele ser tedioso.

• Determina la importancia de los resultados

• Consiste la posibilidad de calcula la distribuciónmuestral y así poder mostrar su error típico.

• Reporta un valor de correlacióncercano a ¨0¨ y como un indicadorde que no hay relación lineal entredos variables.

Page 6: Presentacion slidershare 21 01 16 Josuana Bello

• Si r = 1, existe una correlación positiva perfecta. El índiceindica una dependencia total entre las dos variablesdenominada relación directa: cuando una de ellas aumenta, laotra también lo hace en proporción constante.

• Si 0 < r < 1, existe una correlación positiva.

• Si r = 0, no existe relación lineal. Pero esto no necesariamenteimplica que las variables son independientes: pueden existirtodavía relaciones no lineales entre las dos variables.

• Si -1 < r < 0, existe una correlación negativa.

• Si r = -1, existe una correlación negativa perfecta. El índiceindica una dependencia total entre las dos variables llamadarelación inversa: cuando una de ellas aumenta, la otradisminuye en proporción constante.

Page 7: Presentacion slidershare 21 01 16 Josuana Bello

• Ejemplo 1 (Máxima covariación positiva)

Observa que los datos tipificados (expresadoscomo puntuaciones z) en las dos columnas dela derecha tienen los mismos valores enambas variables, dado que las posicionesrelativas son las mismas en las variables X e Y.Si obtenemos los productos de los valorestipificados para cada caso, el resultado es:

El cociente de dividir la suma deproductos (5) por N (hay que tener encuenta que N es el número de casos, NOel número de datos) es igual a 1

Page 8: Presentacion slidershare 21 01 16 Josuana Bello

• Ejemplo 2 (Covariación positiva de alta intensidad)

y por tanto

• Ejemplo 3 (Ausencia de covariación)

• Ejemplo 4 (Covariación negativa de altaintensidad)

• Ejemplo 5 (Máxima covariación negativa)

Page 9: Presentacion slidershare 21 01 16 Josuana Bello

Ventajas:

• El valor del coeficiente de correlaciónes independiente de cualquier unidadusada para medir variables.

• Cuando el fenómeno estudiado de dosvariables son cuantitativas se usa elcoeficiente de correlación de Pearson.

• Mientras mas grande sea la muestramas exacta será la estimación.

Desventajas:• El valor cero representa falta de

correlación.

• Requiere supuestos acerca de la naturalezao formas de la poblaciones afectadas.

• Requiere que las dos variables hallan sidomedidas hasta un nivel cuantitativocontinuo y que la distribución de ambassean semejantes a la de la curva normal.

• En cambio de una correlación nula noimplica la independencia de variables.

Page 10: Presentacion slidershare 21 01 16 Josuana Bello

• Identifica el dependiente variable que se probara entre dosobservaciones derivadas independientemente.

• Uno de los requisitos es que las dos variables que secomparan deben observarse o medirse de maneraindependiente para eliminar cualquier resultado sesgado

• Para cantidades grandes de información el calculo puedeser tedioso

• Interpreta el coeficiente de correlación de acuerdo con elcontexto de los datos particulares.

• Un valor mayor a cero que se acerque a 1 da comoresultado una mayor correlación positiva entre lainformación.

• las pruebas paramétricas mas conocidas y usadas son lasprueba T de Student, la prueba F, llamada asi en honor aFisher y el coeficiente de correlación de Pearson,simbolizado por R.

Page 11: Presentacion slidershare 21 01 16 Josuana Bello

El coeficiente de correlaciónde Spearman permiteidentificar si dos variables serelacionan en una funciónmonótona (es decir, cuandoun número aumenta, el otrotambién o viceversa).

el coeficiente de correlación de Spearman, ρ (rho) esuna medida de la correlación (la asociación ointerdependencia) entre dos variables aleatoriascontinuas. Para calcular ρ, los datos son ordenados yreemplazados por su respectivo orden.

El estadístico ρ viene dado por la expresión

donde D es la diferencia entre los correspondientesestadísticos de orden de x - y. N es el número deparejas. Se tiene que considerar la existencia de datosidénticos a la hora de ordenarlos, aunque si éstos sonpocos, se puede ignorar tal circunstancia Para muestrasmayores de 20 observaciones, podemos utilizar lasiguiente aproximación a la distribución t de Student

Page 12: Presentacion slidershare 21 01 16 Josuana Bello

• Para aplicar la correlación de Spearman, se requiere que al menoslas variables estén medidas en al menos escala ordinar, es decir, deforma que las puntuaciones que la representan puedan sercolocadas en dos series ordenadas.

• Una generalización del coeficiente de Spearman es útil en lasituación en la cual hay tres o mas condiciones, varios individuosson observados en cada una de ellas y predecimos que lasobservaciones tendrán un orden en particular.

• La formula de calculo para esto puede derivarse de la utilizada enel caso de RXY; bastaría aplicar el coeficiente de correlación dePearson a dos series de puntuaciones ordinales, compuestas cadauna de ellas por los N primeros números naturales.

• A partir de un conjunto de N puntuaciones, la formula quepermite el calculo de la correlación entre dos variables X y Y,medidas al menos en escala ordinal.

Page 13: Presentacion slidershare 21 01 16 Josuana Bello

Ventajas:

• No esta afectada por los cambios en lasunidades medidas.

• Al ser una técnica no paramétrica, es libre dedistribución probabilística.

• La manifestación de una relación causa-efectoes posible solo a través de la comprensión de larelación natural que existe entre las variables yno debe manifestarse solo por la existencia deuna correlación.

• Los supuestos son menos estrictos. Es robusto ala presencia de outliers (es decir permiteciertos desvíos del patrón normal).

Desventajas:

• Hay que tener cuidado alinterpretar el valor de R.

• Es recomendable usarlo cuando losdatos presentan valores externos, yaque dichos valores afectan mucho elcoeficiente de correlación dePearson, o ante distribuciones nonormales.

• R no debe ser utilizado para deciralgo sobre la relación causa y efecto.

Page 14: Presentacion slidershare 21 01 16 Josuana Bello

• Clasificar en rangos cada medición de las observaciones.

• Obtener las diferencias de las parejas de rangos de lasvariables estudiadas y elevadas al cuadrado.

• Efectuar la sumatoria de todas las diferencias al cuadrado.

• Aplicar la ecuación:

• Calcular los grados de libertad (gl). gl = número de parejas - 1.Solo se utilizará cuando la muestra sea mayor a 10.

• Comparar el valor r calculado con respecto a los valorescríticos de la tabla de valores críticos de t de Kendall enfunción de probabilidad.

• Decidir si se acepta o rechaza la hipótesis.

Donde:rs = coeficiente decorrelación deSpearman.d2 = diferenciasexistentes entre losrangos de las dosvariables, elevadas alcuadrado.N = tamaño de lamuestra expresada enparejas de rangos delas variables.S = sumatoria.

Page 15: Presentacion slidershare 21 01 16 Josuana Bello

• Una Generalización de coeficiente de Spearman es útil enla situación en la cual hay tres o mas condiciones. Variosindividuos se observaron en cada uno de ellos ypredecimos que las observaciones tendrán un orden enparticular.

• Spearman distingue dos factores: el factor G y el factor S.El G es la inteligencia general (común a la mayoría de laspersonas). El S son las habilidades especificas de lainteligencia (verbal, numérica, espacial, entre otros).

• La interpretación del resultado del coeficiente decorrelación de Spearma se encuentra entre los valores de -1 y +1.

• La significación estadística de un coeficiente debe teneren cuenta conjuntamente con la relevancia clínica delfenómeno que se estudia.

Page 16: Presentacion slidershare 21 01 16 Josuana Bello

Pearson:

• Paramétrico.

• Permite medir la correlación yasociación entre dos variablescuando se trabaja con variablesnuméricas con distribuciónnormal.

• Es calculado en funciones de lavarianza y la covarianza entreambas variables.

Spearman:

• No paramétrico

• Es un coeficiente que permitemedir la correlación oasociación entre dos variablescuando las mediciones serealizan en una escala ordinal, ocuando no existe distribuciónnormal.

• Se calcula a base de una serie derangos asignados.

Page 17: Presentacion slidershare 21 01 16 Josuana Bello

https://es.wikipedia.org/wiki/Coeficiente_de_correlaci%C3%B3n_de_Pearson

http://www.ehowenespanol.com/coeficiente-correlacion-pearson-como_84118/

http://www.monografias.com/trabajos84/correlacion/correlacion.shtml#ixzz3ySMAOHzz

http://www.uv.es/webgid/Descriptiva/31_coeficiente_de_pearson.html

http://es.slideshare.net/GEONARKIS/coeficiente-de-correlacion-50283811

http://www.ray-design.com.mx/psicoparaest/index.php?option=com_content&view=article&id=253:coeficiente-spearman&catid=54:coeficiente-correla&Itemid=75

http://es.scribd.com/doc/134574744/COEFICIENTE-DE-CORRELACION-DE-PEARSON-Y-SPEARMAN-DR-ENRIQUE-SIERRA#scribd