ANALISIS DE REGRESION Y CORRELACION
Area
Pre
cio
30002500200015001000
220000
200000
180000
160000
140000
120000
Scatterplot of Precio vs Area
Mgr. Sonia Urquidi B.
OBJETIVOS Describir la relacin entre dos o ms
variables
Describir la fuerza de la relacin entre las variables independientes y la variable dependiente
Aplicar a la realidad
Especificar y Estimar un Modelo de Relacin entre las variables econmicas relativas a una determinada cuestin conceptual
CONTENIDO
1. Introduccin
2. Regresin simple
3. Regresin lineal simple
4. Anlisis de correlacin
5. Pruebas para parmetros poblacionales
6. Anlisis de regresin mltiple
7. Coeficiente de correlacin mltiple
1. Introduccin
Publicidad Ventas 35 350 50 450 40 360 65 540 55 520 45 420 70 560
Regresin y correlacin son las dos herramientas estadsticas ms poderosas y tiles que se pueden utilizar para solucionar muchos problemas.
Es un mtodo de anlisis de datos que sirve para poner en evidencia las relaciones que existen entre diversas variables
Con la regresin, se pretende identificar y cuantificar alguna relacin funcional entre dos o ms variables.
Una variable puede depender de una o ms variables.
Si solo depende de una, se puede decir que Y depende de X:
Y = f(X)
Regresin simple
Si depende de varias:
Y =f (X1, X2,,Xn)
Regresin mltiple
Demanda est en funcin de:
2. Regresin simple
Es la relacin entre dos variables.
Puede ser: Lineal: a medida
que X cambia Y cambia en una cantidad constante
Curvilnea
Curvilnea
3. Regresin Lineal Simple Se trata de predecir el comportamiento
de Y usando X.
El modelo de regresin lineal simple es de la forma:
XY10
Variable dependiente o respuesta
Variable independiente o predictora o explicativa
Intercepto
Pendiente
Error aleatorio
Ejemplos
Y Ventas
X es la publicidad
La recta es:
Y = 124 + 6 X
Intercepto Pendiente
Variacin vertical
Variacin horizontal
Lnea de regresin estimada
El modelo de regresin lineal es estimado por la ecuacin
eXY 10
Estimaciones
10 Error
Solo puede estimarse
Lnea de regresin estimada
El modelo de regresin estimada es:
XY10
Interpretacin de los Coeficientes de Regresin:
Interpretacin del intercepto :
Indica el valor promedio de la variable de respuesta Y cuando X es cero. Si se tiene certeza de que la variable predictora X no puede asumir el valor 0, entonces la interpretacin no tiene sentido.
Interpretacin de la pendiente :
Indica el cambio promedio en la variable de respuesta Y cuando X se incrementa en una unidad.
0
1
La ecuacin para estimar los parmetros de regresin es:
XY10
Es la recta que mejor se ajusta a los
datos muestrales
De lo que se trata es de estimar
0
1
MINIMOS CUADRADOS ORDINARIOS
Procedimiento matemtico para
estimar la recta de regresin.
M.C.O produce una recta que se
extiende por el centro del
diagrama de dispersin
aproximndose a todos los
puntos de datos ms que
cualquier otra recta.
Ejemplo
Publicidad Ventas
35 350
50 450
40 360
65 540
55 520
45 420
70 560 0
100
200
300
400
500
600
0 10 20 30 40 50 60 70 80
Ventas
Diagrama de dispersin
320
370
420
470
520
570
620
30 35 40 45 50 55 60 65 70 75
Ventas y Publicidad
Cambiando origen de los ejes
320
370
420
470
520
570
620
30 35 40 45 50 55 60 65 70 75
Ventas y Publicidad
Agregando la recta estimada
XY
10
320
370
420
470
520
570
620
30 35 40 45 50 55 60 65 70 75
Ventas y Publicidad
XY10
iY
iY
320
370
420
470
520
570
620
30 35 40 45 50 55 60 65 70 75
Ventas y Publicidad
XY10
iY
iY
Error
DIFERENCIA ENTRE LOS VALORES REALES DE Y
ERROR
iY
Y EL ESTIMADO DE Y
iY
)(iiYYError
M.C.O HACE QUE SE MINIMICE LA SUMA DE ESTOS ERRORES AL CUADRADO
0)( ii YY
mnimoYYii
2
)(
mnimoYYii
2
)(
COMO LA RECTA ESTIMADA ES:
mnimoXYii
2
10)(
iXY
10
REEMPLAZANDO VALORES:
DERIVANDO LOS PARAMETROS E IGUALANDO A O Y APLICANDO SUMAT.
mnimoXYii
2
10)(
ii XnY 10
2
10 iiii XXXY
XYi
47.634.124
La recta estimada es:
SUPUESTOS DEL MODELO DE REGRESION
1. El trmino de error es una variable aleatoria distribuida normalmente
Para cada valor de X, no necesariamente existe un solo valor de Y
Algunas veces Y estar por encima de la recta de regresin y otras por debajo, da el llamado error, los mismos que se distribuyen en forma normal y aleatoriamente alrededor de la recta de regresin poblacional
2. Varianzas iguales de los valores Y
M.C.O asume que las varianzas en los valores de Y es la misma para todos los valores de X.
Supuesto de HOMOSCEDASTICIDAD
Y en la prctica?
2. Los trminos de error son independientes uno de otro
El trmino error encontrado para un valor de Y, no se relaciona con el trmino de error para cualquier otro valor de Y
Esto puede verse analizando el diagrama de los errores de los datos muestrales, si no se observa ningn patrn, se puede asumir que los trminos de error no se relacionan.
Si no cumple este supuesto, se dice que hay autocorrelacin.
4. Medidas de bondad de ajuste
A la recta de regresin, se la denomina tambin la recta del ajuste ptimo, sin embargo es necesario conocer qu tan bien se ajustan los datos a esta recta
1. Error estndar de la estimacin
2. Coeficiente de determinacin
Error estndar de la estimacin:
Se Es una medida del grado de
dispersin de los valores Yi alrededor de la recta de regresin
Mide la variacin de los puntos de los datos por encima y por debajo de la recta
320
370
420
470
520
570
620
30 35 40 45 50 55 60 65 70 75
Ventas y Publicidad
Qu pasa si todos los puntos estn sobre la recta?
Cunto es el error de estimacin?
As ocurre en la realidad?
Siempre hay dispersin
Es medida por el error estndar de la estimacin
Error estndar de la
estimacin: Se
2
)( 2
n
YYS iieVentas
350 450 360 540 520 420 560
Y est 350,79 447,84 383,14 544,89 480,19 415,49 577,24
(Yi Y est)^2 0,69 4,42 537,70 24,64 1.579,77 19,86 299,94
2.467,03
27
03,2467
eS
21,22eS
Error estndar de la
estimacin: Se, tambin se puede calcular:
CMESe
2n
SCECME
X
XY
YSC
SCSCSCE
2)(
A TRAVS DE EXCEL
Estadsticas de la regresin Coeficiente de correlacin mltiple 0,97139156 Coeficiente de determinacin R^2 0,94360156 R^2 ajustado 0,93232187 Error tpico 22,2127395 Observaciones 7
GRACIAS
Top Related