Semana 08 - Mínimos Cuadrados Ordinarios (MCO) - Se

18
MINIMOS CUADRADOS ORDINARIOS - MCO Tema 8 Mínimos cuadrados Ordinarios - Propiedades Error estándar de estimación Intervalos de confianza

Transcript of Semana 08 - Mínimos Cuadrados Ordinarios (MCO) - Se

Page 1: Semana 08 - Mínimos Cuadrados Ordinarios (MCO) - Se

MINIMOS CUADRADOS ORDINARIOS - MCO

Tema 8

Mínimos cuadrados Ordinarios - Propiedades Error estándar de estimación

Intervalos de confianza

Page 2: Semana 08 - Mínimos Cuadrados Ordinarios (MCO) - Se

Ejemplo 1 • La Directora del Departamento de salubridad esta interesada en la relación que

existe entre la antigüedad de un camión de basura y los gastos anuales de reparación que debe esperar. Para eso dispone de la siguiente información.

NoAntigüedad

(años)

Gastos de Reparación

(cientos US$)

Camión X Y101 5 7102 3 7103 3 6104 1 4

Page 3: Semana 08 - Mínimos Cuadrados Ordinarios (MCO) - Se

Ejemplo 1 – Ecuación de la recta regresión •

Page 4: Semana 08 - Mínimos Cuadrados Ordinarios (MCO) - Se

El Método de los Mínimos Cuadrados • Fórmula Desviaciones a la media

• Fórmula Alternativa

Page 5: Semana 08 - Mínimos Cuadrados Ordinarios (MCO) - Se

El Método de los Mínimos Cuadrados •

• La ecuación de estimación que describe la relación entre la antigüedad de un camión (X) y sus gastos anuales de reparación (Y) es:

• Ŷ = 3,75 + 0,75 X

NoAntigüedad

(años)

Gastos de Reparación

(cientos US$)

Camión X Y XY X2

101 5 7 35 25102 3 7 21 9103 3 6 18 9104 1 4 4 1

24 78 44 = 3.0Ῡ = 6.0

Page 6: Semana 08 - Mínimos Cuadrados Ordinarios (MCO) - Se

Solución • Ŷ (en cientos US$) = 3,75 + 0,75 X (años)

• (Gastos anuales de reparación) = 3,75 + 0,75 (Antigüedad camión)

• Con esta recta de regresión la directora puede estimar los gastos anuales de

representación dada la antigüedad de su equipo.

• Para un camión cuya antigüedad es de 4 años: • Ŷ = 3,75 + 0,75 (4)

• Ŷ = 6.75 $

• Lo que quiere decir que un camión con una antigüedad de 4 años demandará un gasto por reparación de US$ 675

Page 7: Semana 08 - Mínimos Cuadrados Ordinarios (MCO) - Se

Verificación de la ecuación de regresión • Si el error total de la ecuación de regresión (Y – Ŷ)

es igual a 0 • Se puede afirmar que los cálculos para obtener la

ecuación son correctos.

NoAntigüedad

(años)

Gastos de Reparación

(cientos US$)

Camión X Y XY X2 Ŷ Y - Ŷ101 5 7 35 25 7.5 -0.5102 3 7 21 9 6.0 1.0103 3 6 18 9 6.0 0.0104 1 4 4 1 4.5 -0.5

24 78 44 24.0 0.0 = 3.0Ῡ = 6.0 ERROR TOTAL

Page 8: Semana 08 - Mínimos Cuadrados Ordinarios (MCO) - Se

ERROR ESTÁNDAR DE LA ESTIMACIÓN

Page 9: Semana 08 - Mínimos Cuadrados Ordinarios (MCO) - Se

Error Estándar de la Estimación • El error estándar nos permite deducir la confiabilidad de la

ecuación de regresión que hemos desarrollado.

• Este error se simboliza Se y es similar a la desviación estándar en cuanto a que ambas son medidas de dispersión.

• El error estándar de la estimación mide la variabilidad, o dispersión de los valores observados alrededor de la línea de regresión.

• El error estándar de estimación se calcula con la finalidad de medir la confiabilidad de la ecuación de la estimación.

Page 10: Semana 08 - Mínimos Cuadrados Ordinarios (MCO) - Se

Error Estándar de la Estimación • El error estándar de estimación permite medir la

variabilidad o dispersión de los valores de (y) los cuales encontramos en la muestra, alrededor de la línea recta de regresión.

• El resultado que se obtiene del cálculo del error estándar de estimación se expresa en término de los valores de la variable dependiente yi.

• En la actualidad, existen dos ecuaciones para poder calcular el error estándar de estimación:

Page 11: Semana 08 - Mínimos Cuadrados Ordinarios (MCO) - Se

Error Estándar de la Estimación • Este método nos permite medir la confiabilidad de la ecuación estimada. • .

• Donde: Y = valores de la variable dependiente Ŷ = valores estimados de la ecuación de regresión que corresponden a cada valor de Y. n = tamaño de la muestra

• Método abreviado:

• a = ordenada Y de la ecuación b = pendiente de la ecuación n = tamaño de la muestra

Page 12: Semana 08 - Mínimos Cuadrados Ordinarios (MCO) - Se

Error Estándar de la Estimación • Se pierden dos grados de libertad puesto que los

parámetros (a) y (b) se usan como estimadores de sus respectivos valores poblacionales, en la ecuación de regresión muestral.

• Criterio: • Si el error estándar de estimación (Se) es igual a cero (0),

se espera que la ecuación de estimación (Ŷ = a + bx) sea un estimador perfecto de la variable dependiente y todos los puntos en el diagrama de dispersión deben estar concentrados alrededor de la línea recta de regresión.

Page 13: Semana 08 - Mínimos Cuadrados Ordinarios (MCO) - Se

Error Estándar de la Estimación • Mientras más grande sea el error estándar de la

estimación, mayor será la dispersión de los puntos alrededor de la recta de regresión.

• Si el Se = 0, esperamos que la ecuación de estimación sea un estimador perfecto de la variable dependiente.

• Podemos usar el Se para hacer afirmaciones de probabilidad acerca del intervalo alrededor del valor estimado de Ŷ,

• Se puede encontrar el 68% de los puntos dentro de ± 1 Se

• 95,5% ± 2 Se

99,7% ± 3 Se

Page 14: Semana 08 - Mínimos Cuadrados Ordinarios (MCO) - Se

Error Estándar de la Estimación • Ejemplo:

• 𝑆𝑆 = 1,52

= 0,866

NoAntigüedad

(años)

Gastos de Reparación

(cientos US$)

Camión X Y XY X2 Ŷ Y - Ŷ (Y - Ŷ)2 Y2

101 5 7 35 25 7.5 -0.5 0.3 49102 3 7 21 9 6.0 1.0 1.0 49103 3 6 18 9 6.0 0.0 0.0 36104 1 4 4 1 4.5 -0.5 0.3 16

24 78 44 24.0 0.0 1.5 150 = 3.0Ῡ = 6.0 ERROR TOTAL

Page 15: Semana 08 - Mínimos Cuadrados Ordinarios (MCO) - Se

El Error Estándar de Estimación (Se) En la presentación de la clase anterior se definía como:

y:

Donde: Suma de los

Cuadrados de X

Suma de los Cuadrados de Y

Suma de los productos cruzados

de X y Y

Page 16: Semana 08 - Mínimos Cuadrados Ordinarios (MCO) - Se

Intervalos de Confianza para la estimación • Ejemplo de la antigüedad del camión y gastos de reparación

Se predijo para un camión de 4 años de antigüedad: • Ŷ = 3,75 + 0,75 (4) = 6,75 $

• El Se = 0,866 → US$ 86,6 • Sus límites superior e inferior del intervalo de confianza para el gasto de

mantenimiento: • Ŷ = + 1 Se = 675 + (1)(86,60) = 761,60

Ŷ = - 1 Se = 675 - (1)(86,60) = 588,40

• Podemos afirmar que el 68% del tiempo (X) tendremos un gasto en reparaciones (Y) que estará entre US 588,40 y US$ 761,60.

Page 17: Semana 08 - Mínimos Cuadrados Ordinarios (MCO) - Se

Intervalos de Confianza para la estimación • Si se desea tener una seguridad aproximada del

95% de que los gastos anuales de reparación caerán en el intervalo de estimación. ¿Cómo calculamos este intervalo?

• La tabla distribución t se concentra en la probabilidad de que el estimador que estamos estimando caerá fuera del intervalo de predicción. Por lo tanto: 100 – 90 = 10% y luego identificamos los grados de libertad, que son 4 – 2 = 2.

• Buscamos t(0,05;2) = 2,920

Tabla de valores críticos de la distribución t de Student

g 0.50 0.25 0.20 0.10 0.05 0.03 0.02 0.01 0.011 1.00 2.41 3.08 6.31 12.71 25.45 31.82 63.66 127.322 0.82 1.60 1.89 2.92 4.30 6.21 6.96 9.92 14.093 0.76 1.42 1.64 2.35 3.18 4.18 4.54 5.84 7.45

Niveles de Significancia DOS COLAS

Page 18: Semana 08 - Mínimos Cuadrados Ordinarios (MCO) - Se

Intervalos de Confianza para la estimación • Tenemos que los intervalos son:

• Ŷ = t(Se) • El limite superior: • Ŷ = $675 + (2,920)($86,60) = $ 927,87 • El límite inferior: • Ŷ = $675 - (2,920)($86,60) = $ 422,13

• Por lo tanto, se puede estar seguro de que los

gastos anuales de reparación de un camión de 4 años de antigüedad estarán entre $ 422,13 y $927,87.