Seminari 2. Estadística CP - UPF84.89.132.1/~satorra/dades/Seminari2_sol.pdf1 Seminari 2....

7
1 Seminari 2. Estadística CP Problema 1 - Solució. a. Comandos: GRAFICO\INTERACTIVOS\DIAGRAMA DE DISPERSION La variable dependiente (a explicar) se coloca en el eje Y; mientras que la variable independiente (explicativa), en el eje X.

Transcript of Seminari 2. Estadística CP - UPF84.89.132.1/~satorra/dades/Seminari2_sol.pdf1 Seminari 2....

Page 1: Seminari 2. Estadística CP - UPF84.89.132.1/~satorra/dades/Seminari2_sol.pdf1 Seminari 2. Estadística CP Problema 1 - Solució. a. Comandos: GRAFICO\INTERACTIVOS\DIAGRAMA DE DISPERSION

1

Seminari 2. Estadística CP

Problema 1 - Solució.

a. Comandos: GRAFICO\INTERACTIVOS\DIAGRAMA DE DISPERSION La variable dependiente (a explicar) se coloca en el eje Y; mientras que la variable independiente (explicativa), en el eje X.

Page 2: Seminari 2. Estadística CP - UPF84.89.132.1/~satorra/dades/Seminari2_sol.pdf1 Seminari 2. Estadística CP Problema 1 - Solució. a. Comandos: GRAFICO\INTERACTIVOS\DIAGRAMA DE DISPERSION

2

Es difícil encontrar una relación entre estas dos variables. Posibles observaciones atípicas son el punto mas elevado y el que se encuentra mas a la derecha (que serian los registros de Mets y Cardinals, respectivamente). b. Comandos: ANALIZAR \ CORRELACIONES \ DIVARIADAS luego selecciona las variables a analizar y en OPCIONES puedes pedir a SPSS que te reporte la media y la desviación típica de las variables.

Porcentaje de la variación del precio de los refrescos explicados a partir de la relación lineal: 0.1432= 0.020449 c. Comandos: ANALIZAR \ REGRESION \ LINEAL

Page 3: Seminari 2. Estadística CP - UPF84.89.132.1/~satorra/dades/Seminari2_sol.pdf1 Seminari 2. Estadística CP Problema 1 - Solució. a. Comandos: GRAFICO\INTERACTIVOS\DIAGRAMA DE DISPERSION

3

Para obtener este grafico utilizar la secuencia de comandos: GRAFICO\INTERACTIVOS\DIAGRAMA DE DISPERSIÓN y en la opcion de AJUSTE, selecciona “Regresión”. La línea de regresión es casi horizontal porque la relación entre el precio del bocadillo y el de refrescos es muy baja. Recuerda que la pendiente esta definida por el coeficiente de correlación, y este es bajo. Por lo tanto, es difícil poder explicar el precio del refresco en función del precio del bocadillo. d. Valores extremos Comandos: GRAFICO\INTERACTIVOS\DIAGRAMA DE DISPERSIÓN Pero esta vez selecciona la variable “Estadio” en ETIQUETAR LOS CASOS MEDIANTE; y luego, haciendo doble-click sobre el grafico se puede desactivar las etiquetas a todas las observaciones y empezar a mostrar las etiquetas observación por observación.

Page 4: Seminari 2. Estadística CP - UPF84.89.132.1/~satorra/dades/Seminari2_sol.pdf1 Seminari 2. Estadística CP Problema 1 - Solució. a. Comandos: GRAFICO\INTERACTIVOS\DIAGRAMA DE DISPERSION

4

Luego, para determinar si las observaciones atípicas, “Mets” y “Cardinals”, son influyentes o no (puedes encontrar esta definición en el Moore, página 150), las eliminamos una a la vez y analizamos si esta eliminación afecta la recta de regresión y el R-cuadrado: a. Si eliminamos “Metz”:

b. Si eliminamos “Cardinals”

Page 5: Seminari 2. Estadística CP - UPF84.89.132.1/~satorra/dades/Seminari2_sol.pdf1 Seminari 2. Estadística CP Problema 1 - Solució. a. Comandos: GRAFICO\INTERACTIVOS\DIAGRAMA DE DISPERSION

5

De los graficos se obseva que la eliminación de “Cardinal” tiene mayor efecto que la eliminación de “Mets”. En este caso, la pendiente y la constante de la recta de regresion se reducen y el R-cuadrado aumenta a 0.05. Lo cual nos hace pensar que esta observación si es influyente. Sin embargo, cuando se eliminan ambas observaciones, se observa que el efecto final es mucho menor que cuando solo se elimina “Mets”. Fijate el R-cuadrado no ha variado y la pendiente de la recta se ha incrementado marginalmente. Esto indica que el efecto de la eliminación de ambos valores extremos se ha compensado, por lo menos parcialmente.

Page 6: Seminari 2. Estadística CP - UPF84.89.132.1/~satorra/dades/Seminari2_sol.pdf1 Seminari 2. Estadística CP Problema 1 - Solució. a. Comandos: GRAFICO\INTERACTIVOS\DIAGRAMA DE DISPERSION

6

Problema 2.

Los ejercicios son del libro de Moore (segunda edición). Debe utilizarse SPSS en su resolución.

b) El estadístico de bondad de ajuste, denominado R-cuadrado, es la fracción de la variación de las y que explica la recta de regresión mínimo cuadrática de y con relación a x.

Page 7: Seminari 2. Estadística CP - UPF84.89.132.1/~satorra/dades/Seminari2_sol.pdf1 Seminari 2. Estadística CP Problema 1 - Solució. a. Comandos: GRAFICO\INTERACTIVOS\DIAGRAMA DE DISPERSION

7