ESTADÍSTICA APLICADA CON R-COMMANDER - … · 14 estadÍstica aplicada con r-commander La segunda...

26
ESTADÍSTICA APLICADA CON R-COMMANDER Alfonso García Pérez

Transcript of ESTADÍSTICA APLICADA CON R-COMMANDER - … · 14 estadÍstica aplicada con r-commander La segunda...

Page 1: ESTADÍSTICA APLICADA CON R-COMMANDER - … · 14 estadÍstica aplicada con r-commander La segunda opción, Importar datos , permite incorporar a R datos en otros formatos, por ejemplo

ESTADÍSTICA APLICADA

CON R-COMMANDER

Alfonso García Pérez

Page 2: ESTADÍSTICA APLICADA CON R-COMMANDER - … · 14 estadÍstica aplicada con r-commander La segunda opción, Importar datos , permite incorporar a R datos en otros formatos, por ejemplo

ESTADÍSTICA APLICADA CON R-COMMANDER 2

Copyright © 2011 Alfonso García Pérez ``No está permitida la reproducción total o parcial de este libro, ni su tratamiento informático, ni la transmisión de ninguna forma o por cualquier medio, ya sea electrónico, mecánico, por fotocopia, por registro u otros medios, sin el permiso previo y por escrito de los titulares del Copyright. El contenido de este libro está registrado por el autor en el Registro de la Propiedad Intelectual y protegido por la Ley, que establece penas de prisión además de las correspondientes indemnizaciones para quien lo plagiara"

Edita: Universidad Nacional de Educación a Distancia

Page 3: ESTADÍSTICA APLICADA CON R-COMMANDER - … · 14 estadÍstica aplicada con r-commander La segunda opción, Importar datos , permite incorporar a R datos en otros formatos, por ejemplo

ALFONSO GARCÍA PÉREZ 3

Contenido

Prólogo………………………………………………………. 5 Capítulo 1: Introducción al R-Commander …………… 7 Capítulo 2: Estadística Descriptiva ……………………. 17 Capítulo 3: Regresión Lineal y Correlación .…………. 21

Page 4: ESTADÍSTICA APLICADA CON R-COMMANDER - … · 14 estadÍstica aplicada con r-commander La segunda opción, Importar datos , permite incorporar a R datos en otros formatos, por ejemplo

ESTADÍSTICA APLICADA CON R-COMMANDER 4

Page 5: ESTADÍSTICA APLICADA CON R-COMMANDER - … · 14 estadÍstica aplicada con r-commander La segunda opción, Importar datos , permite incorporar a R datos en otros formatos, por ejemplo

ALFONSO GARCÍA PÉREZ 5

Prólogo

El presente texto es una Guía abreviada de cómo utilizar la librería de R denominada R-Commander. Esta librería trata de simplificar algún aspecto de R dando una visualización, de este paquete gratuito, semejante a SPSS. La gran ventaja de R-Commander es que todo lo que se haga con esta librería afecta a R y viceversa. Esto es especialmente útil en cuanto a la incorporación de los datos a R. Adelantamos, no obstante, que estas notas no son exhaustivas en cuanto al uso de R-Commander y que seguimos recomendado utilizar R directamente desde la línea de comandos. Además, con R-Commander sólo se pueden ejecutar los Métodos Estadísticos que aparecen en sus menús desplegables (que no son muchos por cierto) mientras que con R podemos ejecutar prácticamente todas las Técnicas Estadísticas. Aún más, la ventaja de R es que cualquier innovación estadística casi seguro que viene acompañada de programas en R, habitualmente en forma de una librería que se puede descargar el usuario, mientras que lo más probable es que esas innovaciones no se incorporen a R-Commander. En resumen, R-Commander es una buena herramienta para iniciarse en R e incorporar datos a R de forma más elemental, así como para que la utilicen los usuarios de paquetes estadísticos que funcionan a base de cuadros de diálogos al estilo de SPSS. Por último, le recordamos que puede ver más grandes las figuras utilizando el zoom de su pdf.

Alfonso García Pérez [email protected]

Page 6: ESTADÍSTICA APLICADA CON R-COMMANDER - … · 14 estadÍstica aplicada con r-commander La segunda opción, Importar datos , permite incorporar a R datos en otros formatos, por ejemplo

ESTADÍSTICA APLICADA CON R-COMMANDER 6

Page 7: ESTADÍSTICA APLICADA CON R-COMMANDER - … · 14 estadÍstica aplicada con r-commander La segunda opción, Importar datos , permite incorporar a R datos en otros formatos, por ejemplo

ALFONSO GARCÍA PÉREZ 7

Capítulo 1

Introducción al R-Commander 1.1. Instalación R-Commander no es más que una librería de R por lo que su instalación seguirá los pasos habituales de instalación de librería de R. Para ello, con R abierto y conectados a Internet, desplegamos la pestaña superior Paquetes y elegimos la opción Seleccionar espejo CRAN

Page 8: ESTADÍSTICA APLICADA CON R-COMMANDER - … · 14 estadÍstica aplicada con r-commander La segunda opción, Importar datos , permite incorporar a R datos en otros formatos, por ejemplo

ESTADÍSTICA APLICADA CON R-COMMANDER 8

Aquí elegimos, preferiblemente, algún lugar cercano a donde tengamos instalado el ordenador presionando el botón OK.

Después, dentro de la misma pestaña Paquetes, elegimos la opción Instalar paquete(s)

Page 9: ESTADÍSTICA APLICADA CON R-COMMANDER - … · 14 estadÍstica aplicada con r-commander La segunda opción, Importar datos , permite incorporar a R datos en otros formatos, por ejemplo

ALFONSO GARCÍA PÉREZ 9

y allí seleccionamos el paquete Rcmdr. Presionando el botón de OK, R nos instalará R-Commander.

Bastará hacer esto una sola vez aunque cuando salga de R debe decir que SÍ a Guardar Imagen de área de trabajo, porque si no lo hace, las modificaciones que haya hecho en R, como instalar R-Commander, no serán guardadas.

Page 10: ESTADÍSTICA APLICADA CON R-COMMANDER - … · 14 estadÍstica aplicada con r-commander La segunda opción, Importar datos , permite incorporar a R datos en otros formatos, por ejemplo

ESTADÍSTICA APLICADA CON R-COMMANDER 10

De esta forma tendrá ya instalado R-Commander el cual, como cualquier otro paquete, para abrirlo sólo tendremos que, primero abrir R y luego, desde la línea de comandos de R ejecutar > library(Rcmdr)

obteniendo dos pantallas para ejecutar sentencias de R: la habitual línea de comandos y el R-Commander que, como antes dijimos, facilita algunas operaciones de R. Dependiendo de la versión de R que tengamos, es posible que, al instalar R-Commander siguiendo los pasos anteriores, el ordenador nos diga que faltan algunos paquetes.

Page 11: ESTADÍSTICA APLICADA CON R-COMMANDER - … · 14 estadÍstica aplicada con r-commander La segunda opción, Importar datos , permite incorporar a R datos en otros formatos, por ejemplo

ALFONSO GARCÍA PÉREZ 11

En ese caso, respóndale SÍ cuando nos pregunta si los instala y luego presione OK en la siguiente pantalla

R tardará unos minutos en instalar todas las librerías que necesita. La razón de fondo es que R-Commander no es más que una utilidad que permite ejecutar Métodos Estadísticos más fácilmente. Si no tiene instalados estos métodos en R, el ordenador le solicita permiso para instalarlos para que pueda ejecutarlos desde las persianas desplegables del R-Commander. La verdad es que, de esta forma, le instalará muchos métodos que lo mismo no utiliza nunca, pero piense que esto sólo lo debe hacer una vez. También es

Page 12: ESTADÍSTICA APLICADA CON R-COMMANDER - … · 14 estadÍstica aplicada con r-commander La segunda opción, Importar datos , permite incorporar a R datos en otros formatos, por ejemplo

ESTADÍSTICA APLICADA CON R-COMMANDER 12

cierto que si quiere tener actualizado R-Commander, puede ejecutar los pasos anteriores de vez en cuando.

1.2. Incorporación de datos

Lo primero que analizaremos es cómo incorporar los datos a R mediante R-Commander. Ya adelantamos que, mediante R-Commander, los datos se incorporan en formato data.frame, pero de este formato siempre podemos obtener por ejemplo, el formato vector. También resaltamos el que los datos ya incorporados a R (en este formato data.frame) pueden ser utilizados por R-Commander y viceversa. De hecho es que los datos siempre estarán en R ya que, como hemos dicho, R-Commander es sólo un visualizador de R Al abrir R-Commander aparece una pestaña o botón en su línea superior denominada Datos. Presionándola aparecen las opciones que podemos utilizar. Las más comunes serán, Nuevo conjunto de datos, utilizada para incorporar los datos uno a uno (manualmente), Importar datos, para incluirlos desde otro fichero, y Conjunto de datos activo, opción utilizada para abrir un conjunto de datos ya existente en R.

Si utilizamos la primera opción para incorporar unos datos nuevos, nos aparece primero un cuadro de diálogo pidiéndonos un nombre para ese conjunto de datos nuevo

Page 13: ESTADÍSTICA APLICADA CON R-COMMANDER - … · 14 estadÍstica aplicada con r-commander La segunda opción, Importar datos , permite incorporar a R datos en otros formatos, por ejemplo

ALFONSO GARCÍA PÉREZ 13

y, a continuación, el editor de datos en donde incorporar los datos uno a uno.

y en donde puede cambiar el nombre de las variables presionado sobre su nombre actual, var1, var2, etc. Al cerrar esta ventana, el conjunto de datos nuevo queda incorporado a R.

Page 14: ESTADÍSTICA APLICADA CON R-COMMANDER - … · 14 estadÍstica aplicada con r-commander La segunda opción, Importar datos , permite incorporar a R datos en otros formatos, por ejemplo

ESTADÍSTICA APLICADA CON R-COMMANDER 14

La segunda opción, Importar datos, permite incorporar a R datos en otros formatos, por ejemplo txt o procedentes de Excel, o incluso de SPSS.

La última opción que analizaremos, Conjunto de datos activo, sirve, fundamentalmente, para seleccionar el conjunto de datos a analizar porque ya está incorporado a R.

Page 15: ESTADÍSTICA APLICADA CON R-COMMANDER - … · 14 estadÍstica aplicada con r-commander La segunda opción, Importar datos , permite incorporar a R datos en otros formatos, por ejemplo

ALFONSO GARCÍA PÉREZ 15

Ejemplo 2.1-CB ___________________________________________

Los datos de este ejemplo están en el fichero agricultores2.txt . Para incorporarlos a R-Commander utilizaremos la segunda opción de las dos analizadas más arriba, Importar datos, apareciendo el siguiente cuadro de diálogo en donde hemos denominado agricultores a los datos a incorporar.

Se selecciona el fichero antes mencionado de donde esté ubicado y ya tendremos incorporados los datos a R.

Page 16: ESTADÍSTICA APLICADA CON R-COMMANDER - … · 14 estadÍstica aplicada con r-commander La segunda opción, Importar datos , permite incorporar a R datos en otros formatos, por ejemplo

ESTADÍSTICA APLICADA CON R-COMMANDER 16

Una cuestión de interés es que, al ir haciendo todo esto, en las dos ventanas de R-Commander van apareciendo las instrucciones de R que ejecutaríamos desde la línea de comandos, en especial en la primera de ellas en negro. De esta manera podemos ir aprendiendo lenguaje R con R-Commander, al mismo tiempo que simplificamos su uso. Incluso podríamos modificar algo de la sentencia que aparece en esa primera ventana para volver a ejecutarla marcando la sentencia que queremos ejecutar y haciendo click en el botón Ejecutar.

Page 17: ESTADÍSTICA APLICADA CON R-COMMANDER - … · 14 estadÍstica aplicada con r-commander La segunda opción, Importar datos , permite incorporar a R datos en otros formatos, por ejemplo

ALFONSO GARCÍA PÉREZ 17

Capítulo 2

Estadística Descriptiva 2.1. Análisis de datos Una vez que tenemos activo el conjunto de datos a analizar,

el cual vemos en azul en la parte superior de la ventana, podemos desplegar la persiana Estadísticos o la persiana Gráficas para aplicar los métodos que allí se indican al conjunto de datos en activo.

Page 18: ESTADÍSTICA APLICADA CON R-COMMANDER - … · 14 estadÍstica aplicada con r-commander La segunda opción, Importar datos , permite incorporar a R datos en otros formatos, por ejemplo

ESTADÍSTICA APLICADA CON R-COMMANDER 18

Ejemplo 2.1-CB ___________________________________________

Desplegando la persiana Estadísticos, podemos hacer, básicamente, lo que se denomina Resúmenes-> Conjunto de datos activo, que, como se ve, no es más que aplicar la función summary a los datos

o calcular medidas de posición o dispersión, con el botón Resúmenes numéricos

Page 19: ESTADÍSTICA APLICADA CON R-COMMANDER - … · 14 estadÍstica aplicada con r-commander La segunda opción, Importar datos , permite incorporar a R datos en otros formatos, por ejemplo

ALFONSO GARCÍA PÉREZ 19

o hacer el Test de normalidad de Shapiro-Wilk , siendo preguntado en cada ocasión por la variable a ejecutar el método (en este caso, la única del conjunto de datos).

Para este conjunto de datos, el otro método estadístico de interés es un test de la t de Student, si se aceptó la normalidad de los datos.

Page 20: ESTADÍSTICA APLICADA CON R-COMMANDER - … · 14 estadÍstica aplicada con r-commander La segunda opción, Importar datos , permite incorporar a R datos en otros formatos, por ejemplo

ESTADÍSTICA APLICADA CON R-COMMANDER 20

Insistimos que cada vez que “ejecutamos” algo con R-Commander, estamos en realidad, ejecutando la función de R que aparece en negro en la primera ventana. De las posibles gráficas, quizá la más adecuada sería un histograma

el cual sale gris por el último argumento que ejecuta R-Commander, el cual se puede modificar.

Page 21: ESTADÍSTICA APLICADA CON R-COMMANDER - … · 14 estadÍstica aplicada con r-commander La segunda opción, Importar datos , permite incorporar a R datos en otros formatos, por ejemplo

ALFONSO GARCÍA PÉREZ 21

Capítulo 3

Regresión Lineal y Correlación 3.1. Regresión Lineal Simple El estudio del test analizado aquí, puede estudiar en las Secciones 9.2 y 9.3 del texto CB. Como allí destacábamos, hay dos aspectos de interés: la representación gráfica de los datos y el Análisis de la Regresión

Ejemplo 9.1-CB ___________________________________________

En esta sección ejecutaremos una regresión lineal simple incorporando los datos de un fichero de SPSS, denominado profundidad.sav

denominando profundidad al conjunto de datos que vamos a crear

Page 22: ESTADÍSTICA APLICADA CON R-COMMANDER - … · 14 estadÍstica aplicada con r-commander La segunda opción, Importar datos , permite incorporar a R datos en otros formatos, por ejemplo

ESTADÍSTICA APLICADA CON R-COMMANDER 22

Una vez que busquemos dónde está el conjunto de datos, R-Commander nos los incorpora a R. Podemos visualizar el conjunto de datos importado con la opción del mismo nombre de la barra superior

Primero determinaremos la recta de regresión ajustada ejecutando la secuencia de botones

Estadísticos -> Ajuste de modelos -> Regresión lineal

Page 23: ESTADÍSTICA APLICADA CON R-COMMANDER - … · 14 estadÍstica aplicada con r-commander La segunda opción, Importar datos , permite incorporar a R datos en otros formatos, por ejemplo

ALFONSO GARCÍA PÉREZ 23

indicando al ordenador cuál es la variable dependiente y la independiente.

R-Commander nos determina la recta de regresión y la tabla de Análisis de la Varianza para la regresión.

Page 24: ESTADÍSTICA APLICADA CON R-COMMANDER - … · 14 estadÍstica aplicada con r-commander La segunda opción, Importar datos , permite incorporar a R datos en otros formatos, por ejemplo

ESTADÍSTICA APLICADA CON R-COMMANDER 24

3.2. Regresión Lineal Múltiple El estudio del test analizado aquí, puede estudiar en las Secciones 10.2 y 10.3 del texto CB. Las opciones a ejecutar son las mismas que en la sección anterior, con la diferencia de que debemos incluir más de una variable independiente.

Ejemplo 10.1-CB __________________________________________

En este caso los datos los tenemos en un fichero de texto, hospital.txt, por lo que primero los incorporamos y los denominaremos hospital, aceptando las opciones que el cuadro de diálogo nos ofrece.

Ahora volvemos a repetir los mismos pasos del ejemplo anterior seleccionado la secuencia de botones

Estadísticos -> Ajuste de modelos -> Regresión lineal aunque poniendo esta vez como variables independientes Admisiones y Edad y como variable dependiente Dias. Si, como ocurre por defecto, no puede seleccionar a la vez las dos variables independientes porque aparecen en orden alfabético y no puede saltar una, deberá o bien modificar la sentencia de la primera ventana después de ejecutar una regresión lineal simple, o mejor, ejecutar la secuencia

Estadísticos -> Ajuste de modelos -> Modelo lineal

Page 25: ESTADÍSTICA APLICADA CON R-COMMANDER - … · 14 estadÍstica aplicada con r-commander La segunda opción, Importar datos , permite incorporar a R datos en otros formatos, por ejemplo

ALFONSO GARCÍA PÉREZ 25

y completar el cuadro de diálogo escribiendo el modelo, como lo hace en la línea de comandos de R

Al presionar el botón Aceptar, R-Commander nos estima el hiperplano de regresión y nos determina las covariables significativas

Page 26: ESTADÍSTICA APLICADA CON R-COMMANDER - … · 14 estadÍstica aplicada con r-commander La segunda opción, Importar datos , permite incorporar a R datos en otros formatos, por ejemplo

ESTADÍSTICA APLICADA CON R-COMMANDER 26

Como se ve que Admisiones es una covariable que se puede eliminar del modelo, volvemos a ejecutar el proceso anterior quitando esta covariable y obteniendo

es decir, la ecuación de la recta de ajuste,

Dias = 1.977 + 1.057 Edad