Enseñando R en el Grado en Estadística

Post on 06-Jan-2017

222 views 2 download

Transcript of Enseñando R en el Grado en Estadística

Ensenando R en el Grado en Estadıstica

Teresa Gonzalez Arteaga

Universidad de Valladolid

VII Jornadas de Usuarios de R

Salamanca, 5 de noviembre 2015

UValogocolor

Indice

1. Sobre el Grado en Estadıstica

2. Computacion estadıstica: una asignatura particular

3. Topicos de R y recursos

4. Comentarios finales

2

UValogocolor

Titulaciones de Grado en Estadıstica (2015 - 2016)

Universidades:

UABUB-UPCUVICCarlos IIIUCMUMHUSUGRUJAENUEXUSALUVA

3

UValogocolor

4

UValogocolor

Grado en Estadıstica en la UVa

5

UValogocolor

Nuevo reto ...

6

UValogocolor

7

UValogocolor

8

UValogocolor

Asignaturas de Estadıstica en el Grado en la UVA

• Estadıstica descriptiva

• Modelos probabilısticos

• Probabilidad

• Computacion estadıstica

• Inferencia estadıstica I, II

• Muestreo estadıstico I, II

• Regresion y anova

• Analisis de datos

• Modelos lineales

• Analisis de datos categoricos

• Analisis de series temporales

• Analisis multivariante

• Modelos estadısticos avanzados

• Analisis de supervivencia

• Almacenes y minerıa de datos

• etc.

9

UValogocolor

10

UValogocolor

¿Por que ?

11

UValogocolor

12

UValogocolor

13

UValogocolor

Objetivos

• Trabajar sobre el razonamiento estadıstico y computacional

• Fundamentos de la programacion para el analisis de datos

• Lenguaje de comandos de R para analisis estadısicos

• Construir graficos estadısticos elaborados

• Manejar recursos de ayuda disponible en R

• Analisis reproducible

• Explorar datos

• Manejar conceptos importantes de probabilidad e inferenciaestadıstica mediante simulaciones

14

UValogocolor

15

UValogocolor

Topicos

• Entorno R

• Estructuras de datos y manipulacion de objetos

• Graficos

• Programacion

• Entradas y salidas digitales

• Herramientas de presentacion de informes

16

UValogocolor

Topicos

Estructuras de datos y manipulacion de objetos

Vector, factor, matrix, array, data.frame, list, data(), attach, [, ], [[, ]],

$, subset, split, cut, sort, which.min, which.max, which, dim(), cbind,

rbind, c(), colnames, names, levels, labels, funciones matematicas basi-

cas, estadısticos basicos apply, tapply, lapply, sapply

Creacion de funciones propias

if else, ifelse, for, while, any, all, break, next, warning, stop, system.time

Entradas y salidas digitales

source, scan, load, save, dump, write.table, read.table, pdf, png,

SavePlot17

UValogocolor

Topicos

Graficos tradicionales

Funciones graficas: plot, points,

lines, text, mtext, legend, title,

abline, segments, grid, axis, co-

lors, palette, matplot, boxplot.

stripchart, barplot, pie, mosaic-

plot, pairs,par, layout, split.screen

Prametros graficos: type, xlab,

ylab, xlim, ylim, main, sub, add,

col, lty, lwd, pch, cex

20 25 30 35 40 45 50

1020

3040

5060

Prices versus MPG

Miles per gallon

Pric

e

highwaycity

1500

014

000

1300

012

000

1100

010

000

9000

8000

7000

6000

5000

4000

3000

2000

1000 00

1000

2000

3000

4000

5000

6000

7000

8000

9000

1000

011

000

1200

013

000

1400

015

000

05

1015202530354045505560657075808590

Pirámide poblacionalValladolid

edad

mujeres hombres

18

UValogocolor

Topicos

Gaficos LATTICE

Funciones alto nivel:

xyplot, histogram, density-

plot, bwplot, barchart, dotplot,

... make.groups, equal.count,

trellis.par.get,...

Funciones bajo nivel y parame-

tros: type, autokey, layout,

groups, strip, between, pa-

nel, par.settings, panel.xyplot,

panel.abline, panel.lmline,

panel.rug, panel.grid, ...

Cars(1993 Makes & Models)

Weight

Gal

lons

per

100

mile

s

20

30

40

2000 2500 3000 3500 4000

Compact Large

2000 2500 3000 3500 4000

Midsize

Small

2000 2500 3000 3500 4000

Sporty

20

30

40

Van

Driver & Passenger Driver only None

19

UValogocolor

Sobre metodologıa

• Exposiciones cortas para introducir los distinton conceptos

• Realizar ejercicios y practicas

• Explorar y sacar partido de los recursos online

• Se trata de aprender haciendo

• Centrarnos en ensenar como desarrollar nuevo codigo enlugar de solo usar plantillas o llamar funciones ya existentes

No la librerıa Rcommander, hasta el final.

20

UValogocolor

Sobre metodologıa

• Exposiciones cortas para introducir los distinton conceptos

• Realizar ejercicios y practicas

• Explorar y sacar partido de los recursos online

• Se trata de aprender haciendo

• Centrarnos en ensenar como desarrollar nuevo codigo enlugar de solo usar plantillas o llamar funciones ya existentes

No la librerıa Rcommander, hasta el final.

20

UValogocolor

21

UValogocolor

22

UValogocolor

23

UValogocolor

Entorno

24

UValogocolor

Ejemplo

¿Es facil realizar mapas (cartogramas) de este tipo con R? ¿Quelibrerıas son necesarias?

Mapa de prueba

1e+06

2e+06

3e+06

4e+06

5e+06

6e+06

Mapa de prueba

Alto

Bajo

Medio

25

UValogocolor

Algunoslibros utiles

26

UValogocolor

Recursos online

Ayuda de los paquetes(enlaces, vinetas)

R graph fallery

(http://rgraphgallery.

blogspot.com.es/)

27

teresa
Línea
teresa
Línea

UValogocolor

¿Que he aprendido fruto de mi experiencia personal?

• Curva de aprendizaje relativamente empinada. Debemos advertirloe intentar evitar la frustracion.

• Aprender haciendo

28

UValogocolor

Comentarios finales

• El objetivo principal: promover competencias fundamentales paralos profesionales de la Estadıstica:

• Al principio el aprendizaje de R es muy “duro”. Luego se puedenabordar contenidos mas avanzados mas facilmente.

• Enfatizar caracterısticas muy relevantes del R: potencia, flexibilidady extensibilidad.

29

UValogocolor

Cuestiones abiertas

• ¿Que herramientas ensenamos para realizar graficos?

◦ Graficos tradicionales, latttice◦ ggplot2, gmap, sp◦ ggvis, googleVis, otras librererıas de graficos interactivos◦ ...

• ¿Otras librerıas instrumentales?

◦ odfWeave◦ ...

• ¿Ensenamos a crear librerıas?

• ¿Librerıas para construir GUIs sencillos?

30

UValogocolor

31