Seminario 6

13
Seminario 6 Marina Flores Salazar. Grupo 13. Virgen del Rocío.

Transcript of Seminario 6

Page 1: Seminario 6

Seminario 6

Marina Flores Salazar.Grupo 13.

Virgen del Rocío.

Page 2: Seminario 6

En el seminario 6 vamos a volver a trabajar con el programa Rcommander.

Vamos a realizar una análisis exploratorio de datos y también a realizar tablas de frecuencias, resúmenes numéricos y gráficos en el programa estadístico.

Introducción.

Page 3: Seminario 6

Paso 1: importar la base de datos y como está en el formato de R hay que hacerlo de la siguiente manera: datos cargar conjunto de datos activossalud2.

Page 4: Seminario 6

En el primer ejercicio vamos a seleccionar dos variables cualitativas-factor del fichero “activossalud.RData”, descríbelas en tablas de frecuencias e interpreta al

menos 3 aspectos en relación a la distribución de las mismas. Hay que seguir los siguientes pasos: estadísticos resúmenes distribución de frecuencia.

Las variables que hemos elegido son “fruta” y “cerveza”

Page 5: Seminario 6

A partir de esta tabla podemos sacar los siguientes datos:• El tamaño de la muestra es de 290.• El 89% come algo de fruta a lo largo de la semana y de

este porcentaje come fruta a diario el 32%.• Todos los datos están disponibles.• El 22% o no come fruta o come menos que una vez por

semana.• De los 290 individuos, el 55% que serían 159 comen

fruta 3 o más veces por semana.

FRUTA

Page 6: Seminario 6

CERVEZA

A partir de esta tabla podemos sacar los siguientes datos:• 107 personas nunca han tomado cerveza que sería el 37%.• El 18% lo han probado alguna vez y abarca a 51 personas.• El número de personas que consume cerveza 2 o 3 veces al mes es de 40 cuyo

porcentaje sería del 14%.• El porcentaje de 9% toman cervezas 2 o 3 veces a la semanas y correspondería con

27 personas.• 60 personas consumen cerveza los fines de semana. Correspondería el 21%.• El número de personas que consumen a diario es de 4, siendo el porcentaje de 1,38%.

Page 7: Seminario 6

En el segundo ejercicio vamos a seleccionar dos variables numéricas del fichero “activossalud.RData”, y mediante

resúmenes numéricos describe e interpreta la distribución de las mismas. Hay que seguir los siguientes pasos: estadísticos resúmenesresúmenes numéricos elección de variable.

Page 8: Seminario 6

PESO.

A partir de estos datos podemos saber:• La variable peso tiene una media de 62.75571 y su

desviación típica es de 12.65981.• Existen 16 casos no disponibles.• La mediana seria 60 y coincide con el segundo cuartil.• Esta variable es simétrica ya que la media y la mediana

tienen valores similares.

Page 9: Seminario 6

ALTURA.

A partir de estos datos podemos saber:• La variable altura tiene una media de 1.667 y su desviación

típica es de 0.08078101.• Solo existe un caso no disponible.• La mediana es 1.655 y coincide con el segundo cuartil.• Esta variable es simétrica ya que la media y la mediana son

semejantes.

Page 10: Seminario 6

En el tercer ejercicio vamos a realizar un gráfico de cada tipo con variables adecuadamente seleccionadas del fichero “activossalud.RData”, describe e interpreta la distribución los mismos. Para las variables cualitativas

tenemos el g´rafico de barras y el gráfico de sectores. Hay que seguir los siguientes pasos: grafica gráfica de

barras/sectores.

Page 11: Seminario 6

Podemos observar que solo una minoría toma combinados todos los días.

Page 12: Seminario 6

Como se puede observar en el diagrama la gran mayoría no ha consumido nunca hachís y que el número de personas que consumen 2 o 3 veces al mes es practicamente el mismo que el conjunto de los que consumen 2 o 3 veces a la semana, los fines de semana y a diario.

Page 13: Seminario 6