SEMINARIO 6

Post on 09-Jan-2017

103 views 1 download

Transcript of SEMINARIO 6

ACTIVIDAD 1

En primer lugar cargamos el conjunto de datos “activossalud.Rdata”

A continuación seleccionaremos dos variables cualitativas: dulces y refrescos

En el caso de los refrescos

En el caso de los dulces

Interpretamos los resultados

• DULCES: del total de personas (291): - 20 personas los toman a diario (6.9%) - el mayor porcentaje de personas corresponde a los que los toman menos de una vez a la semana (31.72%) - 42 personas nunca toman dulces (14,48%)• REFRESCOS: del total de personas: - Un 12.03% los toman a diario (35 personas) - Hay el mismo número de personas que no toman nunca refrescos y que los toman menos de una vez por semana (73) - Un 23.02% (67 personas) los toman 1 o 2 veces por semana

ACTIVIDAD 2

Seleccionamos las variables numéricas: comunicación familiar y comunicación pares

En el caso de comunicación familiar

En el caso de comunicación pares

Interpretamos los resultados

• COMUNICACIÓN FAMILIAR: - La media es 7.83 aprox. - Su desviación típica es de 2.82 - La mediana es 7, ya que corresponde al 50% - Como media y mediana son muy parecidas podemos decir

que es una variable simétrica - Hay 144 datos no disponibles

• COMUNICACIÓN PARES: - La media es 5.39 - La desviación típica es de 1.58 - La mediana es 5 (50%) - Es una variable simétrica - Hay 4 datos no disponibles

ACTIVIDAD 3

Vamos a realizar un gráfico de cada tipo:

• Gráfico de sectores

Viendo el gráfico deducimos que la mayoría consume menos de una vez por semana seguido de 1 o 2 veces/semana, y los que menos son los que nunca consumen

• Gráfico de barras

Claramente podemos observar como el número de personas que no consume es igual al del que consume menos de una vez por semana, siendo el menor número de personas el que corresponde a las que consumen a diario

• Histograma

La mayoría de las personas practican 2h de deporte diario. Este número va bajando a medida que aumenta el número de horas

• Diagrama de caja

Podemos observar que la variable es simétrica ya que la media y la mediana están muy próximas