INFORME DE ESTADÍSTICA DESCRIPTIVA.€¦  · Web viewLa estadística se puede dividir en...

18

Transcript of INFORME DE ESTADÍSTICA DESCRIPTIVA.€¦  · Web viewLa estadística se puede dividir en...

Page 1: INFORME DE ESTADÍSTICA DESCRIPTIVA.€¦  · Web viewLa estadística se puede dividir en estadística descriptiva que ... nos encontramos con la estadística inferencial cuya función
Page 2: INFORME DE ESTADÍSTICA DESCRIPTIVA.€¦  · Web viewLa estadística se puede dividir en estadística descriptiva que ... nos encontramos con la estadística inferencial cuya función

2

Page 3: INFORME DE ESTADÍSTICA DESCRIPTIVA.€¦  · Web viewLa estadística se puede dividir en estadística descriptiva que ... nos encontramos con la estadística inferencial cuya función

Índice

1. Introducción

2. Objetivos: generales y específicos

3. Metodología

3.1. Población de estudio. Muestra

3.2. Variables a analizar

3.3. Análisis de datos

4. Resultados

5. Conclusión

3

Page 4: INFORME DE ESTADÍSTICA DESCRIPTIVA.€¦  · Web viewLa estadística se puede dividir en estadística descriptiva que ... nos encontramos con la estadística inferencial cuya función

1. Introducción

La estadística se puede dividir en estadística descriptiva que como su nombre indica,

describe y analiza los datos de un colectivo/muestra o una población, con el fin de

descubrir las regularidades o características existentes en sus elementos. La misma, se

clasifica en descriptiva univariable, que analiza la distribución de una característica o

dimensión en una población, y elabora una serie de medidas que resumen esa

distribución y en descriptiva bivariable que se ocupa de analizar la distribución

conjunta de dos variables en la población y la asociación entre las mismas. Por otro

lado, nos encontramos con la estadística inferencial cuya función es extrapolar las

características al conjunto del colectivo de dónde se extrae el subconjunto.

Sin embargo, algunos autores no distinguen entre las dos ramas y consideran que la

Estadística es la disciplina científica que se ocupa de recoger, ordenar y analizar los

datos de una muestra extraída de cierta población, y que, a partir de esa muestra,

valiéndose de cálculo de probabilidades, se encarga de hacer inferencias acerca de la

población. De este modo, las dos clasificaciones no serían más que dos niveles de la

disciplina: descripción y resumen de los datos, un paso previo para la operación

fundamental de la Estadistica, la inferencia.

2. Objetivos

- General: Utilizar la estadística descriptiva para exponer ordenadamente e

interpretar la información recogida sobre un conjunto de datos.

- Específicos:

Describir en tablas de frecuencia los datos de dos variables cualitativas-

factor del fichero “activossalud.RData” e interpretar al menos 3 aspectos en

relación a la distribución de las mismas.

Describir mediante resúmenes numéricos dos variables numéricas del

fichero “activossalud.RData” e interpretar la distribución de las mismas.

Realizar al menos un gráfico de cada tipo con variables adecuadamente

seleccionadas del fichero “activossalud.RData”, describir e interpretar la

distribución de los mismos.

3. Metodología

3.1. Población de estudio. Muestra.

4

Page 5: INFORME DE ESTADÍSTICA DESCRIPTIVA.€¦  · Web viewLa estadística se puede dividir en estadística descriptiva que ... nos encontramos con la estadística inferencial cuya función

El estudio realizado consta de 291 participantes, estudiantes de primero de

enfermería de la Universidad de Sevilla, centros propios y adscritros, para conocer

sus estilos de vida y activos en salud.

3.2. Variables a analizar.

Dentro de este estudio, tomamos dos variables cualitativas y otras dos

cuantitativas:

Variables cuantitativas

- Altura: variable cuantitativa, vector numérico medida en metros.

- Peso: variable cuantitativa, vector numérico medido en kilogramos.

Variables cualitativas

- Tabaco: variable cualitativa identificada mediante: 0-“a diario”, 1- “solo los

fines de semana”, 2- “2 o 3 veces a la semana”, 3- “2 o 3 veces al mes”, 4-

“Alguna vez anual”, 5- “Nunca”.

- Estudios padre: es una variable cualitativa, con 3 categorías: 1-“ninguno o

primarios”, 2-“bachiller”, 3-“universitarios”.

3.3. Análisis de datos

Para el desarrollo del informe hemos trabajado con el Sofware R versión 3.4.4

para Windows. Adentrándonos en este Sofware, mencionaremos que comenzó en

los años 90 (s. XX), inventado por dos profesores de la universidad Auckland

(Nueva Zelanda): Ross Ihaka y Robert Gentleman, quienes crearon un lenguaje de

programación con el objetivo de desarrollar un programa estadístico que fuese de

utilidad para el alumnado. En cuanto a sus características, R se desarrolla bajo la

licencia de GNU por el equipo central de Rfundation for Stadistical Computing y

es un software libre, que además es gratuito, esto significa que los usuarios tienen

la libertad de ejecutar, copiar, distribuir, estudiar, modificar y mejorar el software.

Por tanto, destacaremos que R es un software estadístico para el análisis de datos

considerados como uno de los más interesantes y utilizados en la investigación por

la comunidad estadística.

Dependiendo del tipo de variable, hemos utilizado una serie de estadísticos: las

variables cualitativas se resumen en tablas de frecuencias que incluyen la

frecuencia absoluta, relativa, relativa en porcentaje, absoluta acumulada y relativa

acumulada. Por otro lado, para las variables cuantitativas hemos optado por un

análisis de la media, desviación típica, moda, cuartiles, recorrido intercuartílico,

mediana y máximos y mínimos de las mismas.

5

Page 6: INFORME DE ESTADÍSTICA DESCRIPTIVA.€¦  · Web viewLa estadística se puede dividir en estadística descriptiva que ... nos encontramos con la estadística inferencial cuya función

Por último, las gráficas utilizadas son: gráfico de barras y de sectores para las

variables cualitativas y el gráfico de cajas e histograma para la representación de

las variables cuantitativas.

Análisis de las variables cualitativas.

- Tabla 1: variable cualitativa “tabaco”

TABACO Frecuencia

absoluta

Frecuencia

relativa

Frecuencia

relativa %

Frecuencia

absoluta

acumulada

Frecuencia

relativa

acumulada

A diario 50 0.173 17.30 50 0.173

Sólo los

fines de

semana

21 0.0727 7.27 71 0.2457

2 o 3 veces

a la semana

20 0.0692 6.92 91 0.3149

2 o 3 veces

al mes

17 0.0588 5.88 108 0.3737

Alguna vez

anual

55 0.1903 19.03 163 0.564

Nunca 126 0.436 43.60 289 1

Total 289 1 100

- Tabla 2: variable cualitativa “estudios padre”.

ESTUDIOS

PADRE

Frecuencia

absoluta

Frecuencia

relativa

Frecuencia

relativa %

Frecuencia

absoluta

acumulada

Frecuencia

relativa

acumulada

Ninguno o

primarios

108 0.3816 38.16 108 0.3816

Bachiller 93 0.3286 32.86 201 0.7102

Universitarios 82 0.2898 28.98 283 1

Total 283 1 100

6

Page 7: INFORME DE ESTADÍSTICA DESCRIPTIVA.€¦  · Web viewLa estadística se puede dividir en estadística descriptiva que ... nos encontramos con la estadística inferencial cuya función

En ambas tablas hemos cuantificado y recogido los datos del documento

“activosalud.RData” y plasmamos los resultados pudiendo conocer así los estudiantes

de Enfermería de primer curso de la Universidad de Sevilla, centros propios y

adscritos que fuman a diario, los fines de semana, una o dos veces a la semana, una o

dos veces al mes o si no lo hacen nunca. De igual forma, conocemos qué numero de

padres (de los estudiantes) han cursado estudios primarios, bachillerato o

universitarios o no tienen estudios.

Debemos de tener en cuenta que en ambas recogidas de datos tenemos datos perdidos

o lo que se conoce en RCommander como datos ausentes. En la variable tabaco

contamos con dos, mientras que en la variable cuantitativa estudios padre son 8 los

estudiantes que no respondieron.

Análisis de las variables cuantitativas.

- Variable: altura

Gracias al programa RCommander hemos podido conocer rápidamente los

estadísticos descriptivos univariables de cada una de las variables,

centrándonos en este caso, en la altura hablaremos de:

La media de la altura de todas las personas participantes en el estudio fue

de 1.667 metros, teniendo un máximo de 2 metros (la persona más alta,

100%) y un mínimo (0%) de 1.46. También apreciamos que la desviación

típica (sd) es de 0.08078 y el recorrido intercuartílico (IRQ) de 0.12. De

esta misma forma contamos con los cuartiles: Q1 (25%) 1,6 y el Q3 (75%)

1,72; conociendo así el Q2 (50%) que coincide con la mediana, siendo de

1.655 metros.

Los datos recogidos fueron de 290 personas, contando con un dato ausente

o perdido, una persona que no conocía su altura y por tanto, no dejó

constancia de la misma.

Todo esto puede ser corroborado por la imagen adjunta.

7

Page 8: INFORME DE ESTADÍSTICA DESCRIPTIVA.€¦  · Web viewLa estadística se puede dividir en estadística descriptiva que ... nos encontramos con la estadística inferencial cuya función

- Variable: peso

El peso medio de las personas participantes fue de 62.75 kilos, teniendo un

máximo de 130 kilos y un mínimo de 38. Vemos que la desviación típica es

de 12.65 y el recorrido intercuartílico de 14. De la misma forma apreciamos

los cuartiles Q1 (25%) de 54, Q3 (75%) 68 y Q2 (50% o mediana) 60.

Los datos cuantificados corresponden a 275 personas, contando con un

número importante de datos perdidos (16).

Todo puede ser corroborado por la imagen adjunta.

Para acabar con el análisis de las variables, procedemos a su visión gráfica. Aclararemos

que para el estudio de las variables cualitativas se utilizan el gráfico de sectores o el

diagrama de barras, lo que ocurre, es que los primeros no son útiles cuando la variable

tiene múltiples categorías, como es en nuestro caso.

- Variable tabaco: tanto al observar la tabla presentada anteriormente como

al analizar el gráfico adjunto, vemos que la mayoría de nuestra población

no ha fumado nunca, y que los valores más bajos se encuentran en la

población que lo hace 2 o 3 veces a la semana, al mes o los que lo hacen

8

Page 9: INFORME DE ESTADÍSTICA DESCRIPTIVA.€¦  · Web viewLa estadística se puede dividir en estadística descriptiva que ... nos encontramos con la estadística inferencial cuya función

solo los fines de semana. Por otra parte, los resultados de las personas que

lo hacen a diario y aquellas que lo han hecho alguna vez tienen un valor

igualatorio.

- Variable estudios padre: tanto al observar la tabla como el gráfico de

sectores adjuntos vemos que no existe una diferencia significativa entre las

tres categorías.

- Variable altura: con esta representación gráfica podemos ver como la

mayoría de nuestra muestra se agrupa entre los valores de 1,55-1,70 metros.

9

Page 10: INFORME DE ESTADÍSTICA DESCRIPTIVA.€¦  · Web viewLa estadística se puede dividir en estadística descriptiva que ... nos encontramos con la estadística inferencial cuya función

- Variable peso: al igual que con la anterior variable, podemos ver como la

mayoría de las personas participantes en la encuesta se encuentran entre los

valores de 62-63 kilos.

10

Page 11: INFORME DE ESTADÍSTICA DESCRIPTIVA.€¦  · Web viewLa estadística se puede dividir en estadística descriptiva que ... nos encontramos con la estadística inferencial cuya función

4. Resultados

Una vez realizado el análisis de las variables elegidas, veremos los resultados

obtenidos:

- Tabaco: mi primer objetivo con esta variable era conocer qué número de

participantes de nuestra muestra fumaban a diario, teniendo un resultado de

50 personas. Siguiendo con mis objetivos, el segundo era identificar

cuántos lo hacían sólo los fines de semana, obteniendo un resultado de 21

personas. Por otro lado, también me percaté de cuántas personas lo hacía 2

o 3 veces a la semana (20) y cuántas 2 o 3 veces al mes (17). Por último, en

la frecuencia de alguna vez obtuve 55, sorprendiéndome del alto número de

personas que no habían fumado nunca (126).

El total de participantes en esta variable era de 289, con una ausencia de

datos de dos personas.

Para finalizar con el estudio de esta variable, quise comprobar cuál era la

relación existente entre el consumo de tabaco y el sexo, obteniendo que es

el sexo femenino quién tiene un mayor consumo del mismo. Debemos tener

en cuenta que eso no es totalmente fiable, puesto que si analizamos la

variable sexo, nos encontramos con que la mayoría de la población es

mujer. Cabe destacar también que hay un porcentaje muy alto de mujeres

que no han fumado nunca con respecto a las que sí lo hacen y que en ambas

poblaciones (mujer y hombre) el porcentaje de personas que no fuman

supera al resto.

11

Page 12: INFORME DE ESTADÍSTICA DESCRIPTIVA.€¦  · Web viewLa estadística se puede dividir en estadística descriptiva que ... nos encontramos con la estadística inferencial cuya función

- Estudios padre: en esta variable mi objetivo principal era identificar

cuántos de los padres de los alumnos habían cursado carreras universitarias

y cuántos no tenían estudios o solo la primaria. Obteniendo como resultado

que 108 de los padres no tenían estudios o tan solo tenían la educación

primaria y que eran 82 los padres que tenían carreras universitarias. Por

otro lado, estudié cuantos de los padres tenían bachillerato, como segundo

objetivo, teniendo un número de 93.

- Altura: mi objetivo principal al hacer el estudio de esta variable era hallar

la altura media en la muestra, analizando el máximo y el mínimo de la

misma para compararlo con los parámetros normales de la población.

Obteniendo como resultado que la media de la encuesta es de 1,66 metros,

con un máximo de 2 metros y un mínimo de 1,46.

- Peso: al igual que con la anterior variable, mi objetivo era hallar la media

del peso en la muestra, el máximo y mínimo y hacer una comparación con

los parámetros establecidos, para encontrar problemas de sobrepeso,

malnutrición y otros trastornos alimentarios. Como resultado obtuve una

media de 62,75 kilos, un máximo de 130 kilos y un mínimo de 38.

5. Conclusiones

Con respecto a la variable “tabaco” sacamos en conclusión que más de la mitad de

nuestra muestra no ha fumado nunca. El parámetro estadístico alguna vez y a diario, se

encuentran con valores igualatorios, encontrándose en un rango adecuado (50-55). Por

último destacaremos que los valores más bajos se encuentran en las personas que

fuman 2 o 3 veces a la semana, 2 o 3 veces al mes o sólo los fines de semana (17-21

personas).

En cuanto a la variable “estudios padres” sacamos en conclusión como destaqué

anteriormente, que no hay demasiada diferencia entre estas tres categorías,

mencionando que el máximo se encuentra en los padres que no tienen estudios o que

solo tienen primaria, y el mínimo en aquellos que tienen grados universitarios. Hay 26

personas de diferencia entre el mínimo y el máximo lo que reafirma mi conclusión.

Tratando ahora a las variables cuantitativas: la variable “altura” tiene una media que se

adecua a la población española, de un valor de 1,66 metros, no alejándose mucho de la

máxima (2 metros) y manteniendo una distancia considerable con la mínima (persona

que mide menos: 1,46 metros). Para terminar, la variable “peso” también tiene una

12

Page 13: INFORME DE ESTADÍSTICA DESCRIPTIVA.€¦  · Web viewLa estadística se puede dividir en estadística descriptiva que ... nos encontramos con la estadística inferencial cuya función

media que se adecua a la población, de un valor de 62.75 kilos. En este caso, cabe

destacar que se distancia mucho del peso máximo, teniendo este un valor de 130 kilos

y no tanto, aunque destacable, del mínimo, con un valor de 38. Con esto hacemos

mención a la importancia de los extremos pues son éstos quien influyen en la media

haciendo que esta sea menos realista, esto lo apreciamos porque la desviación típica

tiene un valor de 12,65 (también con este valor podemos decir que los datos son muy

dispersos).

13

Page 14: INFORME DE ESTADÍSTICA DESCRIPTIVA.€¦  · Web viewLa estadística se puede dividir en estadística descriptiva que ... nos encontramos con la estadística inferencial cuya función

14