Taller Estadistica

8
La Secretaría de Salud, interesada en hacer un estudio sobre el nivel de satisfacción en el trabajo, realiza una investigación en las fábricas del barrio La Primavera en la zona industrial de una ciudad. Para ello se seleccionó una muestra de 20 de ellas y preguntó si alguno de los trabajadores había sufrido de dolor de cabeza, fatiga, o alguna afección emocional de origen laboral. a. Cual es la población objeto del estudio. Las fábricas del barrio La Primavera. b. ¿Cuál es la muestra? El nivel de satisfacción en el trabajo. c. ¿Qué tipo de estadística se desarrolla? Se desarrolla estadística inferencial d. ¿Cuál es la variable de estudio? Si alguno de los trabajadores había sufrido de dolor de cabeza, fatiga, o alguna afección emocional de origen laboral e. ¿Qué clasificación presenta esta variable? Es una variable continúa. f. Interpretación:" El 10% de los trabajadores han sufrido alguna afectación emocional “es: - Un dato - Un estadístico - Un parámetro (justifique su respuesta). Es un dato porque se aplican técnicas de tratamiento de datos, que involucran elementos probalisticos, que permiten inferir conclusiones de una muestra hacia a población 2. Las muertes por choques de automóviles son devastadoras para las familias de las víctimas y con frecuencia implican procesos legales y pagos de seguro costosos. A continuación se presentan las edades de 100 conductores que murieron en choques de automóviles, seleccionados aleatoriamente. También se incluye una distribución de frecuencias, por edades, de conductores con licencia. 37 76 18 81 28 29 18 18 27 20 18 17 70 87 45 32 88 20 18 28 17 51 24 37 24 21 18 18 17 40 25 16 45 31 74 38 16 30 17 34 34 27 87 24 45 24 44 73 18 44 16 16 73 17 16 51 24 16 31 38 86 19 52 35 18 18 69 17 28 38 69 65 57 45 23 18 56 16 20 22 77 18 73 26 58 24 21 21 29 51 17 30 16 17 36 42 18 76 53 27 Conductores con licenci a Edad (millones) 16 - 19 9 20 - 29 34

description

este taller es muy creativoooo

Transcript of Taller Estadistica

Page 1: Taller Estadistica

La Secretaría de Salud, interesada en hacer un estudio sobre el nivel de satisfacción en el trabajo, realiza una investigación en las fábricas del barrio La Primavera en la zona industrial de una ciudad. Para ello se seleccionó una muestra de 20 de ellas y preguntó si alguno de los trabajadores había sufrido de dolor de cabeza, fatiga, o alguna afección emocional de origen laboral.

a. Cual es la población objeto del estudio. Las fábricas del barrio La Primavera.

b. ¿Cuál es la muestra?El nivel de satisfacción en el trabajo.c. ¿Qué tipo de estadística se desarrolla?Se desarrolla estadística inferencial d. ¿Cuál es la variable de estudio?Si alguno de los trabajadores había sufrido de dolor de cabeza, fatiga, o alguna afección emocional de origen laboral e. ¿Qué clasificación presenta esta variable?Es una variable continúa.f. Interpretación:" El 10% de los trabajadores han sufrido alguna afectación emocional “es: - Un dato - Un estadístico - Un parámetro (justifique su respuesta).

Es un dato porque se aplican técnicas de tratamiento de datos, que involucran elementos probalisticos, que permiten inferir conclusiones de una muestra hacia a población

2. Las muertes por choques de automóviles son devastadoras para las familias de las víctimas y con frecuencia implican procesos legales y pagos de seguro costosos. A continuación se presentan las edades de 100 conductores que murieron en choques de automóviles, seleccionados aleatoriamente. También se incluye una distribución de frecuencias, por edades, de conductores con licencia.

37 76 18 81 28 29 18 18 27 20

18 17 70 87 45 32 88 20 18 28

17 51 24 37 24 21 18 18 17 40

25 16 45 31 74 38 16 30 17 34

34 27 87 24 45 24 44 73 18 44

16 16 73 17 16 51 24 16 31 38

86 19 52 35 18 18 69 17 28 38

69 65 57 45 23 18 56 16 20 22

77 18 73 26 58 24 21 21 29 51

17 30 16 17 36 42 18 76 53 27

Conductores conlicencia

Edad (millones)

16 - 19 9

20 - 29 34

30 - 39 41

40 - 49 37

50 - 59 24

60 - 69 18

70 - 79 13

80 - 89 4

Page 2: Taller Estadistica

Análisis: Convierta la distribución de frecuencias a una distribución de frecuencias relativas; después, elabore una distribución de frecuencias con las edades de los conductores que murieron en choques de automóviles. Compare las dos distribuciones de frecuencias relativas. ¿Cuáles categorías de edad parecen tener proporciones sustancialmente mayores de muertes que las proporciones de los conductores con licencia? Si usted fuese el responsable de establecer las tasas de seguros de automóviles, ¿a qué categorías de edad le asignaría las tasas más altas? Construya una gráfica que permita identificar las categorías de edad más propensas a accidentes automovilísticos fatales.

Rta:

EdadConductores con licencia (millones)

frecuencia relativa

16 - 19 9 0.05

20 - 29 34 0.18888888

30 - 39 41 0.22777777

40 - 49 37 0.20555555

50 - 59 24 0.13333333

60 - 69 18 0.1

70 - 79 13 0.07222222

80 - 89 4 0.02222222

SUMA 180 1

Edadesfrecuencia absoluta

Frecuencia relativa

16 8 0.08

17 8 0.08

18 13 0.13

19 1 0.01

20 3 0.03

21 3 0.03

22 1 0.01

23 1 0.01

24 6 0.06

25 1 0.01

Page 3: Taller Estadistica

26 1 0.01

27 3 0.03

28 3 0.03

29 2 0.02

30 2 0.02

31 2 0.02

32 1 0.01

34 2 0.02

35 1 0.01

36 1 0.01

37 2 0.02

38 3 0.03

40 1 0.01

42 1 0.01

44 2 0.02

45 4 0.04

51 3 0.03

52 1 0.01

53 1 0.01

56 1 0.01

57 1 0.01

58 1 0.01

65 1 0.01

69 2 0.02

70 1 0.01

73 3 0.03

74 1 0.01

76 2 0.02

77 1 0.01

Page 4: Taller Estadistica

81 1 0.01

86 1 0.01

87 2 0.02

88 1 0.01

SUMA 100 1

¿Cuáles categorías de edad parecen tener proporciones sustancialmente mayores de muertes que las proporciones de los conductores con licencia?

Rta: Entre 16-19 se presentan las mayores muertes, aunque tengan un numero bajo de conductores con licencia.

Si usted fuese el responsable de establecer las tasas de seguros de automóviles, ¿a qué categorías de edad le asignaría las tasas más altas?

Rta: Se le asignaría las tasas más altas a las categorías que sufran un mayor índice de accidentalidad, esta categoría sería la de edades entre 16 y 19 años.

Construya una gráfica que permita identificar las categorías de edad más propensas a accidentes automovilísticos fatales.

161718192021222324252627282930313234353637384042444551525356575865697073747677818687880

2

4

6

8

10

12

14

8 8

13

1

3 3

1 1

6

1 1

3 32 2 2

12

1 12

3

1 12

43

1 1 1 1 1 12

1

3

12

1 1 12

1

Victi mas accidentes en automovil

Edades

Frec

uenc

ia a

bsol

uta

Realizando una tabla de frecuencias para los rangos de edades, tenemos que:

EdadFrecuencia

absoluta

16 - 19 3020 - 29 2430 - 39 1440 - 49 850 - 59 860 - 69 370 - 79 880 - 89 5

Page 5: Taller Estadistica

02468

101214161820222426283032

30

24

14

8 8

3

8

5

Victimas de accidentes

16 - 1920 - 2930 - 3940 - 4950 - 5960 - 6970 - 7980 - 89

Rangos de edades

Frec

uenc

ia a

bsol

uta

3. Utilice los datos de las edades de los conductores que murieron en accidentes automovilísticos y las edades de los conductores con licencia y para cada grupo encuentre la media, la mediana, la moda el cuartil uno, el cuartil tres e interprete los resultados. ¿Los datos de los dos grupos parecen ser diferentes? .

• Media aritmética (centro de gravedad de los datos)

(1)

EdadFrecuencia

absolutaMarca de

clase fi*XiFrecuencia Relativa

16 - 19 30 17.5 525 30

20 - 29 24 24.5 588 54

30 - 39 14 34.5 483 68

40 - 49 8 44.5 356 76

50 - 59 8 54.5 436 84

60 - 69 3 64.5 193.5 87

70 - 79 8 74.5 596 95

80 - 89 5 84.5 422.5 100

SUMATORIAS 100 399 3600

Reemplazando en la formula tenemos que x=3600100

=36

Page 6: Taller Estadistica

(2)

Edad

Conductores con

licencia (millones)

Marca de clase

fi*XiFrecuencia

relativa

16 - 19 9.2 17.5 161 9.220 - 29 33.6 24.5 823.2 42.830 - 39 40.8 34.5 1407.6 83.640 - 49 37 44.5 1646.5 120.650 - 59 24.2 54.5 1318.9 144.860 - 69 17.5 64.5 1128.75 162.370 - 79 12.7 74.5 946.15 17580 - 89 4.3 84.5 363.35 179.3

SUMATORIA 179.3 399 7795.45

Reemplazando en la formula tenemos que x=7795.45179.3

=43,47

• Moda (valor de la variable con mayor frecuencia)

(1) MO=16+ 30−0(30−0 )+(30−24)

=16,83

(2) MO=30+ 40,8−33,6(40,8−33,6 )+(40,8−37)

=30,65

• Mediana (valor central en el 50%)

(1) ME=20+ 50−3024

∗9=27,5 , clase modal ( 20-29)

(2) ME=40+ 89,65−83,637

∗9=41,47, Clase modal (40-49)

Cuartil 1 y 3

Page 7: Taller Estadistica

(1) Q 1=16+25−030

∗3=18,5

(1 )Q3=40+ 75−688

∗9=47,875

(2) Q 1=30+44.825−42,8

40,8∗9=30,446

(2 )Q3=50+ 134,475−120,624,2

∗9=55,16

Efectivamente se puede ver que la variable con mayor frecuencia en los datos de la tabla (1) corresponde a un valor de 16,83 que está dentro del rango de edades donde ocurre mayor accidentalidad. El histograma que vemos en el cuadro de resultados, comparado con la curva normal, nos muestra una distribución asimétrica con una cola derecha larga. Es decir, un sesgo o skewness positivo, lo que nos indica que los elementos están concentrado, preferentemente, en la zona de valores bajos, tal como nos indicaba la Asimetría.

Para conocer la variabilidad de la mitad central de los datos, podemos encontrar el rango entre cuartiles, que para la tabla (1) corresponde a 28,375 y para (2) corresponde a 24,714. La mediana en general va acompañada del rango como medida de dispersión. Pero cuando observamos valores extraños (extremos) el rango se ve muy afectado, por lo que es mejor usar el rango entre cuartiles.

Los datos entre las dos tablas y sus resultados son diferentes ya que el estudio de ambas es diferente, una analiza la cantidad de personas accidentadas de una muestra de 100 personas (con diferentes rangos de edad) y la otra, la cantidad de licencias de conducción en diferentes rangos de edad, sin embargo se podrían inferir diferentes análisis de estas, como la relación entre el número de accidentes con la cantidad de licencias (por rango de edades).