Taller Estadistica
-
Upload
javier-andres-bravo-morales -
Category
Documents
-
view
6 -
download
0
description
Transcript of Taller Estadistica
La Secretaría de Salud, interesada en hacer un estudio sobre el nivel de satisfacción en el trabajo, realiza una investigación en las fábricas del barrio La Primavera en la zona industrial de una ciudad. Para ello se seleccionó una muestra de 20 de ellas y preguntó si alguno de los trabajadores había sufrido de dolor de cabeza, fatiga, o alguna afección emocional de origen laboral.
a. Cual es la población objeto del estudio. Las fábricas del barrio La Primavera.
b. ¿Cuál es la muestra?El nivel de satisfacción en el trabajo.c. ¿Qué tipo de estadística se desarrolla?Se desarrolla estadística inferencial d. ¿Cuál es la variable de estudio?Si alguno de los trabajadores había sufrido de dolor de cabeza, fatiga, o alguna afección emocional de origen laboral e. ¿Qué clasificación presenta esta variable?Es una variable continúa.f. Interpretación:" El 10% de los trabajadores han sufrido alguna afectación emocional “es: - Un dato - Un estadístico - Un parámetro (justifique su respuesta).
Es un dato porque se aplican técnicas de tratamiento de datos, que involucran elementos probalisticos, que permiten inferir conclusiones de una muestra hacia a población
2. Las muertes por choques de automóviles son devastadoras para las familias de las víctimas y con frecuencia implican procesos legales y pagos de seguro costosos. A continuación se presentan las edades de 100 conductores que murieron en choques de automóviles, seleccionados aleatoriamente. También se incluye una distribución de frecuencias, por edades, de conductores con licencia.
37 76 18 81 28 29 18 18 27 20
18 17 70 87 45 32 88 20 18 28
17 51 24 37 24 21 18 18 17 40
25 16 45 31 74 38 16 30 17 34
34 27 87 24 45 24 44 73 18 44
16 16 73 17 16 51 24 16 31 38
86 19 52 35 18 18 69 17 28 38
69 65 57 45 23 18 56 16 20 22
77 18 73 26 58 24 21 21 29 51
17 30 16 17 36 42 18 76 53 27
Conductores conlicencia
Edad (millones)
16 - 19 9
20 - 29 34
30 - 39 41
40 - 49 37
50 - 59 24
60 - 69 18
70 - 79 13
80 - 89 4
Análisis: Convierta la distribución de frecuencias a una distribución de frecuencias relativas; después, elabore una distribución de frecuencias con las edades de los conductores que murieron en choques de automóviles. Compare las dos distribuciones de frecuencias relativas. ¿Cuáles categorías de edad parecen tener proporciones sustancialmente mayores de muertes que las proporciones de los conductores con licencia? Si usted fuese el responsable de establecer las tasas de seguros de automóviles, ¿a qué categorías de edad le asignaría las tasas más altas? Construya una gráfica que permita identificar las categorías de edad más propensas a accidentes automovilísticos fatales.
Rta:
EdadConductores con licencia (millones)
frecuencia relativa
16 - 19 9 0.05
20 - 29 34 0.18888888
30 - 39 41 0.22777777
40 - 49 37 0.20555555
50 - 59 24 0.13333333
60 - 69 18 0.1
70 - 79 13 0.07222222
80 - 89 4 0.02222222
SUMA 180 1
Edadesfrecuencia absoluta
Frecuencia relativa
16 8 0.08
17 8 0.08
18 13 0.13
19 1 0.01
20 3 0.03
21 3 0.03
22 1 0.01
23 1 0.01
24 6 0.06
25 1 0.01
26 1 0.01
27 3 0.03
28 3 0.03
29 2 0.02
30 2 0.02
31 2 0.02
32 1 0.01
34 2 0.02
35 1 0.01
36 1 0.01
37 2 0.02
38 3 0.03
40 1 0.01
42 1 0.01
44 2 0.02
45 4 0.04
51 3 0.03
52 1 0.01
53 1 0.01
56 1 0.01
57 1 0.01
58 1 0.01
65 1 0.01
69 2 0.02
70 1 0.01
73 3 0.03
74 1 0.01
76 2 0.02
77 1 0.01
81 1 0.01
86 1 0.01
87 2 0.02
88 1 0.01
SUMA 100 1
¿Cuáles categorías de edad parecen tener proporciones sustancialmente mayores de muertes que las proporciones de los conductores con licencia?
Rta: Entre 16-19 se presentan las mayores muertes, aunque tengan un numero bajo de conductores con licencia.
Si usted fuese el responsable de establecer las tasas de seguros de automóviles, ¿a qué categorías de edad le asignaría las tasas más altas?
Rta: Se le asignaría las tasas más altas a las categorías que sufran un mayor índice de accidentalidad, esta categoría sería la de edades entre 16 y 19 años.
Construya una gráfica que permita identificar las categorías de edad más propensas a accidentes automovilísticos fatales.
161718192021222324252627282930313234353637384042444551525356575865697073747677818687880
2
4
6
8
10
12
14
8 8
13
1
3 3
1 1
6
1 1
3 32 2 2
12
1 12
3
1 12
43
1 1 1 1 1 12
1
3
12
1 1 12
1
Victi mas accidentes en automovil
Edades
Frec
uenc
ia a
bsol
uta
Realizando una tabla de frecuencias para los rangos de edades, tenemos que:
EdadFrecuencia
absoluta
16 - 19 3020 - 29 2430 - 39 1440 - 49 850 - 59 860 - 69 370 - 79 880 - 89 5
02468
101214161820222426283032
30
24
14
8 8
3
8
5
Victimas de accidentes
16 - 1920 - 2930 - 3940 - 4950 - 5960 - 6970 - 7980 - 89
Rangos de edades
Frec
uenc
ia a
bsol
uta
3. Utilice los datos de las edades de los conductores que murieron en accidentes automovilísticos y las edades de los conductores con licencia y para cada grupo encuentre la media, la mediana, la moda el cuartil uno, el cuartil tres e interprete los resultados. ¿Los datos de los dos grupos parecen ser diferentes? .
• Media aritmética (centro de gravedad de los datos)
(1)
EdadFrecuencia
absolutaMarca de
clase fi*XiFrecuencia Relativa
16 - 19 30 17.5 525 30
20 - 29 24 24.5 588 54
30 - 39 14 34.5 483 68
40 - 49 8 44.5 356 76
50 - 59 8 54.5 436 84
60 - 69 3 64.5 193.5 87
70 - 79 8 74.5 596 95
80 - 89 5 84.5 422.5 100
SUMATORIAS 100 399 3600
Reemplazando en la formula tenemos que x=3600100
=36
(2)
Edad
Conductores con
licencia (millones)
Marca de clase
fi*XiFrecuencia
relativa
16 - 19 9.2 17.5 161 9.220 - 29 33.6 24.5 823.2 42.830 - 39 40.8 34.5 1407.6 83.640 - 49 37 44.5 1646.5 120.650 - 59 24.2 54.5 1318.9 144.860 - 69 17.5 64.5 1128.75 162.370 - 79 12.7 74.5 946.15 17580 - 89 4.3 84.5 363.35 179.3
SUMATORIA 179.3 399 7795.45
Reemplazando en la formula tenemos que x=7795.45179.3
=43,47
• Moda (valor de la variable con mayor frecuencia)
(1) MO=16+ 30−0(30−0 )+(30−24)
=16,83
(2) MO=30+ 40,8−33,6(40,8−33,6 )+(40,8−37)
=30,65
• Mediana (valor central en el 50%)
(1) ME=20+ 50−3024
∗9=27,5 , clase modal ( 20-29)
(2) ME=40+ 89,65−83,637
∗9=41,47, Clase modal (40-49)
Cuartil 1 y 3
(1) Q 1=16+25−030
∗3=18,5
(1 )Q3=40+ 75−688
∗9=47,875
(2) Q 1=30+44.825−42,8
40,8∗9=30,446
(2 )Q3=50+ 134,475−120,624,2
∗9=55,16
Efectivamente se puede ver que la variable con mayor frecuencia en los datos de la tabla (1) corresponde a un valor de 16,83 que está dentro del rango de edades donde ocurre mayor accidentalidad. El histograma que vemos en el cuadro de resultados, comparado con la curva normal, nos muestra una distribución asimétrica con una cola derecha larga. Es decir, un sesgo o skewness positivo, lo que nos indica que los elementos están concentrado, preferentemente, en la zona de valores bajos, tal como nos indicaba la Asimetría.
Para conocer la variabilidad de la mitad central de los datos, podemos encontrar el rango entre cuartiles, que para la tabla (1) corresponde a 28,375 y para (2) corresponde a 24,714. La mediana en general va acompañada del rango como medida de dispersión. Pero cuando observamos valores extraños (extremos) el rango se ve muy afectado, por lo que es mejor usar el rango entre cuartiles.
Los datos entre las dos tablas y sus resultados son diferentes ya que el estudio de ambas es diferente, una analiza la cantidad de personas accidentadas de una muestra de 100 personas (con diferentes rangos de edad) y la otra, la cantidad de licencias de conducción en diferentes rangos de edad, sin embargo se podrían inferir diferentes análisis de estas, como la relación entre el número de accidentes con la cantidad de licencias (por rango de edades).