T2 100105 453

27
Universidad Nacional Abierta y a Distancia – UNAD - Vicerrectoría Académica y de Investigación - VIACI Escuela: ECAPMA Programa: Ingeniería Ambiental Curso: Estadística Descriptiva Código: 100105 PASO 3 ESTADISTICA DESCRIPTIVA PROBLEMÁTICA: “Principales Causas que incrementan e (inciden) en el número de accidentes de tránsito, ocurridos en el territorio nacional”. Presentado por: CLAUDIA PATRICIA NOSSA FIGUEROA COD: 1.057.590.304 SHAROON RODRIGUEZ GONZALEZ COD: 1.057.590.862 MAYRA ALEJANDRA CRISTANCHO COD: 1.057.578.065 GRUPO: 100105_453 PRESENTADO A: Tutor: JESUS ANTONIO PEÑA RUEDA

Transcript of T2 100105 453

Page 1: T2 100105 453

Universidad Nacional Abierta y a Distancia – UNAD - Vicerrectoría Académica y de Investigación - VIACI Escuela: ECAPMA Programa: Ingeniería Ambiental Curso: Estadística Descriptiva Código: 100105

PASO 3ESTADISTICA DESCRIPTIVA

PROBLEMÁTICA:“Principales Causas que incrementan e   (inciden)   en el número de accidentes de

tránsito, ocurridos en el territorio nacional”.

Presentado por:

CLAUDIA PATRICIA NOSSA FIGUEROA COD: 1.057.590.304

SHAROON RODRIGUEZ GONZALEZ COD: 1.057.590.862

MAYRA ALEJANDRA CRISTANCHO COD: 1.057.578.065

GRUPO: 100105_453

PRESENTADO A:Tutor: JESUS ANTONIO PEÑA RUEDA

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA “UNAD”INGENIERIA AMBIENTALSOGAMOSO- BOYACÁNOVIEMBRE DE 2016

Page 2: T2 100105 453

Universidad Nacional Abierta y a Distancia – UNAD - Vicerrectoría Académica y de Investigación - VIACI Escuela: ECAPMA Programa: Ingeniería Ambiental Curso: Estadística Descriptiva Código: 100105

INTRODUCCION

En el campo laboral día a día se presentan muchos tipos de información la cual se debe organizar para una mayor comprensión de la misma, una manera de poder organizarla es por medio de la estadística. en este trabajo vamos a encontrar el desarrollo de unos ejercicios en los cuales observaremos las diferentes maneras de agrupar la información obtenida mediante encuestas, estudios, investigaciones aplicando la estadística descriptiva con el fin de mostrar las conclusiones graficas de los datos obtenidos. Mediante algunos ejercicios que se pueden observar en la vida cotidiana obtenemos la muestra o datos que necesitamos para realizar la representación de la información mediante los modelos de agrupación como la muestra, las variables los diagramas estadísticos (histogramas, diagramas circulares).

El presente trabajo de estadística descriptiva reúne un estudio descriptivo a la recopilación, organización y representación de los datos estadísticos en la que se tomó como muestra a la Población de hombres y mujeres con edades entre los 17 y los 60 años implicados en accidentes de tránsito en el año 2015, en la ciudad de Medellín. Con el fin de obtener los resultados de algunos procedimientos tales como manejo de variables estadísticas, histogramas tablas de distribución de frecuencias etc. las medidas matemáticas y no matemáticas de tendencia central, las medidas de dispersión absoluta y relativa con el fin de sintetizar la información, finalmente se hace un breve estudio sobre la regresión y correlación, los cuales nos ayudan a hacer predicciones en eventos futuros con base en los datos actuales.

En este documento, se refleja la utilidad en la aplicación de las medidas univariantes de tendencia central y de dispersión alrededor de la problemática estudiada: Principales Factores que Influyen en el rendimiento académico de estudiantes de educación básica primaria, en instituciones educativas de Jamundí. Las variables de tipo variantes y univariantes, nos ayudan a determinar el tipo de asociación de las variables. Cuando una magnitud aumenta y la otra aumenta o cuando una magnitud disminuye y la otra también disminuye, decimos que se trata de una variable Directa. De otro lado, cuando una magnitud aumenta y la otra disminuye, se trata de una variable Inversa.

Teniendo en cuenta que a lo largo del documento se realizará un análisis con respecto a la productividad académica, se tratarán únicamente variables cuantitativas, entre las que se encuentran, variables continuas y discretas. En las variables continuas trabajamos datos agrupados, ya que entre cada dato entero hay muchos números decimales. Por el contrario las variables discretas sólo pueden tomar valores enteros.Para sacar conclusiones precisas acerca de la problemática planteada, hacemos uso de las tablas de frecuencia, las cuales son herramientas de estadística donde se recopilan datos y valores para representar la frecuencia (las veces en que ocurren) y la muestra como tal.

Page 3: T2 100105 453

Universidad Nacional Abierta y a Distancia – UNAD - Vicerrectoría Académica y de Investigación - VIACI Escuela: ECAPMA Programa: Ingeniería Ambiental Curso: Estadística Descriptiva Código: 100105

JUSTIFICACIÓN

La Estadística es una disciplina que se aplica en todos los campos de la actividad del ser humano. Es muy frecuente encontrarse en las diferentes áreas del conocimiento con incertidumbres como el pronosticar el crecimiento poblacional de un país, el crecimiento económico de una empresa o el crecimiento de producción y venta de un producto específico, el conocer la efectividad de diferentes abonos en el campo agrario, el determinar la tendencia de contaminación del agua o el aire, la clasificación de personal en una empresa para efectos de una buena y sana política laboral, etc. El acelerado desarrollo de Métodos, Técnicas y Tecnologías para el óptimo análisis de datos justifica que un profesional disponga de una sólida fundamentación conceptual para que realice apropiadamente su evaluación y aporte sustentaciones a su decisión.

Page 4: T2 100105 453

Universidad Nacional Abierta y a Distancia – UNAD - Vicerrectoría Académica y de Investigación - VIACI Escuela: ECAPMA Programa: Ingeniería Ambiental Curso: Estadística Descriptiva Código: 100105

OBJETIVOS

1.OBJETIVO GENERAL:

Describir y proponer alternativas de solución para la problemática estudiada, a partir del análisis de las técnicas estadísticas descriptivas realizadas, durante el periodo académico y los momentos de trabajo colaborativo , practico y cooperativo, en pro de una aprendizaje significativo, para lograr habilidades y destrezas fundamentadas en técnicas y elementos de la estadística descriptiva, que nos permita analizar una problemática y proponer alternativas de soluciones desde diferentes disciplinas.

1.1 OBJETIVOS ESPECÍFICOS:

Analizar los tipos de conceptos básicos de la estadística en especial la descriptiva, el reconocimiento y aplicación en los casos prácticos, para adquirir habilidades propias del estudio estadístico para su aplicación y proyección en eventos futuros o pasados.

Describir estadísticamente la información recopilada para esta investigación analizando las gráficas creadas en el documento e identificar las características estadísticas aprendidas.

Buscar alternativas o soluciones a la propuesta planteada inicialmente generando una propuesta de valor como solución al problema planteado

Validar el número de entidades prestadoras de servicio que se encuentran adscritas al hospital y la cantidad de pacientes que son atendidos en el centro.

Page 5: T2 100105 453

Universidad Nacional Abierta y a Distancia – UNAD - Vicerrectoría Académica y de Investigación - VIACI Escuela: ECAPMA Programa: Ingeniería Ambiental Curso: Estadística Descriptiva Código: 100105Calcular e interpretar adecuadamente las medidas estadísticas univariantes y asociar sus resultados con posibles alternativas de solución al problema.

Determinar la relación entre dos o más variables inscritas en una situación específica a partir del análisis de regresión lineal simple.

Interpretar y manejar los conceptos de regresión y correlación.

Dibujar y aplicar gráficos de dispersión

CÁLCULO E INTERPRETACIÓN DE LAS MEDIDAS UNIVARIANTES DE TENDENCIA CENTRAL Y DE DISPERSIÓN PARA LA VARIABLE DISCRETA.

VARIABLES DISCRETASEdad Costo estimado del siniestroVelocidad

VARIABLE CUANTITATIVA DISCRETA(EDAD DEL ACCIDENTADO)

En la siguiente tabla aparecen las edades de 110 personas de 17 a 60 años:

29 46 19 31 31 29 42 38 34 22 3838 29 21 50 33 17 46 18 46 18 5252 17 42 30 23 22 36 54 55 54 4646 22 46 48 56 54 35 33 19 33 2121 55 36 53 18 17 56 52 21 52 1818 60 35 35 54 21 22 38 42 38 5454 33 43 46 33 46 23 46 46 46 6033 32 32 45 52 55 45 29 36 29 3352 46 24 32 38 19 43 17 35 17 3238 55 44 45 46 21 34 22 55 22 46

Page 6: T2 100105 453

Universidad Nacional Abierta y a Distancia – UNAD - Vicerrectoría Académica y de Investigación - VIACI Escuela: ECAPMA Programa: Ingeniería Ambiental Curso: Estadística Descriptiva Código: 100105

Es evidente que cada edad tiene una frecuencia de ocurrencia (cantidad en que se repite el dato) y que analizaremos la variable edad como cuantitativa discreta mediante una tabla de frecuencias para datos no agrupados.

Posición x1 f1 x1*f1

x1*x1*f1

1 17 5 85 4252 18 5 90 4503 19 3 57 1714 21 6 126 7565 22 6 132 7926 23 2 46 927 24 1 24 248 29 5 145 7259 30 1 30 3010 31 2 62 12411 32 4 128 51212 33 7 231 161713 34 2 68 13614 35 4 140 56015 36 3 108 32416 38 7 266 186217 42 3 126 37818 43 2 86 17219 44 1 44 4420 45 3 135 40521 46 14 644 901622 48 1 48 4823 50 1 50 5024 52 6 312 187225 53 1 53 5326 54 6 324 194427 55 5 275 137528 56 2 112 22429 60 2 120 240SUMATORIA 110 4067 24421

Page 7: T2 100105 453

Universidad Nacional Abierta y a Distancia – UNAD - Vicerrectoría Académica y de Investigación - VIACI Escuela: ECAPMA Programa: Ingeniería Ambiental Curso: Estadística Descriptiva Código: 100105

MEDIDAS DE TENDENCIA CENTRAL PARA DATOS NO AGRUPADOS

MEDIA:

x=1n∑i=1

m

( f i . x i )

Número de datos: n=110

Sumatoria de los productos parciales: ∑i=1

m

( f i . x i )=4067

x=1n∑i=1

m

( f i∗xi )=1110

( 4067 )=37,12años

Análisis: Se estima una edad promedio de 37,12 años para cada uno de los 110 accidentados en Medellín.

MEDIANA:

Me=xcentral

Inicialmente organizamos los datos en forma ascendente. Cuando el número de datos es par la moda es el dato central de los datos ordenados, cuando el número de datos es impar se toman los dos datos centrales y la mediana es el promedio de estos dos datos. En este caso son 110 datos cuyo elemento central es:

x55=36años

MODA:

Mo=X f max

La moda hace referencia al dato que más se repite o que posee mayor frecuencia, pueden existir arreglos multimodales, en este caso la mayor frecuencia es 14 que corresponde a la edad de 46 años.Mo=46 años

Análisis: Se estima que los accidentados que se presentan con mayor frecuencia tienen una edad de 46años.

CUARTILES:

Qi=x( i4n)

Los tres cuartiles separan el total de los datos en 4 grupos del 25% cada uno.

Page 8: T2 100105 453

Universidad Nacional Abierta y a Distancia – UNAD - Vicerrectoría Académica y de Investigación - VIACI Escuela: ECAPMA Programa: Ingeniería Ambiental Curso: Estadística Descriptiva Código: 100105El cuartil es el valor que se encuentra en cada partición, si el número de datos es impar el cuartil 2 es el dato central, en caso de que el total de datos sea par entonces el cuartil 2 se obtiene al promediar los 2 datos centrales y de igual manera se procede con los límites de los cuartiles 1 y 3. Como el número de datos es 110 entonces el primer cuartil es el promedio de los datos 27 y 28, el segundo cuartil promedio de los datos 55 y 56, tercer cuartil promedio de los datos 82 y 83:

Cuartil 1: x27=23años x28=24años

Q1=23años+24años

2=23,5años

El 25% de los accidentados son menores de 23,5 años

Cuartil 2: x55=36años x56=36años

Q2=36años+36años

2=36 años

El 50% de los accidentados son menores de 36 años

Cuartil 3: x82=46 años x83=46 años

Q3=46 años+46años

2=46años

El 75% de los accidentados son menores de 46 años

DECILES:

Di=x( i10n)

Los diez deciles separan el total de los datos en 10 grupos del 10% cada uno.

El decil es el valor que se encuentra en cada partición, si el número de datos es impar el decil es el dato central, en caso de que el total de datos sea par entonces el decil se obtiene al promediar los 2 datos centrales.

Para calcular el número de dato para cada decil se aplica

Di=i10n decil 5: D5=

510110=55 decil 7: D7=

710110=77

Como el número de datos es 110 entonces el decil 5 es el promedio de los datos 55 y 56, el decil 7 es el promedio de los datos 77 y 78:

Decil 5: x55=38años x56=38años

Page 9: T2 100105 453

Universidad Nacional Abierta y a Distancia – UNAD - Vicerrectoría Académica y de Investigación - VIACI Escuela: ECAPMA Programa: Ingeniería Ambiental Curso: Estadística Descriptiva Código: 100105

D5=38años+38años

2=38años

El 50% de los accidentados son menores de 38 años

Decil 7: x77=46 años x78=46 años

D7=46años+46años

2=46años

El 70% de los accidentados son menores de 46 años

PERCENTILES:

Di=x( i100

n)

Los cien percentiles separan el total de los datos en 100 grupos del 1% cada uno.

El percentil es el valor que se encuentra en cada partición, si el número de datos es impar el percentil es el dato central, en caso de que el total de datos sea par entonces el percentil se obtiene al promediar los 2 datos centrales.

Para calcular el número de dato para cada percentil se aplica

Pi=i100

n percentil 30: P30=30100

110=33 percentil 50: P50=50100

110=55

Como el número de datos es 110 entonces el percentil 30 es el promedio de los datos 33 y 34, el percentil 50 es el promedio de los datos 55 y 56:

Percentil 30: x33=29años x34=30años

P30=29años+30años

2=29,5años

Percentil 50: x55=36años x56=36años

P50=36años+36años

2=36 años

MEDIDAS UNIVARIANTES DE DISPERSIÓN

RANGO:

R=Xmax−Xmin

Es la diferencia entre el dato mayor y el dato menor, indica que tanto pueden variar las magnitudes de los datos.

Page 10: T2 100105 453

Universidad Nacional Abierta y a Distancia – UNAD - Vicerrectoría Académica y de Investigación - VIACI Escuela: ECAPMA Programa: Ingeniería Ambiental Curso: Estadística Descriptiva Código: 100105En este caso X max=60años X min=17 años

R=60años−17años=43años

La máxima variación de los datos es de 43 años, las edades se encuentran en el intervalo de edades de 17 a 60 años.

VARIANZA:

s2=( 1n∑i=1m

X i2)− x2

s2=( 1110 24421)−(37,12 )2=147.77

La variación cuadrática de las edades respecto a la edad promedio es de 147,77

DESVIACIÓN TÍPICA O ESTÁNDAR:

s=√s2La desviación típica es la variación de los datos respecto al valor promedio.

s=√147,77=12,16añosLa variación de las edades de los accidentados respecto a la edad promedio es de 12,16 años.

COEFICIENTE DE VARIACIÓN:

c . v= sx∗100%

Medida de variabilidad relativa de una serie de datos.

c . v=12,16años37,12años

∗100%=32,76%

Como el coeficiente de variación es alto, indica que la variabilidad de las edades de los accidentados es alta y que la edad promedio no es la mejor representación de las edades de los 110 accidentes registrados.

REPRESENTACION GRAFICA PARA DATOS NO AGRUPADOS

Page 11: T2 100105 453

Universidad Nacional Abierta y a Distancia – UNAD - Vicerrectoría Académica y de Investigación - VIACI Escuela: ECAPMA Programa: Ingeniería Ambiental Curso: Estadística Descriptiva Código: 100105

CÁLCULO E INTERPRETACIÓN DE LAS MEDIDAS UNIVARIANTES DE TENDENCIA CENTRAL Y DE DISPERSIÓN PARA LA VARIABLE CONTINÚA.

VARIABLE CUANTITATIVA CONTINUA(GRADOS DE ALCOHOL DEL CONDUCTOR)(VELOCIDAD)

TABLA DE FRECUENCIAS PARA DATOS AGRUPADOSHISTOGRAMA DE FRECUENCIAS

POLIGONO DE FRECUENCIAS

POSICION

VELOCIDAD

FRECUENCIA x1*f1 x1*x1*f1

Page 12: T2 100105 453

Universidad Nacional Abierta y a Distancia – UNAD - Vicerrectoría Académica y de Investigación - VIACI Escuela: ECAPMA Programa: Ingeniería Ambiental Curso: Estadística Descriptiva Código: 100105

1 33 1 33 332 38 1 38 383 40 2 80 1604 45 2 90 1805 48 1 48 486 50 4 200 8007 51 1 51 518 55 6 330 19809 60 3 180 54010 62 1 62 6211 63 1 63 6312 65 2 130 26013 66 5 330 165014 67 3 201 60315 68 5 340 170016 69 7 483 338117 70 8 560 448018 71 2 142 28419 72 2 144 28820 73 3 219 65721 74 3 222 66622 75 4 300 120023 76 1 76 7624 77 4 308 123225 78 3 234 70226 79 3 237 71127 80 7 560 392028 81 3 243 72929 83 6 498 298830 85 1 85 8531 86 1 86 8632 88 5 440 220033 95 2 190 38034 100 1 100 10035 105 1 105 10536 108 1 108 10837 111 1 111 11138 138 2 276 55239 150 1 150 150

110 8053 33359

Page 13: T2 100105 453

Universidad Nacional Abierta y a Distancia – UNAD - Vicerrectoría Académica y de Investigación - VIACI Escuela: ECAPMA Programa: Ingeniería Ambiental Curso: Estadística Descriptiva Código: 100105Paso 1. Medidas de dispersión.

Variable Discreta Seleccionada: NUMERO DE MUERTOS

Son 110 resultados que van desde el (1 ) a (12)

1 2 2 3 4 5 7 91 2 2 3 4 5 7 91 2 2 3 4 6 8 101 2 3 3 4 6 8 91 2 3 3 4 6 8 112 2 3 3 4 6 8 111 2 3 3 4 7 9 112 2 3 3 5 7 9 122 2 3 3 5 7 8 122 2 3 3 5 7 8 122 2 3 3 5 7 8 122 2 3 4 5 7 82 2 3 4 5 7 101 2 3 4 5 7 9

Resultados y análisis estadísticos:

1. Tabla de frecuencias: Ñ= 110x1 f1 x1*f1 x1*x1*f11 7 7 492 24 48 11523 22 66 14524 10 40 4005 9 45 4056 4 24 967 10 70 7008 8 64 5129 6 54 32410 2 20 4011 3 33 9912 5 60 300SUMA 110 531 5529

Page 14: T2 100105 453

Universidad Nacional Abierta y a Distancia – UNAD - Vicerrectoría Académica y de Investigación - VIACI Escuela: ECAPMA Programa: Ingeniería Ambiental Curso: Estadística Descriptiva Código: 100105

Formula a aplicar Resultado

Media o promedio aritmético

x=4.8

Varianza∂2=∑

i=1

n X1. F1N

∂2=4.8

Desviación estándar o típica

∂=√∂2∂=23.0

Coeficiente de variación

C.V = 14,02%

Variable continúa edad

TABLA DE FRECUENCIAS

intervalos de clase marca de clase

fi F1 H1 %

x= 1110

(531)=4.8

∂2=531110

=4.8

∂=√531=32.0

C.V.¿1,20743538,61

x110=14,024

Page 15: T2 100105 453

Universidad Nacional Abierta y a Distancia – UNAD - Vicerrectoría Académica y de Investigación - VIACI Escuela: ECAPMA Programa: Ingeniería Ambiental Curso: Estadística Descriptiva Código: 100105

límite inferior

límite superior

16 21 26,5 19 19 0,16 15,622 27 35,5 26 45 0,21 21,328 33 44,5 35 80 0,29 28,734 39 53,5 42 122 0,34 34,4

SUMA 122 1,00 100HISTOGRAMA

POLIGONO DE FRECUENCIAS

Page 16: T2 100105 453

Universidad Nacional Abierta y a Distancia – UNAD - Vicerrectoría Académica y de Investigación - VIACI Escuela: ECAPMA Programa: Ingeniería Ambiental Curso: Estadística Descriptiva Código: 100105

MEDIDAS DE TENDENCIA CENTRAL PARA DATOS AGRUPADOS

MEDIA:

x=1n∑i=1

m

( f i . x i )

Número de datos: n=110

Sumatoria de los productos parciales: ∑i=1

m

( f i . x i )=8053

x=1n∑i=1

m

( f i∗xi )=1110

(8053 )=73,21Velocidad

Análisis: Se estima una velocidad promedio de 73,21 km para cada uno de los 110 accidentados en Medellín.

3.1.2 MEDIANA:

Me=xcentral

Inicialmente organizamos los datos en forma ascendente. Cuando el número de datos es impar la moda es el dato central de los datos ordenados, cuando el número de datos es impar se toman los dos datos centrales y la mediana es el promedio de estos dos datos. En este caso son 110 datos cuyos elementos centrales son:

x55=71km

3.1.3 MODA:

Mo=X f max

La moda hace referencia al dato que más se repite o que posee mayor frecuencia, pueden existir arreglos multimodales, en este caso la mayor frecuencia es 8 que corresponde a la velocidad de 70 KM.Mo=70km

Análisis: Se estima que los accidentados que se presentan con mayor frecuencia tienen una velocidad de 70 km.

CUARTILES:

Qi=x( i4n)

Los tres cuartiles separan el total de los datos en 4 grupos del 25% cada uno.

Page 17: T2 100105 453

Universidad Nacional Abierta y a Distancia – UNAD - Vicerrectoría Académica y de Investigación - VIACI Escuela: ECAPMA Programa: Ingeniería Ambiental Curso: Estadística Descriptiva Código: 100105El cuartil es el valor que se encuentra en cada partición, si el número de datos es impar el cuartil 2 es el dato central, en caso de que el total de datos sea par entonces el cuartil 2 se obtiene al promediar los 2 datos centrales y de igual manera se procede con los límites de los cuartiles 1 y 3. Como el número de datos es 110 entonces el primer cuartil es el promedio de los datos 27 y 28, el segundo cuartil promedio de los datos 55 y 56, tercer cuartil promedio de los datos 82 y 83:

Cuartil 1: x27=66km x28=66km

Q1=66km+66km

2=66km

El 25% de los accidentados iban a menos de 66 km.

Cuartil 2: x55=71km x56=72km

Q2=71km+72km

2=71,5 km

El 50% de los accidentados iban a menos de 71,5 km.

Cuartil 3: x82=80km x83=80km

Q3=80km+80km

2=80km

El 75% de los accidentados iban a menos de 80 km.

DECILES:

Di=x( i10n)

Los diez deciles separan el total de los datos en 10 grupos del 10% cada uno.

El decil es el valor que se encuentra en cada partición, si el número de datos es impar el decil es el dato central, en caso de que el total de datos sea par entonces el decil se obtiene al promediar los 2 datos centrales.

Para calcular el número de dato para cada decil se aplica

Di=i10n decil 5: D5=

510110=55 decil 7: D7=

710110=77

Como el número de datos es 110 entonces el decil 5 es el promedio de los datos 55 y 56, el decil 7 es el promedio de los datos 77 y 78:

Decil 5: x55=71km x56=72km

Page 18: T2 100105 453

Universidad Nacional Abierta y a Distancia – UNAD - Vicerrectoría Académica y de Investigación - VIACI Escuela: ECAPMA Programa: Ingeniería Ambiental Curso: Estadística Descriptiva Código: 100105

D5=71km+72km

2=71,5km

El 50% de los accidentados iban a 71,5 km.

Decil 7: x77=79 km x78=79km

D7=79km+79km

2=79km

El 70% de los accidentados iban a 79 km.

PERCENTILES:

Di=x( i100

n)

Los cien percentiles separan el total de los datos en 100 grupos del 1% cada uno.

El percentil es el valor que se encuentra en cada partición, si el número de datos es impar el percentil es el dato central, en caso de que el total de datos sea par entonces el percentil se obtiene al promediar los 2 datos centrales.

Para calcular el número de dato para cada percentil se aplica

Pi=i100

n percentil 25: P30=25100

110=27,5 percentil 50: P50=50100

110=55

Como el número de datos es 110 entonces el percentil 25 es el promedio de los datos 27 y 28, el percentil 50 es el promedio de los datos 55 y 56:

Percentil 25: x27=66km x28=66km

P25=66km+66km

2=66km

Percentil 50: x55=71km x56=72km

P50=71km+72km

2=71,5 km

MEDIDAS UNIVARIANTES DE DISPERSIÓN

RANGO:

R=Xmax−Xmin

Es la diferencia entre el dato mayor y el dato menor, indica que tanto pueden variar las magnitudes de los datos.

Page 19: T2 100105 453

Universidad Nacional Abierta y a Distancia – UNAD - Vicerrectoría Académica y de Investigación - VIACI Escuela: ECAPMA Programa: Ingeniería Ambiental Curso: Estadística Descriptiva Código: 100105En este caso X max=150 km X min=33km

R=150 km−33km=117 km

La máxima variación de los datos es de 117km, las velocidades se encuentran en el intervalo de 150 a 33 km.

VARIANZA:

s2=( 1n∑i=1m

X i2)− x2

s2=( 1110 33359)− (73,21 )2=5056,44

La variación cuadrática de las velocidades respecto a la velocidad promedio es de 5056,44.

DESVIACIÓN TÍPICA O ESTÁNDAR:

s=√s2La desviación típica es la variación de los datos respecto al valor promedio.

s=√5056,44=71,11kmLa variación de las velocidades de los accidentados respecto a la velocidad promedio es de 71, 11km.

COEFICIENTE DE VARIACIÓN:

c . v= sx∗100%

Medida de variabilidad relativa de una serie de datos.

c . v=71,11km73,21 km

∗100%=97,13%

Como el coeficiente de variación es alto, indica que la variabilidad de las velocidades de los accidentados es alta y que la velocidad promedio no es la mejor representación de las velocidades de los 110 accidentes registrados.

ANÁLISIS E INTERPRETACIÓN DE LA INFORMACIÓN OBTENIDA.

Page 20: T2 100105 453

Universidad Nacional Abierta y a Distancia – UNAD - Vicerrectoría Académica y de Investigación - VIACI Escuela: ECAPMA Programa: Ingeniería Ambiental Curso: Estadística Descriptiva Código: 100105Las medidas de tendencia central o de resumen son indicadores que tienden a sintetizar o describir de la manera más representativa las características de un conjunto de datos. Las medidas más importantes son: • La Media aritmética • La Mediana • La ModaLa accidentalidad vial, es un fenómeno que está pasando a convertirse en un problema de salud pública, y que nos compete a todos, tanto conductores como peatones.Este problema va en constante crecimiento, y ve de forma muy acelerada. Un factor muy importante en este análisis es las condiciones en que se encuentra la malla vial de la ciudad de Medellín, que está en buenas condiciones, pero que no está preparada para el incremento exagerado y constante del parque automotor. Sí no se toman cartas en el asunto, podrá llevar en pocos años un momento en que ésta colapse. Ya que según los datos obtenidos de la muestra tomada por la secretaria de transito de Medellín se tiene un alto índice de accidentalidad en personas de b38 años de edad aunque la mayor frecuencia está en personas de 46 años de edad y en un rango entre los 17 y 60 años; los cuales entre hombres y mujeres con diferencias entre accidentados y muertos, viajaban en una velocidad promedio de 74 km/h y en un rango de velocidad entre los 33 y los 150 Km/h. Por consiguiente este pequeño estudio nos debe llevar a tomar conciencia sobre la realidad actual de la movilidad en las calles de Medellín, y a descubrir la importancia que tiene la educación vial que se brinda en la "escuelas de conducción".

CONCLUSIONES.

Se conoció muchos de los fundamentos que son necesarios para el estudio de la estadística.

Page 21: T2 100105 453

Universidad Nacional Abierta y a Distancia – UNAD - Vicerrectoría Académica y de Investigación - VIACI Escuela: ECAPMA Programa: Ingeniería Ambiental Curso: Estadística Descriptiva Código: 100105

Se aprendió la importancia de los datos estadísticos y su utilidad para nuestra cotidianidad.

Gracias al desarrollo de los ejercicios anteriores se puede decir que fortalecí muchos de los conceptos y procedimientos presentes en la estadística descriptiva.

El desarrollo de los ejercicios me permitió adentrarnos más en el ambiente de las estadísticas lo cual será de gran ayuda para mi formación como profesional.

Las medias de dispersión nos permiten medir esos datos extremos que se encuentran alejados de la tendencia central, esto es muy interesante ya que las medidas de tendencia central no siempre proporcionan conclusiones contundentes frente a un conjunto de datos. Igualmente se aprendió a calcularla varianza de un dato a la media, también comparar las series de los datos a través del coeficiente variación y así se puede determinar cuál serie tiene mayor o menor variabilidad relativa.

REFERENCIAS BIBLIOGRÁFICAS.

Conceptos Generales. (2007). In J. M. Montero Lorenzo, Estadística descriptiva (pp. 1-16). Madrid: Paraninfo. Recuperado de http://go.galegroup.com/ps/i.do?

Page 22: T2 100105 453

Universidad Nacional Abierta y a Distancia – UNAD - Vicerrectoría Académica y de Investigación - VIACI Escuela: ECAPMA Programa: Ingeniería Ambiental Curso: Estadística Descriptiva Código: 100105

id=GALE%7CCX4052100007&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=0a7332df0d4700de0bd272caa41e1718

"La Estadística aplicada a la Economía." Introducción a la estadística económica y empresarial: Teoría y práctica. Marta García Secades. 3rd ed. Madrid: Paraninfo, 2004. 3-10. Disponible en biblioteca virtual de la unad: base de datos Gale http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052900008&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=84a84913a25d9dfd21d0a0d3deb41deahttp://datateca.unad.edu.co/contenidos/100105/Material/Modulo-100105-2011-paginado.pdf

Temática propuesta en el momento 2 medidas de tenencia central: http://es.slideshare.net/Igneigna/medidas-de-tendencia-central-para-datos-agrupadoshttp://es.slideshare.net/igneigna/medidas-de-tendencia-central-para-datos-no-agrupados?next_slideshow=1

Bases para la elaboración de la variable discreta.http://datateca.unad.edu.co/contenidos/100105/Material/Modulo-100105-2011-paginado.pdf