Trabajo Estadistica
-
Upload
jessika-solano-prado -
Category
Documents
-
view
3 -
download
0
description
Transcript of Trabajo Estadistica
1
UNIVERSIDAD INDUSTRIAL DE SANTANDER
INGENIERÍA INDUSTRIAL
Trabajo final [Análisis Estadístico - Sector transporte y logística]
Presentado por:
Sergio Orlando Arias Corzo
Paula Daniela Diaz León
Maria Paula Guerrero Penagos
Yessica Viviana Solano Prado
Fecha:
27 de agosto de 2015
2
Contenido
INTRODUCCIÓN..................................................................................................................3
Empresas estudiadas del sector de transporte y logística en Santander..................................4
A. Copetran...................................................................................................................4
B. Metrocinco Plus........................................................................................................4
Sector de transportes y logística de Santander........................................................................4
INGRESOS OPERACIONALES...........................................................................................5
Datos no agrupados.............................................................................................................5
Medidas de tendencia central datos no agrupados..................................................................5
Datos agrupados..................................................................................................................6
Medidas de tendencia central datos agrupados.......................................................................6
Graficas...................................................................................................................................7
Histograma..............................................................................................................................7
Polígono de frecuencia............................................................................................................9
Diagrama de caja...................................................................................................................10
UTILIDADES.......................................................................................................................11
Referencias bibliográficas.....................................................................................................17
Anexos..................................................................................................................................19
3
1. INTRODUCCIÓN
En el curso de Estadística I se aprendió la importancia y utilidad de la estadística para
analizar y cuantificar datos. En el presente trabajo se busca aplicar lo aprendido en el curso
a hechos concretos y datos reales, en este caso se estudiarán dos tipos de variables: utilidad
e ingresos operacionales de las principales empresas del sector de transporte y logística de
Santander.
Con el fin de interpretar el comportamiento que tienen estas variables en cuanto a la
economía de Santander, se analizó cada dato detalladamente con gráficos y medidas que
ayudaron a organizar la información de manera más completa y entendible, lo que permite
comprender ampliamente el uso y las conclusiones que se pueden obtener al hacer uso de
las herramientas estadísticas.
A diferencia de los ejercicios realizados en el aula de clase, el presente trabajo comenzó
directamente con el tratamiento de los datos desde la fuente, lo que permitió también tener
una visión completa de la información que se está analizando. Los datos fueron extraídos,
seleccionados y agrupados, para, posteriormente hallar sus respectivas medidas aplicando
los conocimientos en estadística descriptiva.
Este trabajo está estructurado básicamente en: datos recolectados, análisis gráfico y
matemático de los mismos. Se llegará a conclusiones a partir de lo observado y obtenido en
dicho análisis.
4
2. MARCO TEÓRICO
2.1 Empresas estudiadas del sector de transporte y logística en Santander
Las empresas con mayor cantidad de activos dentro del sector de transporte y logística en
Santander se encuentran:
A. Copetran
Organización Cooperativa de transporte terrestre de pasajeros, carga, mensajería
especializada, giros postales y turismo. Cuenta con un total de $ 202,805 millones
de pesos en activos y $ 111.733 millones de pesos en patrimonio.
B. Metrocinco Plus
Es el Sistema Integrado de Transporte Masivo del Área Metropolitana de
Bucaramanga. Cuenta con un total de $75.029 millones de pesos en activos.
2.2 Sector de transportes y logística de Santander
Tabla 1 ingresos operacionales y utilidades (en millones de pesos)
Razón social
2013 2014 2013/14
Ing. Operacionales
UtilidadesIng.
OperacionalesUtilidades
Variación Ingresos
Operacionales 1 PRODECA S.A. 44849 513 56953 424 26,99
2AUTOTANQUES DE
COLOMBIA41036 487 38921 403 5,15
3 METROCINCO PLUS 36627 7202 34292 5930 6,38
4TRANSPORTES MURGUZ
S.A.36707 396 28144 519 23,33
5 FRIMAC S.A. 34493 803 35559 2921 3,09
6TRANSPORTES LIQUIDOS
S.A32247 125 45921 6059 42,41
7TRANSPORTES PIEDECUESTA
28607 257 31979 155 11,78
5
8 OPL LOGÍSTICA 26744 1106 14659 1015 45,19
9 TRANSPORTES CALDERÓN 24945 2710 28759 3163 15,29
10 UNITRANSA 23800 44 25672 47 7,87
11 MOVILIZAMOS S.A. 20798 3281 21352 4182 2,66
12 OPL TRAILERS S.A.S. 20256 765 20294 46 0,18
13OPERADORES LOGÍSTICOS
DE CARGA OPL18169 649 17710 3306 2,53
14 TRANSTECOL 13418 681 18495 297 37,83
15 MIXER LTDA 10678 332 11049 477 3,48
16 TRANSPORTES LEBRIJA 10525 325 12207 351 15,98
Fuente: Cámara de comercio Bucaramanga, Supersociedades, Superintendencia de Servicios
Públicos y Superintendencia de la Economía Solidaria. Informe elaborado por Keyson Colombia –
Bogotá. Las 500 empresas más grandes de Santander.
3. INGRESOS OPERACIONALES
3.1 Datos no agrupados
A. Medidas de tendencia central datos no agrupados
Medida 2013 2014Media 26493,6875 27622,875Mediana 25844,5 26908desviacion estandar 10593,7826 12674,2592coeficiente de variación 39,986063 45,8832009Curtosis -0,94706142 0,36845669Coeficiente de asimetría 0,05036779 0,78226577
Tabla 3 medidas de tendencia central, datos no agrupados 2013, 2014 (cifras en millones de pesos)
6
3.2 Datos agrupados
K Mifi hi Fi Hi
1 (10 - 20] 15 4 0,25 4 0,25 60 625 97656,25 -7812,52 (20 - 30] 25 6 0,375 10 0,625 150 37,5 234,375 -93,753 (30 - 40] 35 4 0,25 14 0,875 140 225 12656,25 1687,54 (40 - 50] 45 2 0,125 16 1 90 612,5 187578,125 10718,755 (50 - 60] 55 0 0 0 0 0 0
Total 16 1 440 1500 298125 4500
Cifras en miles de millones de pesosIngresos
operacionales2013
ܯ ݂� ܯ െݔ�ҧଶ݂� ܯ െݔ�ҧସ݂� ܯ െݔ�ҧଷ݂�
Tabla 4 distribuciones de frecuencias ingresos operacionales 2013
Mifi hi Fi Hi
1 (10 - 20] 15 5 0,3125 5 0,3125 75 781,25 122070,3125 -9765,6252 (20 - 30] 25 5 0,3125 10 0,625 125 31,25 195,3125 -78,1253 (30 - 40] 35 4 0,25 14 0,875 140 225 12656,25 1687,54 (40 - 50] 45 1 0,0625 15 0,9375 45 306,25 93789,0625 5359,3755 (50 - 60] 55 1 0,0625 16 1 55 756,25 571914,0625 20796,875
Total 16 1 440 2100 800625 18000
Cifras en miles de millones de pesos
K Ingresos operacionales
2014ܯ ݂� ܯ െݔ�ҧଶ݂� ܯ െݔ�ҧସ݂� ܯ െݔ�ҧଷ݂�
Tabla 5 distribución de frecuencias ingresos operacionales 2014
A. Medidas de tendencia central datos agrupados
7
Tabla 6 medidas de tendencia central ingresos operacionales 2013, 2014
3.3 Gráficos
A. Histograma
8
10 20 30 40 500
1
2
3
4
5
6
7
Ingresos operacionales 2013
Ingresos operacionales (miles de millones de pesos)
Frec
uenc
ia
Figura 1. Histograma de frecuencias, ingresos operacionales 2013, en miles de millones de pesos.
10 20 30 40 50 600
1
2
3
4
5
6
Ingresos operacionales 2014
Ingresos operacionales (miles de millones de pesos)
Frec
uenc
ia
Figura 2. Histograma de frecuencias, ingresos operacionales 2014, en miles de millones de pesos.
Análisis
Los ingresos operacionales se concentran, en ambos casos entre 20 y 30 mil
millones de pesos.
La principal diferencia entre ambos años, es que en el 2014 hay una mayor cantidad
de empresas con ingresos en los intervalos más bajos, y de la misma forma, menos
9
empresas con ingresos en los intervalos más altos, mientras que la distribución del
año 2013 es más uniforme.
Para los años 2013 y 2014 a partir de los datos calculados en la tabla 6 se puede
notar que el coeficiente de curtosis para ambos años es mayor a cero lo que indica
una distribución con sesgo positivo es decir sesgada hacia la derecha, debido a que
los cálculos de la media (x) son mayores a los de la mediana (me), lo que podemos
visualizar claramente en la gráfica.
B. Polígono de frecuencia
0 15 25 35 45 55 6501234567
Ingresos operacionales 2013 - 2014
20132014
Ingresos operacionales (miles de millones de pesos)
Frec
uenc
ia
Figura 3. Polígono de frecuencias, ingresos operacionales 2013 y 2014, en miles de millones de pesos.
Análisis
El coeficiente de curtosis hallado en la tabla 6 para los años 2013 y 2014 indican el
grado de apuntamiento de la curva, para ambos años el coeficiente es menor a cero
lo que representa una mayor dispersión de los datos, por esta razón el
comportamiento de la figura 3 se visualiza de forma platicúrtica lo que significa un
reducido grado de concentración alrededor de la media (x=27,5)
10
C. Diagrama de caja
Ing. Operacionales 2014Ing. Operacionales 2013
60000
50000
40000
30000
20000
10000
Dat
os
Gráfica de caja de Ing. Operacionales 2013. Ing. Operacionales 2014
2013 2014
Q1 18,6908 17,9063
Mediana 25,8445 26,908
Q3 36,0935 35,2422
Dato menor 10,525 11,049
Dato mayor 44,849 56,953
Figura 4. Diagrama de caja, ingresos operacionales 2013 y 2014, en miles de millones de
pesos.
Análisis
La diferencia entre la mediana indica que en general los ingresos operacionales
de las empresas aumentaron en el 2014
Proporcional al aumento en la mediana, aumentaron los cuartiles 1 y 3, lo que
confirma lo anteriormente mencionado
11
4. UTILIDADES
4.1 Medidas de tendencia central
Tabla 7. Cuadro de cálculo. Utilidades 2013, en millones de pesos.
Tabla 8. Cuadro de cálculo. Utilidades 2014, en millones de pesos.
12
Tabla 9. Medidas de tendencia central datos agrupados. Utilidades 2013 y 2014,
en millones de pesos.
Tabla 9. Medidas de tendencia central datos no agrupados. Utilidades 2013 y
2014, en millones de pesos.
4.2 Análisis Debido al seccionamiento implementado para el análisis gráfico de los datos ha sido
necesario el desarrollar gráficos de densidad.
Al considerar los gráficos de densidad se evidencia asimetría positiva lo cual
implica mayor agrupación en la región izquierda del gráfico, dicho de otra manera,
indica menor dispersión para los datos ubicados en la región izquierda del gráfico.
Al realizar un análisis comparativo entre las utilidades generadas a través de los
periodos 2013 y 2014 se evidencian leves variaciones respecto a la distribución de
datos debido principalmente al incremento en las utilidades de algunas instituciones
así como la disminución en las utilidades de otras, reflejando para el año 2014 en su
distribución mayor uniformidad.
13
0 1000 2000 3000 4000 5000 6000 7000 80000
0.02
0.04
0.06
0.08
Poligono de frecuencia
Utilidades 2013 Utilidades 2014
Figura 5. Polígono de frecuencia, utilidades 2013 y 2014, en de millones de
pesos.
Para el siguiente análisis gráfico se debe tener en cuenta la implementación de
Diagrama de Caja.
Utilidades 2014Utilidades 2013
8000
7000
6000
5000
4000
3000
2000
1000
0
Dat
os
Gráfica de caja de Utilidades 2013. Utilidades 2014
2013 2014Q1 326,75 310,5
Mediana 581 498Q3 1030,25 3270,25
Dato menor
44 46
Dato mayor 1106 6059
Figura 6. Diagrama de caja, utilidades 2013 y 2014, en de millones de pesos.
14
Para el caso de las utilidades 2013 al comparar la longitud de los bigotes que el
inferior es mayor que el superior lo cual implica un mayor grado de dispersión para
los datos que corresponden al 25% de las instituciones que cuentan con menos
utilidades en comparación con el 25% de las instituciones que cuentan con más. De
igual manera al analizar la sección comprendida entre Q1 y Q3 se evidencia mayor
dispersión entre la sección Q2 y Q3.
Se debe tener en cuenta además la presencia de algunos datos atípicos los cuales
justifican su existencia principalmente debido al marcado sesgo positivo que
evidencia, por lo que datos extremos se muestran como datos atípicos.
Ahora, si se habla en general sobre las utilidades que corresponden al periodo de
2014 se observa una clara asimetría positiva, sin embargo, presenta la ausencia de
datos atípicos. Esto se debe principalmente debido a la uniformidad en la
distribución de los datos, lo cual ha sido mencionado anteriormente.
Para el 2013 el 50% de la muestra obtuvo un utilidad de 1.333 millones
0 1000 3000 4500 750002468
1012
0%20%40%60%80%100%120%
Utilidades 2013
Utilidad
Frec
uenc
ia
Figura 7. Ojiva, utilidades 2013, en millones de pesos.
15
Para el 2014 el 50% de la muestra obtuvo una utilidad de 1.778 millones
0 1000 3000 4500 6000 750002468
1012
0%20%40%60%80%100%120%
2014
Utilidad
Frec
uenc
ia
Figura 7. Ojiva, utilidades 2013, en millones de pesos.
MEDIA
Las utilidades promedio de las empresas para los años 2013 y 2014 fueron de 1234,38 y
1984,38 (millones). Estos valores aunque importantes no proporcionan información
confiable sobre el comportamiento de las utilidades durante estos dos años, una de las
razones principales es que la utilidad varía mucho de una empresa a otra. Valiéndose tan
sólo de la media entre un conjunto de valores, no es posible saber si alguno de ellos está
excesivamente alejando de la “normalidad”
MEDIANA
La utilidad media en el año 2013 y 2014 fue de 666,67 y 888,89 (millones)
respectivamente, obteniendo así los datos que divide la distribución de los valores en dos
partes iguales, es decir, que los valores ordenados con respecto a su magnitud tendrán la
mitad de ellos por debajo del valor mediano, y la otra mitad por encima del mismo valor.
Una de las ventajas es que no se ve afectada por valores extremos.
16
DESVIACION ESTANDAR
Para los años 2013 y 2014 en promedio los valores se desvían de la media 1563,83 y
2184,16 (millones) respectivamente. Estos dos valores nos proporcionan datos que resultan
útiles y necesarios para analizar y describir información, dado que nos ofrecen distintos
puntos de vista que abren puertas a diferentes clasificaciones y a datos que pueden no haber
sido considerados en un principio como en la media.
CURTOSIS
Al analizar las gráficas y los resultados obtenidos a partir de datos agrupados y al
considerar las clases de curtosis que hay es posible el clasificar la distribución como
leptocurtica lo que indica que presenta un elevado grado de concentración alrededor de los
valores centrales de la variable
COEFICIENTE DE ASIMETRIA
Para la muestra tenemos una distribución asimétrica positiva, lo que indica que existe
mayor concentración de valores a la izquierda de la media que a su derecha.
17
5. CONCLUSIONES
La información suministrada por el análisis gráfico y matemático muestra en
general para el caso de las utilidades incremento en ellas de 2013 a 2014. Sin
embargo se debe considerar que esta no es una tendencia en común para todas las
empresas puesto que hubo empresas en las que su utilidad aumentó y otras en las
que su utilidad disminuyó.
Al considerar la información suministrada por el diagrama de caja se observa en las
utilidades que corresponden al periodo 2014 mayor dispersión en comparación con
las utilidades generadas durante el periodo 2013, sin embargo, en este último se
observa la presencia de datos atípicos, lo cual se debe principalmente a la
concentración de datos en la región izquierda de la distribución.
Referencias bibliográficas
18
Keyson Colombia-Bogotá. (2014, 20 de julio) 500 empresas generadoras de Santander,
Vanguardia Liberal, edición 11. Recuperado de: https://www.Vanguardia.com
19
Anexos
20 30 40 50 600
2
4
6
8
10
12
14
16
18
Ingresos operacionales 2013
Ingresos operacionales (miles de millones de pesos)
Frec
uenc
ia a
cum
ulad
a
Figura 5. Ojiva, ingresos operacionales 2013, en miles de millones de pesos.
20
20 30 40 50 600
2
4
6
8
10
12
14
16
18
Ingresos operacionales 2014
Ingresos operacionales (miles de millones de pesos)
Frec
uenc
ia a
cum
ulad
a
Figura 6. Ojiva, ingresos operacionales 2014, en miles de millones de pesos.
21