Post on 01-Jan-2020
Aplicación del Big Data en el sector del calzado para la mejora de la competitividad y de los procesos productivos
1
Programa de Formación: Aplicación del Big Data en el sector del calzado para la mejora de la competitividad y
de los procesos productivos
Octubre 2018
Sesión: Predicción de la rotura de stock (WEKA)(Parte II: ejercicio rotura de stock)
Profesores:Alex Rabasa
Carolina Belso
Aplicación del Big Data en el sector del calzado para la mejora de la competitividad y de los procesos productivos
2
ROTURA DE STOCK
•¿ Cuando se rompe stock ?•¿ A qué es debido ? Almacén ? Tendencias ? Compra ? Venta ? Precio ?…
Aplicación del Big Data en el sector del calzado para la mejora de la competitividad y de los procesos productivos
3
BASE DE DATOS “ BD_marca”
Nuestra base de datos se compone de información para realizar la compra de los próximos meses en el calzado de moda en diferentes marcas internacionales.
La base de datos que vamos a trabajar se llama “BD_marca”, compuesta por los siguientes 15 atributos:
• 3 Variables Numéricas ( Compra, Precio Uni., Venta ).• 12 Variables Nominal.
Aplicación del Big Data en el sector del calzado para la mejora de la competitividad y de los procesos productivos
4
BASE DE DATOS “ BD_marca” para WEKA
Para trabajar con la herramienta WEKA necesitamos modificar los archivos de la siguiente manera:
1. Cambiar las comas de la base de datos a puntos.2. Guardar el documento Excel en .csv (de .xlsx a .csv)3. Editar el nuevo .csv reemplazando los puntos y comas ( ; ) por comas (,)
Aplicación del Big Data en el sector del calzado para la mejora de la competitividad y de los procesos productivos
5
WEKA
Después de preparar nuestra base de datos tenemos que utilizar la parte de “Explorer” para realizar nuestro análisis.
Abrimos el archivo de tipo: *.csv
Aplicación del Big Data en el sector del calzado para la mejora de la competitividad y de los procesos productivos
6
WEKAAnálisis de atributos
En la primera pantalla tenemos un pequeño resumen de cómo son los atributos que vamos a trabajar.
En “Visualize All” encontramos de manera gráfica cuantas categorizaciones hay por cada variable:
Aplicación del Big Data en el sector del calzado para la mejora de la competitividad y de los procesos productivos
7
WEKARELACIÓN DE ATRIBUTOS
Antes de comenzar a aplicar métodos de minería de datos, analizaremos las gráficas de relación obtenidas para cada uno de los atributos que hemos seleccionado como válidos para comprobar cuales son influyentes para la rotura de stock o compra.
Precio unitario/Venta 2017
Aplicación del Big Data en el sector del calzado para la mejora de la competitividad y de los procesos productivos
8
ÁRBOL DE CLASIFICACIÓN POR ROTURA DE STOCK “Choose”/tree/J48
El algoritmo J48 es uno de los algoritmos de minería de datos más utilizado. Aporta información sobre el atributo seleccionado para ver que realización hay con los demás atributos. Para ello vamos a la pestaña de “Classify” y elegimos la variable ROTURA ya que para saber si hemos roto stock necesitamos saber que marca ha sido.
Aplicación del Big Data en el sector del calzado para la mejora de la competitividad y de los procesos productivos
9
ÁRBOL DE CLASIFICACIÓN POR ROTURA DE STOCK
Aplicación del Big Data en el sector del calzado para la mejora de la competitividad y de los procesos productivos
10
ÁRBOLES DE REGRESIÓNIBKA pesar de que este algoritmo no crea ningún tipo de modelo, merece la pena aplicarlo a nuestro conjunto de datos y observar los resultados. Este algoritmo es de la familia de algoritmos incluidos en “lazy learning”. Este algoritmo se basa en instancias, por lo que únicamente almacena los datos presentados.
El concepto principal que fundamental de este algoritmo, es que cada instancia encontrada se va a clasificar en la clase más frecuente a la que pertenezcan sus K vecinos más cercanos.
Para un KNM = 5 y el atributo Precio Unitario:
Resultado del modelo bastante bueno, el coeficiente de correlación es de 0,82 y el error absoluto medio no es muy elevado 11,19€.
No obstante, este método, no crea un modelo para poder implementarlo ni una serie de reglas a aplicar, tan sólo clasifica las instancias.
Aplicación del Big Data en el sector del calzado para la mejora de la competitividad y de los procesos productivos
11
ÁRBOLES DE REGRESIÓN
Regresión LinealAplicaremos ahora el método de regresión lineal implementado en Weka. Teniendo en cuenta como afectan en mayor o menor medida el valor de los atributos para el precio unitario.
Resultado del modelo bastante bueno, el coeficiente de correlación es de 0,81 y el error absoluto medio no es muy elevado 12,33€.
Weka nos muestra el modelo construido a partir de los datos y el resumen de resultados.
Aplicación del Big Data en el sector del calzado para la mejora de la competitividad y de los procesos productivos
12
ÁRBOLES DE REGRESIÓN
M5PEste algoritmo combina un árbol de decisión normal con funciones de regresión lineal en los nodos.Se obtienen 10 reglas y los siguientes valores:
Resultado del modelo bastante bueno, el coeficiente de correlación es de 0,88 y el error absoluto medio no es muy elevado 9,25€.
Se genera el siguiente árbol de decisión:
Aplicación del Big Data en el sector del calzado para la mejora de la competitividad y de los procesos productivos
13
ÁRBOLES DE REGRESIÓN
M5PUna de las reglas generadas son las siguientes: :
Aplicación del Big Data en el sector del calzado para la mejora de la competitividad y de los procesos productivos
14
ÁRBOLES DE REGRESIÓN
Obtención del modelo óptimoEn la siguiente tabla, podemos ver un pequeño resumen con los datos más importantes y relevantes para tomar la decisión sobre que método ha obtenido mejores resultados y, por tanto, qué modelo implementaremos en nuestra aplicación.
Queda bastante claro a simple vista, que el modelo que deberíamos implementar es el construido por el algoritmo M5P, pues es el que ha alcanzado un coeficiente de correlación mejor, conjuntamente con una media de error absoluto y relativo.
Aplicación del Big Data en el sector del calzado para la mejora de la competitividad y de los procesos productivos
15
GRACIAS