Dataminning
-
Upload
luis-manuel-callejas -
Category
Technology
-
view
323 -
download
3
description
Transcript of Dataminning
1
Luis Manuel Callejas SaenzLuis Manuel Callejas Saenz
Maestria en e-CommerceMaestria en e-Commerce
Instituto Tecnológico De MonterreyInstituto Tecnológico De Monterrey
Minería de Datos: Minería de Datos: Aplicaciones, Retos y Aplicaciones, Retos y OportunidadesOportunidades
2
Minería de Datos: Minería de Datos: Aplicaciones, Aplicaciones,
Retos y OportunidadesRetos y Oportunidades
Ventajas competitivas de MDVentajas competitivas de MD Una metodología de MDUna metodología de MD AplicacionesAplicaciones
Televisoras Bancos - Prospex
ConclusionesConclusiones
3
Ventajas competitivas de Ventajas competitivas de Minería de datosMinería de datos
4
•Tamaño de la base de datos de UPS para registro de envios: 17 terabytes
•Libros en “The Library of Congress”: 17 millones Espacio por libro: 1 Mega Espacio requerido: 17 terabytes
Crecimiento ExponencialCrecimiento Exponencial
Elemento 1900 2000 % crecim.
Población 1.6 billones 6 billones 3.75
Velocidad terrerste 100 millas/hr 400 millas/hr 4
Distancia 25,000 millas 475,000 1,500
Velocidad aérea 200 millas/hr 25,000 millas/hr 12,500
Datos 10s Mega bytes 10s Tera bytes 100,000
5
Habilitadores TecnológicosHabilitadores Tecnológicos
Costo por megabyte en disco hace diez años: $50.00 USD actualmente: $0.10 USD
Costo de un terabyte: actualmente: $100,000 USD
Velocidad de procesamientoComputadora Alaska a 1.35 Gigaherts a $1,500 USDMemoria RAMPC con memoria RAM de 128M a 1 Giga por menos de $2,000 USD
6
ParadojaParadoja
Ahogados en datos y carentes de Ahogados en datos y carentes de información y conocimientosinformación y conocimientos
7
Elementos de competitividadElementos de competitividad
NegociosNegocios
Inteligencia de NegociosInteligencia de Negocios
Aprendizaje organizacional (CRM)Aprendizaje organizacional (CRM)
Minería de datosMinería de datos
RDB, DWH, DMOLTP
Sentidos
OLAP
MemoriaRazonamiento
Aprendizaje
8
Elementos de competitividadElementos de competitividad
Aprender sobre los clientes y utilizar
lo aprendido sobre los clientes para
aumentar la rentabilidad de la
compañía y hacerles a los clientes la
vida más fácil
B2B
Tipos de cliente
B2C
9
Elementos de CompetitividadElementos de Competitividad
Nivel de compra
Ventas cruzadas
Upgrades
Cancelaciones forzadas
Cero compras
Cancelación voluntaria
Mercadometa
Clientenuevo
Clienteinicial
Clienterentable
Clientepotencial
Clientebajo valor
Retirovoluntario
Retiroforzado
Campañas de adquisición
Respuesta a campañas de adquisición
Solicitudes
Campañas winback
Clienteprospecto
Cliente nuevo
Cliente establecido
Cliente perdido
Adquisición Activación Admón de la relación
Winback
10
Minería De DatosMinería De Datos
Proceso para la extracción de patrones significativos en grandes volumenes de datos El pasado es un buen
predictor del futuro
Hay datos disponibles
Los datos contienen lo que queremos predecir
11
Uso de la Minería de DatosUso de la Minería de Datos
Tipos de tareas
tarea
síntesis análisis
especifcar diseñar ensambar
planear configurar modificar
predecir identificar controlar
clasificar diagnosticar monitorear
12
Uso de la Minería de DatosUso de la Minería de Datos
Edos financ
BD Anunciantes
MineríaDe datos
Demográficos
Perfiles genéricos
Cola de anuncios
Anuncios
AgentesPersonales
Blackboard
Perfil de anunciantes
Clientes
Anunciantes
Experto enMercadotec
nia
Generadores de contenido
Tiendas
13
Metodología de Minería de Metodología de Minería de DatosDatos
Definición del problema y establecimiento de metas
Obtención y preparaciónde datos Construir modelo
Resultados
Herramientasy técnicas
Evaluar resultadosUsar modelo
14
Identificación de problemasIdentificación de problemas
Metas de negocio concretas
Incrementar en un 5% el volumen de ventas del producto A en la región 5 en los siguientes 3 meses
Reducir en un 10% el desperdicio de materia prima en la producción del producto Y en la línea de ensamble 3 durante el mes de Octubre
Encontrar las características demográficas de la población que comprará el producto Z en la zona norte durante el próximo año
15
Preparar los datosPreparar los datos
Diversas fuentes de datos
Preparar datos
RDBMS
Datamarts
Datawarehouse
Archivo
HojaExcel
Tabla de datamining
16
ModelaciónModelación
Construir y usar el modelo
Conjuntode
entrenamientoModeloinicial
Modelodepurado
Conjuntode
depuración
Conjuntode
pruebaModeloprobado
Datos realesPrediccionesPredicciones
Construirmodelo
Usarmodelo
17
Técnicas y herramientasTécnicas y herramientas
Arboles de decisiónArboles de decisión EntropíaEntropía GiniGini
Redes BayesianasRedes Bayesianas Clasificador Clasificador
Bayesiano Bayesiano Redes neuronalesRedes neuronales
RetropropagaciónRetropropagación Mapas Mapas
autoorganizadosautoorganizados
Enterprise Miner SASEnterprise Miner SAS Clementine SPSSClementine SPSS Mine Set SGIMine Set SGI Intelligent Miner IBMIntelligent Miner IBM CART Salford SystemsCART Salford Systems See5See5 BonsaiBonsai ProspectProspect
18
Aplicación de Minería de DatosAplicación de Minería de Datos
Definición del problema
Pronosticar el rating de los programas de un canal de televisión
Pronosticar el número de televisores encendidos
Pronosticar el porcentaje de participación (share)
19
Aplicación de Minería de DatosAplicación de Minería de Datos
Pronósticos
Programación
Telereport
Preparaciónde datos
Construcción RNde RetroProp
Presentación deresultados
BD
Oracle
IBOPE
Tabla deDM
Ratings porprograma por
canal
Uso de la RN KB
20
Aplicación de Minería de DatosAplicación de Minería de Datos
Pronósticosde Ratings
Calcularatings por canal
y
CalculaEncendidos
y
Share por Canaly
EncendidosTotales
Share OtrosCanales
21
Aplicación de Minería de DatosAplicación de Minería de Datos
Definición del problema
Pronóstico de efectivo en cajeros automáticos
Si se dota el cajero con pocos fondos, se quedará sin dinero y dará un mal servicio al cliente
Si se dota el cajero con mucho dinero, habrá un costo financiero asociado con el dinero improductivo
22
Aplicación de Minería de DatosAplicación de Minería de Datos
Meta de negocio:Actualmente: 3 pesos por
cada peso entregado, y 5% de cajeros sin dinero
Meta: 2 pesos por cada peso entregado y 2.5% de cajeros sin dinero
23
Aplicación de Minería de DatosAplicación de Minería de Datos
Pronósticos
Programación
Preparaciónde datos
Construcción RNde Kohonen
Presentación deresultados
BDSistemacajeros
Tabla deDM
Pronóstico porCajero y por
día
Uso de la RN KB
24
ConclusionesConclusiones
Múltiples áreas de Múltiples áreas de oportunidadoportunidad
Necesidad de recursos Necesidad de recursos humanos capacitados en humanos capacitados en
el uso tecnologías el uso tecnologías inteligentesinteligentes
25
ConclusionesConclusiones
Ciencias de lo artificialCiencias de lo artificial:
Inteligencia ArtificialIngeniería delConocimiento
Matemáticas
Lógica Minería de Datos
Robótica
Logística y DSS
Computabilidad
HCICibernética y Teoría de Información
DiseñoDiseño
Ingeniero en Sistemas
Inteligentes