Dataminning

25
1 Luis Manuel Callejas Saenz Luis Manuel Callejas Saenz Maestria en e-Commerce Maestria en e-Commerce Instituto Tecnológico De Monterrey Instituto Tecnológico De Monterrey Minería de Datos: Minería de Datos: Aplicaciones, Retos y Aplicaciones, Retos y Oportunidades Oportunidades

description

presentacion sobre mineria de datos

Transcript of Dataminning

Page 1: Dataminning

1

Luis Manuel Callejas SaenzLuis Manuel Callejas Saenz

Maestria en e-CommerceMaestria en e-Commerce

Instituto Tecnológico De MonterreyInstituto Tecnológico De Monterrey

Minería de Datos: Minería de Datos: Aplicaciones, Retos y Aplicaciones, Retos y OportunidadesOportunidades

Page 2: Dataminning

2

Minería de Datos: Minería de Datos: Aplicaciones, Aplicaciones,

Retos y OportunidadesRetos y Oportunidades

Ventajas competitivas de MDVentajas competitivas de MD Una metodología de MDUna metodología de MD AplicacionesAplicaciones

Televisoras Bancos - Prospex

ConclusionesConclusiones

Page 3: Dataminning

3

Ventajas competitivas de Ventajas competitivas de Minería de datosMinería de datos

Page 4: Dataminning

4

•Tamaño de la base de datos de UPS para registro de envios: 17 terabytes

•Libros en “The Library of Congress”: 17 millones Espacio por libro: 1 Mega Espacio requerido: 17 terabytes

Crecimiento ExponencialCrecimiento Exponencial

Elemento 1900 2000 % crecim.

Población 1.6 billones 6 billones 3.75

Velocidad terrerste 100 millas/hr 400 millas/hr 4

Distancia 25,000 millas 475,000 1,500

Velocidad aérea 200 millas/hr 25,000 millas/hr 12,500

Datos 10s Mega bytes 10s Tera bytes 100,000

Page 5: Dataminning

5

Habilitadores TecnológicosHabilitadores Tecnológicos

Costo por megabyte en disco hace diez años: $50.00 USD actualmente: $0.10 USD

Costo de un terabyte: actualmente: $100,000 USD

Velocidad de procesamientoComputadora Alaska a 1.35 Gigaherts a $1,500 USDMemoria RAMPC con memoria RAM de 128M a 1 Giga por menos de $2,000 USD

Page 6: Dataminning

6

ParadojaParadoja

Ahogados en datos y carentes de Ahogados en datos y carentes de información y conocimientosinformación y conocimientos

Page 7: Dataminning

7

Elementos de competitividadElementos de competitividad

NegociosNegocios

Inteligencia de NegociosInteligencia de Negocios

Aprendizaje organizacional (CRM)Aprendizaje organizacional (CRM)

Minería de datosMinería de datos

RDB, DWH, DMOLTP

Sentidos

OLAP

MemoriaRazonamiento

Aprendizaje

Page 8: Dataminning

8

Elementos de competitividadElementos de competitividad

Aprender sobre los clientes y utilizar

lo aprendido sobre los clientes para

aumentar la rentabilidad de la

compañía y hacerles a los clientes la

vida más fácil

B2B

Tipos de cliente

B2C

Page 9: Dataminning

9

Elementos de CompetitividadElementos de Competitividad

Nivel de compra

Ventas cruzadas

Upgrades

Cancelaciones forzadas

Cero compras

Cancelación voluntaria

Mercadometa

Clientenuevo

Clienteinicial

Clienterentable

Clientepotencial

Clientebajo valor

Retirovoluntario

Retiroforzado

Campañas de adquisición

Respuesta a campañas de adquisición

Solicitudes

Campañas winback

Clienteprospecto

Cliente nuevo

Cliente establecido

Cliente perdido

Adquisición Activación Admón de la relación

Winback

Page 10: Dataminning

10

Minería De DatosMinería De Datos

Proceso para la extracción de patrones significativos en grandes volumenes de datos El pasado es un buen

predictor del futuro

Hay datos disponibles

Los datos contienen lo que queremos predecir

Page 11: Dataminning

11

Uso de la Minería de DatosUso de la Minería de Datos

Tipos de tareas

tarea

síntesis análisis

especifcar diseñar ensambar

planear configurar modificar

predecir identificar controlar

clasificar diagnosticar monitorear

Page 12: Dataminning

12

Uso de la Minería de DatosUso de la Minería de Datos

Edos financ

BD Anunciantes

MineríaDe datos

Demográficos

Perfiles genéricos

Cola de anuncios

Anuncios

AgentesPersonales

Blackboard

Perfil de anunciantes

Clientes

Anunciantes

Experto enMercadotec

nia

Generadores de contenido

Tiendas

Page 13: Dataminning

13

Metodología de Minería de Metodología de Minería de DatosDatos

Definición del problema y establecimiento de metas

Obtención y preparaciónde datos Construir modelo

Resultados

Herramientasy técnicas

Evaluar resultadosUsar modelo

Page 14: Dataminning

14

Identificación de problemasIdentificación de problemas

Metas de negocio concretas

Incrementar en un 5% el volumen de ventas del producto A en la región 5 en los siguientes 3 meses

Reducir en un 10% el desperdicio de materia prima en la producción del producto Y en la línea de ensamble 3 durante el mes de Octubre

Encontrar las características demográficas de la población que comprará el producto Z en la zona norte durante el próximo año

Page 15: Dataminning

15

Preparar los datosPreparar los datos

Diversas fuentes de datos

Preparar datos

RDBMS

Datamarts

Datawarehouse

Archivo

HojaExcel

Tabla de datamining

Page 16: Dataminning

16

ModelaciónModelación

Construir y usar el modelo

Conjuntode

entrenamientoModeloinicial

Modelodepurado

Conjuntode

depuración

Conjuntode

pruebaModeloprobado

Datos realesPrediccionesPredicciones

Construirmodelo

Usarmodelo

Page 17: Dataminning

17

Técnicas y herramientasTécnicas y herramientas

Arboles de decisiónArboles de decisión EntropíaEntropía GiniGini

Redes BayesianasRedes Bayesianas Clasificador Clasificador

Bayesiano Bayesiano Redes neuronalesRedes neuronales

RetropropagaciónRetropropagación Mapas Mapas

autoorganizadosautoorganizados

Enterprise Miner SASEnterprise Miner SAS Clementine SPSSClementine SPSS Mine Set SGIMine Set SGI Intelligent Miner IBMIntelligent Miner IBM CART Salford SystemsCART Salford Systems See5See5 BonsaiBonsai ProspectProspect

Page 18: Dataminning

18

Aplicación de Minería de DatosAplicación de Minería de Datos

Definición del problema

Pronosticar el rating de los programas de un canal de televisión

Pronosticar el número de televisores encendidos

Pronosticar el porcentaje de participación (share)

Page 19: Dataminning

19

Aplicación de Minería de DatosAplicación de Minería de Datos

Pronósticos

Programación

Telereport

Preparaciónde datos

Construcción RNde RetroProp

Presentación deresultados

BD

Oracle

IBOPE

Tabla deDM

Ratings porprograma por

canal

Uso de la RN KB

Page 20: Dataminning

20

Aplicación de Minería de DatosAplicación de Minería de Datos

Pronósticosde Ratings

Calcularatings por canal

y

CalculaEncendidos

y

Share por Canaly

EncendidosTotales

Share OtrosCanales

Page 21: Dataminning

21

Aplicación de Minería de DatosAplicación de Minería de Datos

Definición del problema

Pronóstico de efectivo en cajeros automáticos

Si se dota el cajero con pocos fondos, se quedará sin dinero y dará un mal servicio al cliente

Si se dota el cajero con mucho dinero, habrá un costo financiero asociado con el dinero improductivo

Page 22: Dataminning

22

Aplicación de Minería de DatosAplicación de Minería de Datos

Meta de negocio:Actualmente: 3 pesos por

cada peso entregado, y 5% de cajeros sin dinero

Meta: 2 pesos por cada peso entregado y 2.5% de cajeros sin dinero

Page 23: Dataminning

23

Aplicación de Minería de DatosAplicación de Minería de Datos

Pronósticos

Programación

Preparaciónde datos

Construcción RNde Kohonen

Presentación deresultados

BDSistemacajeros

Tabla deDM

Pronóstico porCajero y por

día

Uso de la RN KB

Page 24: Dataminning

24

ConclusionesConclusiones

Múltiples áreas de Múltiples áreas de oportunidadoportunidad

Necesidad de recursos Necesidad de recursos humanos capacitados en humanos capacitados en

el uso tecnologías el uso tecnologías inteligentesinteligentes

Page 25: Dataminning

25

ConclusionesConclusiones

Ciencias de lo artificialCiencias de lo artificial:

Inteligencia ArtificialIngeniería delConocimiento

Matemáticas

Lógica Minería de Datos

Robótica

Logística y DSS

Computabilidad

HCICibernética y Teoría de Información

DiseñoDiseño

Ingeniero en Sistemas

Inteligentes