Curso - dmc.pedmc.pe/uploads/syllabus/r-for-data-mining.pdf · Estadística e Informática de la...

9
1 R for Data Mining Análisis de datos, segmentación y técnicas de predicción con R Curso:

Transcript of Curso - dmc.pedmc.pe/uploads/syllabus/r-for-data-mining.pdf · Estadística e Informática de la...

Page 2: Curso - dmc.pedmc.pe/uploads/syllabus/r-for-data-mining.pdf · Estadística e Informática de la Universidad Nacional Agraria La Molina. ... Syllabus Instructor I. Introucción a

Web: dmc.pe Teléfono. 253-5066 Móvil: 995900126 / 975491764 Email: [email protected]

2

R es el lenguaje de programación estadístico por excelencia. Se destaca por quees una las herramientas estadísticas de mayor crecimiento. R es un software librealtamente recomendable por lo robusto y potente de sus rutinas. En este curso, el estudiante será capaz de aplicar técnicas de reducción de variables y de entenderla necesidad del uso de diversos modelos predictivos y algoritmos, para predecirel comportamiento futuro de un objeto en estudio. Asimismo, el estudianteaprenderá algunas técnicas de calibración y selección del mejor modelo predictivoque se adecúe mejor a sus datos y objetivos de estudio.

Presentación

Dirigido a todos aquellos profesionales interesados en ampliar sus conocimientos en herramientas de análisis de datos. Profesionales que se desempeñen como investigadores, analistas de datos. Personal de Procesamiento de Datos, Business Intelligence, Analistas de Datos, etc. Estudiantes de maestría y de pregrado. Provenientes de carreras profesionales: Estadística, Ingeniería Estadística, Ingeniería de Sistemas, Ingeniería informática y carreras afines. Provenientes de carreras profesionales: Estadística, Ingeniería Estadística, Ingeniería de Sistemas, Ingeniería informática y carreras afines.

Dirigido a:

Conocimientos de estadística descriptiva, multivariante y distribuciones de probabilidad. Conocimientos de manejo del software R a nivel básico (exportar, importar, concepto de objetos, funciones básicas, gráficos, paquetes como Rattle y RCommander). De preferencia, haber llevado el curso R for Business Analytics.

Pre-requisitos:

Page 3: Curso - dmc.pedmc.pe/uploads/syllabus/r-for-data-mining.pdf · Estadística e Informática de la Universidad Nacional Agraria La Molina. ... Syllabus Instructor I. Introucción a

Web: dmc.pe Teléfono. 253-5066 Móvil: 995900126 / 975491764 Email: [email protected]

3

MetodologíaEl curso se basa en la aplicación de casos prácticos fundamentadosen la teoría. Se desarrollan ejercicios y aplicaciones basadas ensituaciones reales.Se dispone de:

9 Casos de Aplicación. Situaciones reales con aplicaciones en el mercado Peruano. 9 Base de Datos de prueba para aplicar lo aprendido. 9Material didáctico con el desarrollo del curso.

Page 4: Curso - dmc.pedmc.pe/uploads/syllabus/r-for-data-mining.pdf · Estadística e Informática de la Universidad Nacional Agraria La Molina. ... Syllabus Instructor I. Introucción a

Web: dmc.pe Teléfono. 253-5066 Móvil: 995900126 / 975491764 Email: [email protected]

4

Beneficios 9 Certificado de Especialización. 9 Pertenecer a la Comunidad más grande de profesionales de Business Analytics. 9 Plana docente compuesta por líderes del sector, especializados en herramientas y temas a

desarrollar. 9 Descuentos en programas complementarios. 9 Laboratorios de cómputo. 9 Material didáctico con el desarrollo del curso. 9 Acceso a Bibliografía Especializada. 9 Acceso a la bolsa de trabajo especializada de DMC.

• Rentabilidad única en el mercado laboral.• Desarrollo de pensamiento crítico y analítico.• Serás un profesional muy valorado en la actualidad.

Las empresas actuales están buscando profesionales que se diferencien en la gestión.Las ventajas competitivas que obtienes al estar en constante capacitación son muchas,entre las que destacamos:

Page 5: Curso - dmc.pedmc.pe/uploads/syllabus/r-for-data-mining.pdf · Estadística e Informática de la Universidad Nacional Agraria La Molina. ... Syllabus Instructor I. Introucción a

Ing. Jesús Walter Salinas Flores.Ingeniero Estadístico de la Universidad Nacional

Agraria La Molina y Magister en Ingeniería Industrial, mención en Gestión Industrial de la Universidad Nacional Mayor de San Marcos. Ha sido director del departamento académico de

Estadística e Informática de la Universidad Nacional Agraria La Molina. Actualmente se desempeña como

profesor principal en el departamento académico de Estadística e Informática de la Universidad Nacional Agraria La Molina. Es docente en la maestría de Estadística Aplicada de la Universidad Nacional Agraria La Molina y en la maestría en Ciencia de los Datos de la Universidad Ricardo Palma. Sus áreas de interés son el análisis multivariado y el reconocimiento estadístico de patrones.

Web: dmc.pe Teléfono. 253-5066 Móvil: 995900126 / 975491764 Email: [email protected]

5

Syllabus

Instructor

I. Introucción a la Minería de Datos.• Definición de Minería de Datos.• Modelos analíticos: modelos supervisados y no

supervisados.• Modelos de minería de datos: KDD, CRISP y SEMMA.

II. Térnicas de preparación de datos• Limpieza de datos• Métodos gráficos para identificar outliers y

extremos• Manejo de datos atípicos• Manejo de datos faltantes• Transformación de datos• Selección de variables

III. Técnicas No Supervisadas• El análisis clúster como técnica de Data Mining.• Análisis cluster jerárquico• Evaluación de modelos jerárquicos• Análisis cluster no Jerárquico: Algoritmo K-Medias• Evaluación de modelos no jerárquicos• Técnicas para selección del número de cluster

óptimo

IV. Técnicas de Balanceo de Datos• Técnicas de balanceo de datos: undersampling,

oversampling, SMOTE.

V. Técnicas Supervisadas. Análisis de Regresión Logística• Regresión logística binaria: modelo, estimación

de coeficientes, prueba de hipótesis, medidas de bondad de ajuste, interpretación de coeficientes y odds ratio.

VI. Indicadores para evaluación de modelos de clasificación• Matriz de confusión• Estadístico Kappa• Estadístico K-S• Curva ROC• Coeficiente Gini• Log-Loss

VII. Árboles de Clasificación y Métodos de Validación• Algoritmo CART• Bagging y Random Forest• Métodos de validación: resustitución, validación cruzada,

train-test

VIII. Reglas de Asociación• Canasta de compras

Page 6: Curso - dmc.pedmc.pe/uploads/syllabus/r-for-data-mining.pdf · Estadística e Informática de la Universidad Nacional Agraria La Molina. ... Syllabus Instructor I. Introucción a

Web: dmc.pe Teléfono. 253-5066 Móvil: 995900126 / 975491764 Email: [email protected]

6

Medios de Pago

1. Depósito en las cuentas BBVA o BCP:

N° Cuenta de Ahorros: 0011-0177-02-00180473

N° Cuenta de Corriente: 193-2251181-0-01

3. Oficina DMC

2. Pago Online:

Dirección: Calle Río de la Plata 167. Of. 203. San Isidro. Lima - Perú.

Horario de Atención:Lunes a Viernes de 9:00 a.m. a 7:00 p.m. y Sábados de 9:00 a.m. a 4:00 p.m.

Razón Social

R.U.C

J&J Data Mining Consulting S.A.C

20520972740

Page 7: Curso - dmc.pedmc.pe/uploads/syllabus/r-for-data-mining.pdf · Estadística e Informática de la Universidad Nacional Agraria La Molina. ... Syllabus Instructor I. Introucción a

Web: dmc.pe Teléfono. 253-5066 Móvil: 995900126 / 975491764 Email: [email protected]

7

CertificadoCertificación otorgada a nombre de Data Mining Consulting. Empresa de capacitación en herramientas analíticas del Perú.

9 Certificado de especialización

¿Cómo obtengo mi certificado de especialización?Al finalizar el curso el capacitador evaluará a los participantes con un caso aplicativo:

9 La nota mínima requerida es (14) catorce. 9 Asistencia mínima del 80% en todo el curvso.

• En caso de no aprobar, se emitirá el certificado de asistencia.

Page 8: Curso - dmc.pedmc.pe/uploads/syllabus/r-for-data-mining.pdf · Estadística e Informática de la Universidad Nacional Agraria La Molina. ... Syllabus Instructor I. Introucción a

Web: dmc.pe Teléfono. 253-5066 Móvil: 995900126 / 975491764 Email: [email protected]

8

Data Mining Consulting SACDMC es una empresa pionera dedicada a la extracción de conocimiento desde grandes bases de datos, con más de 8 años experiencia en la capacitación de temas de Minería de Datos, Scoring de Riesgo Crediticio, Business Intelligence, Técnicas de segmentación, Business Analytics y Big Data. DMC es la única empresa peruana reconocida como uno de los referentes de capacitación en temas de Big Data.

Algunas empresas que confiaron en nosotros:

Page 9: Curso - dmc.pedmc.pe/uploads/syllabus/r-for-data-mining.pdf · Estadística e Informática de la Universidad Nacional Agraria La Molina. ... Syllabus Instructor I. Introucción a

Web: dmc.pe Teléfono. 253-5066 Móvil: 995900126 / 975491764 Email: [email protected]

9

Contacto

Email: [email protected] / [email protected]: www.dmc.peTeléfono: (511) 253-5066Móvil: 995900126 / 975491764 Dirección: Calle Rio de la Plata 167. Of. 203. San Isidro. Lima - Perú.Lunes a Viernes de 9:00 a.m. a 7:00 p.m. y Sábados de 9:00 a.m. a 4:00 p.m.