Curso: Guía de contenidos Aplicaciones específicas Data ...

2
Introducción a Modeler • Metodología CRISP-DM • Exploración del software Extracción y carga de datos • Lectura de datos en formato Statistics, Excel, archivos de texto y bases de datos • Exploración de datos hacia archivos planos delimitados, de ancho fijo, Excel y bases de datos Calidad de datos • Definición de tipos y medidas • Valores nulos • Valores atípicos y extremos • Tratamiento de casos Manipulación de datos • Cálculo de variables • Variables agregadas • Reestructuración de datos • Operaciones con fechas, cadenas y números • Creación de intervalos • Estructuras de control • Operaciones secuenciales • Casos duplicados • Histograma y distribución • Caché de nodos • SQL Pushback Parámetros de flujos • Configuración de parámetros • Aplicación de parámetros Curso: Guía de contenidos Aplicaciones específicas Data Mining: Manipulación y Modelos

Transcript of Curso: Guía de contenidos Aplicaciones específicas Data ...

Page 1: Curso: Guía de contenidos Aplicaciones específicas Data ...

Introducción a Modeler• Metodología CRISP-DM• Exploración del software

Extracción y carga de datos• Lectura de datos en formato Statistics, Excel, archivos de texto y bases de datos• Exploración de datos hacia archivos planos delimitados, de ancho fijo, Excel y bases de datos

Calidad de datos• Definición de tipos y medidas• Valores nulos• Valores atípicos y extremos• Tratamiento de casos

Manipulación de datos• Cálculo de variables• Variables agregadas• Reestructuración de datos• Operaciones con fechas, cadenas y números• Creación de intervalos• Estructuras de control• Operaciones secuenciales• Casos duplicados• Histograma y distribución• Caché de nodos• SQL Pushback

Parámetros de flujos• Configuración de parámetros• Aplicación de parámetros

Curso: Guía de contenidos

Aplicaciones específicas

Data Mining: Manipulación y Modelos

Page 2: Curso: Guía de contenidos Aplicaciones específicas Data ...

Encapsulamiento de procesos• Tipos de supernodos• Supernodos con parámetros

Automatización• Ejecución batch desatendida• Encriptación de contraseñas• Scripting de flujos con Python• Ejemplos de integración con R

Preparación de datos• Selección de casos• Transformaciones de datos• Variables predictoras y objetivo• Creación de particiones• Selección de predictores• Roles de variables

Algoritmos analíticos• K-medias• Árbol de decisión CHAID• Regresión logística

Medidas de evaluación• Gráficos de ganancia y ROC• Evaluación por KS y Gini• Estabilidad de la población

Carga horaria 20 horas

BeSmart ArgentinaMontañeses 2180 4° piso • Buenos Aires

(+54 11) 4784 2001 • [email protected]

BeSmart ChileMardoqueo Fernández 207 • Providencia • Santiago

(+56 2) 2415 3478 • [email protected]