Post on 01-Jun-2018
8/9/2019 Adquisicion del conocimiento.pdf
1/34
ndice de contenidos
Unidad 4 Adquisicin del conocimiento
4.1 Introduccin a la minera de datos
4.2 Tcnicas para el pre
-
procesamiento de datos: limpiado, reduccin y 4.3 Tcnicas para identificacin de conceptos, reglas y relaciones.
4.4 Herramienta para anlisis del conocimiento, seleccin de datos, extraccin de reglas.
8/9/2019 Adquisicion del conocimiento.pdf
2/34
Empresa, Organismo, Institucin, Dependen
Datos Informacin Cono
8/9/2019 Adquisicion del conocimiento.pdf
3/34
8/9/2019 Adquisicion del conocimiento.pdf
4/34
Datos Informacin
Co
Procesos Minera de datos
8/9/2019 Adquisicion del conocimiento.pdf
5/34
8/9/2019 Adquisicion del conocimiento.pdf
6/34
K D D
Descubrimiento del conocimiento en base de datos
Es un proceso en el cual se identifican patrones tiles en los datos posteriormente conocimiento til, valido y relevante.
El conocimiento resultante debe ser presentado de manera clara y coque de esta manera de puede decir que el trabajo de generar cocim
xito.
8/9/2019 Adquisicion del conocimiento.pdf
7/34
escubrimiento del conocimient
Data
Warehouse
Minera dedatos
Seleccin
ProcesoTransformacin
Interpretacin
Datos
procesados
Minera dedatos
Datos
transformados
Patrones
8/9/2019 Adquisicion del conocimiento.pdf
8/34
8/9/2019 Adquisicion del conocimiento.pdf
9/34
co
INFORMACION
Se apoyan deherramientas
comoBases de datos
Conjunto deProcesos
hardware ysoftware
informtico
Mtodosmatemticos
Trabajan conGrandes
cantidades dedatos
Conjunto de tcnicas que se utilizan para la obtencin de informacin implcita de las grandesotras palabras es una tecnologa poderosa y de gran potencial que permite a las organizacioinformacin desconocida para sus propias bases (almacn de datos).
8/9/2019 Adquisicion del conocimiento.pdf
10/34
Se seleccionan de los datos fuentes aqueadecuados a nuestro problemaSELECCIN
Consiste en la preparacin previa de loque se va a trabajar , para eliminar erroinconsistencias, ruidos, etc.
PRE PROCESAMIENTO
Consiste en elegir los mejores atributos del proble
Buscar variables independientes mediante divesensibilidad, por lo tanto esta seleccin de vgenerar patrones que son los usados para crear
tiles para la extraccin del conocimiento
SELECCIN DE VARIABLES
A partir de los patrones generados por el usindependientes se crea un modelo, el cual vcomportamiento de los valores del problema.
EXTRACCION DELCONOCIMIENTO
El modelo representativo del problema se utilizconclusiones validas, para que de esta forma s
conocimiento, lo cual es lo medular en la miner
INTERPRETACION
escubrimiento del conocimient
8/9/2019 Adquisicion del conocimiento.pdf
11/34
1. Limpieza de datos(Crear rutinas para llenarvalores nulos, duplicados, err2. Integracin de los datos.(Consiste principalmente en modificaciones sintcticas lle
datos, sin que supongan un cambio en el significado de l3. Transformacin de los datos..(Conversin de datos a formas mas apropiadas para traba4. Reduccin de los datos....(Consiste en decidir qu datos deben ser utilizados para el
8/9/2019 Adquisicion del conocimiento.pdf
12/34
8/9/2019 Adquisicion del conocimiento.pdf
13/34
Redes neuronales
rboles de decisin
Modelos estadsticos
Agrupamiento o Clustering
Algoritmos supervisados (o predictivos)
Algoritmos no supervisados (o del descubrimiento del conoc
8/9/2019 Adquisicion del conocimiento.pdf
14/34
Redes Neuronales
Son un paradigma de aprendizaje y procesamiento automtico iforma en que funciona el cerebro. Se trata de un sistema de intneuronas en una red que colabora para producir un estmulo de salid
8/9/2019 Adquisicion del conocimiento.pdf
15/34
8/9/2019 Adquisicion del conocimiento.pdf
16/34
Arboles de decisin
Es un modelo de prediccin utilizado en la inteligencia artificial, dad
datos se construyen estos diagramas de construcciones lgicas, mlos sistemas de prediccin basados en reglas, que sirven paracategorizar una serie de condiciones que suceden de forma suresolucin de un problema.
VENTAJAS DESVENTAJAS
Facilita la interpretacin Explica el comportamiento Reduce las variables Gestiona
Puede convertirse en una m Probabilstico Subjetivo
8/9/2019 Adquisicion del conocimiento.pdf
17/34
Arboles de decisin
8/9/2019 Adquisicion del conocimiento.pdf
18/34
Arboles de decisin
8/9/2019 Adquisicion del conocimiento.pdf
19/34
Arboles de decisin
8/9/2019 Adquisicion del conocimiento.pdf
20/34
Por ejemplo:
En un escenario para predecir qu clientes van a adquirir probabicicleta,
Si 9 de 10 clientes jvenes compran una bicicleta, pero solo
lo hacen 2 de 10 clientes de edad mayor,
El algoritmo infiere que laedades un buen elemento de pr
compra de bicicletas.
El rbol de decisin realiza predicciones basndose en la tend
resultado concreto.
Arboles de decisin
8/9/2019 Adquisicion del conocimiento.pdf
21/34
Arboles de decisin
8/9/2019 Adquisicion del conocimiento.pdf
22/34
Es una expresin simblica en forma de igualdad oque seemplea entodoslosdiseosexperimentaregresin para indicar los diferentes factores que m
variable de respuesta.
Mtodos estocsticos
8/9/2019 Adquisicion del conocimiento.pdf
23/34
Proceso de dividir un conjunto de datos en grupos excluyentes de tal manera que cada miembro de un grupocercanoposible a otro, y grupos diferentes estn loms uno del otro, donde la distancia est medida con respectvariables disponibles.
Agrupamiento o Clustering
8/9/2019 Adquisicion del conocimiento.pdf
24/34
Agrupamiento o Clustering
El objetivo de ste metodo es obtener grupos o conjunelementos, de tal manera que los elementos asignados alsimilares.Lo importante del agrupamiento respecto a la clasificacinprecisamente los grupos y la pertenencia a los grupos lo qdeterminar y a priori, no se sabe ni como son los grupos ni El agrupamiento se conoce muy frecuentemente tamsegmentacin y aglomeracin.
Ejemplos:
Algoritmo K-medias
8/9/2019 Adquisicion del conocimiento.pdf
25/34
K-medias
Tambin conocido como k-means o Iterative Distance-based Cluste
que se le proporcione a priori el numero de grupos k. El algoritmo es 1. Agrupamiento:2. Seleccionar al azar k ejemplos como centros iniciales de cada g3. repetir
asignar cada ejemplo al grupo con menor distancia a su crecalcular los nuevos centros de cada grupo;
4. hasta (los grupos sean estables)5. Los centros de cada grupo, tambin denominados centr
corresponderse con ejemplos o no, en ese caso se les denomin6. Los grupos se consideran estables cuando los ejemplos no cam
respecto la iteracin anterior.7. Se pueden obtener agrupaciones jerarquizadas tomando k = 2
mismo algoritmo de manera recursiva sobre los ejemplos de cad
8/9/2019 Adquisicion del conocimiento.pdf
26/34
Algoritmo K-medias Mtodo de casos q
las distanentre econjunto d
8/9/2019 Adquisicion del conocimiento.pdf
27/34
Algoritmo K-medias
8/9/2019 Adquisicion del conocimiento.pdf
28/34
Algoritmo K-medias
8/9/2019 Adquisicion del conocimiento.pdf
29/34
Segn el objetivo del anlisis de los datos, los algoritmos
clasifican en supervisados y no supervisados (Weiss y Indurkhya
Algoritmos supervisados (o predictivos) Predicen un dato (o uellos) desconocido a priori, a partir de otros conocidos.
Algoritmos no supervisados (o del descubrimiento del conoc
descubren patrones y tendencias en los datos.
8/9/2019 Adquisicion del conocimiento.pdf
30/34
Data Warehouse es una base de datos corporativa que se caracterizprocesar y depurar informacin de una o ms fuentes distintas.
8/9/2019 Adquisicion del conocimiento.pdf
31/34
Es un conjunto discreto de elementos objetivos acerca de distintos
pueden derivar de hechos, informacin, estadsticas o similares, tacomo derivados del clculo o de la experimentacin.
Los datos en s mismos, carecen de sentido, ya que solo describen lode manera parcial y no proporcionan juicio o interpretacin, ni favorecdecisiones.
8/9/2019 Adquisicion del conocimiento.pdf
32/34
Son el conjunto de datos dotados de relevancia y de propsitoconocimiento comunicado o recibido concerniente a hechos o particulares, es cualquier conocimiento adquirido mediante aprendizaje o instruccin. La informacin se construyen a travs de den cierto sentido, se le ha aplicado un control de calidad prevcontextual izado.
Los datos se convierten en informacin cuando se les aade un sentidcontextualizacin de los mismos, es decir, conocer para qu proprecolectados
8/9/2019 Adquisicion del conocimiento.pdf
33/34
Fusin de valores , informacin y experiencia
Aprensin de hechos, verdades o principios com
del estudio, investigacin o de la erudicin en ge
8/9/2019 Adquisicion del conocimiento.pdf
34/34
Links consultados:
1. http://msdn.microsoft.com/2. file:///C:/Users/optimus/Pictures/Mineria_Datos_Vallejos.pdf
Libros:
1. Base de datos de enrique Jos Reinosa, ed. alfaomega
http://msdn.microsoft.com/http://msdn.microsoft.com/http://msdn.microsoft.com/