Post on 24-Sep-2019
REPUBLICA BOLIVARIANA DE VENEZUELAUNIVERSIDAD ALONSO DE OJEDAVICERRECTORADO ACADEMICO
FACULTAD DE INGENIERIA MENCION COMPUTACION
CATEDRA: MINERIA DE DATOS
Autor: Paolo Negron
CI: 25.941.675
Tutora: ing. Dennis Chirinos
Ciudad Ojeda, Junio 2018.
MINERIA DE DATOS
Es el proceso de detectar la información procesable de los
conjuntos grandes de datos. Utiliza el análisis matemático para deducir
los patrones en los datos. Normalmente, estos patrones no se pueden
detectar mediante la exploración tradicional de los datos porque las
relaciones son demasiado complejas o porque hay demasiado datos.
TECNICAS DE
MINERIA DE DATOS
Como ya se ha comentado, las técnicas de la minería de datos
provienen de la inteligencia artificial y de la estadística, dichas técnicas,
no son más que algoritmos, más o menos sofisticados que se aplican
sobre un conjunto de datos para obtener unos resultados.
Una de las técnicas más representativas es:
REDES
NEURONALES
Paradigmas de
aprendizaje
Aplicaciones
REDES NEURONALES
son un modelo computacional basado en un gran
conjunto de unidades neuronales simples (neuronas
artificiales), de forma aproximadamente análoga al
comportamiento observado en los axones de las
neuronas en los cerebros biológicos. Cada unidad
neuronal está conectada con muchas otras y los
enlaces entre ellas pueden incrementar o inhibir el
estado de activación de las neuronas adyacentes.
Cada unidad neuronal, de forma individual, opera
empleando funciones de suma. Puede existir una
función limitadora o umbral en cada conexión y en
la propia unidad, de tal modo que la señal debe
sobrepasar un límite antes de propagarse a otra
neurona. Estos sistemas aprenden y se forman a sí
mismos, en lugar de ser programados de forma
explícita, y sobresalen en áreas donde la detección
de soluciones o características es difícil de expresar
con la programación convencional.
• Aproximación de funciones, o el análisis de
regresión, incluyendo la predicción de series de
tiempo, aproximación de la capacidad y el
modelado.
• Clasificación, incluyendo el patrón y la secuencia
de reconocimiento, detección y de la toma de
decisiones secuencial.
• Procesamiento de datos , incluyendo el filtrado,
el agrupamiento, la separación ciega de fuentes
y compresión.
• Robótica, incluyendo manipuladores, que dirigen
la prótesis. De control, incluyendo control
numérico por ordenador .
El aprendizaje supervisado
Aprendizaje por refuerzo
Aprendizaje no supervisado
Las redes
con
memoria
La integración de los
componentes de memoria
externa con redes neuronales
artificiales tiene una larga
historia que se remonta a las
primeras investigaciones en
las representaciones
distribuidas y mapas de auto-
organización . Por ejemplo, en
memoria distribuida dispersa
los patrones codificados por
las redes neuronales se
utilizan como direcciones de
memoria para la memoria de
contenido direccionable, con
"neuronas" que sirven
esencialmente como dirección
codificadores y
decodificadores .
Software de
red neuronal
Tipos de redes
neuronales
artificiales
varían de aquellos con sólo una o
dos capas de lógica única
dirección, para muchos bucles
complejos multi-direccionales de
entrada de realimentación y capas.
En general, estos sistemas utilizan
algoritmos en su programación
para determinar el control y la
organización de sus funciones.
Software de la red neuronal se utiliza
para simular , la investigación ,
desarrollo y aplicación de redes
neuronales artificiales, redes neuronales
biológicas y, en algunos casos, una
gama más amplia de sistemas
adaptativos .
REDES NEURONALES
Las clases y
tipos de RNAs
Red Neural
dinámico
red neural física
red neuronal
oscilante
Red neuronal
asociativa (ASNN)
Red neuronal
feedforward (FNN)
La red neuronal
recurrente (RNN)
redes recurrentes
simples
La memoria a largo
plazo corto
Estática red
neuronal
perceptrón
Google / Mente
Profunda
memoria asociativa
holográfica
red neural
hibridación
redes neuronales
modulares
Técnicas de
Mireia de
datos
REDES
NEURONALES
REGRESION
LINEAL
ARBOLES DE DESICION REGLAS DE
ASOCIACION
AGRUPAMIENTO
O CLUSTERING
MODELOS
ESTADISTICOS
Que es?
Son un paradigma
de aprendizaje y
procesamiento
automático inspirado en
la forma en que funciona
el sistema nervioso.
Es la más utilizada
para formar
relaciones entre
datos. Rápida y
eficaz pero
insuficiente en
espacios
multidimensionales
donde puedan
relacionarse más de
2 variables.
Es un modelo de predicción
utilizado en el ámbito de la
inteligencia artificial y el análisis
predictivo, dada una base de
datos se construyen estos
diagramas de construcciones
lógicas, muy similares a los
sistemas de predicción basados
en reglas, que sirven para
representar y categorizar una
serie de condiciones que suceden
de forma sucesiva, para la
resolución de un problema.
Se utilizan para
descubrir hechos que
ocurren en común dentro
de un determinado
conjunto de datos.
Es un procedimiento de
agrupación de una serie
de vectores según
criterios habitualmente de
distancia; se tratará de
disponer los vectores de
entrada de forma que
estén más cercanos
aquellos que tengan
características comunes.
Es una expresión
simbólica en forma de
igualdad o ecuación que
se emplea en todos los
diseños experimentales y
en la regresión para
indicar los diferentes
factores que modifican la
variable de respuesta.
aplicaciones
reconocimiento de
patrones de voz,
imágenes, señales.
Asimismo se han
utilizado para encontrar
patrones de fraude
económico, hacer
predicciones en el
mercado financiero y
tiempo atmosférico.
• Informática
• Medicina
decisiones de inversión,
reinversión, políticas de créditos y
financiamiento a corto y largo
plazo.
Interés: descubrir
combinaciones de
pares atributo-valor que
ocurren con
frecuencia en un grupo
de datos
• Exploración de datos
• Minería de textos
• aplicación web
• Diagnósticos médicos
Ventajas
• Aprendizaje
• Auto organización
• Tolerancia a fallos
• Flexibilidad
• Tiempo real
Se tiene a disposición diferentes
soluciones a un problema o
situación.
Se pueden analizar los posibles
efectos que puede tener la toma
de una decisión determinada.
Es una ayuda práctica y útil para
representar los aspectos de una
decisión.
que las asociaciones
pueden existir entre
cualquiera de los
atributos.
• Alto rendimiento
• Alta disponibilidad
• Alta eficiencia
• Escalabilidad