Tarea1 Vanesa Chaluiza
-
Upload
elizabeth-ch -
Category
Documents
-
view
243 -
download
0
description
Transcript of Tarea1 Vanesa Chaluiza
UNIVERSIDAD CENTRAL DEL ECUADORFACULTAD DE CIENCIAS FÍSICAS Y MATEMÁTICAS
INFORMÁTICA
Nombre: Vanesa ChaluizaDeber: Instalación de software R y paquetes.Materia: Minería de Datos
Ejercicio #2: Proceda a instalar la plataforma R, para esto siga los siguientes pasos: Baje R desde http://www.r-project.org/ o desde nuestro sitio web.
www.promidat.com enherramientas/Bodega de programas. Instálelo en su computador.
Página de Instalación. Descarga según su versión del https://www.r-project.org/ sistema operativo.
Proceso de Instalación Pantalla Inicial del Software
Ejercicio #3: Proceda a instalar RStudio, para esto siga los siguientes pasos: Baje RStudio desde http://www.rstudio.com/ o desde nuestro sitio web.
www.promidat.com en herramientas/Bodega de programas. Instálelo en su computador. Proceso de Instalación Pantalla Inicial del Software
Ejercicio #4: Proceda a instalar el paquete Rattle, para esto siga los pasos que se explican en el documento localizado en el Aula Virtual en la sección de “Material de Apoyo”, denominado "Presentación - Presentación Software e Instalación.PDF”.
Entregar: Un "print screen" en el que se observe que ya está instalado Rattle sobre la plataforma R.
LIBRERÍA RATTLE
Ejercicio #5: Proceda a instalar el paquete FactoMineR, para esto siga los siguientes pasos que se explican en el documento localizado en el Aula Virtual en la sección de “Material de Apoyo”, denominado "Presentación - Presentación Software e Instalación.PDF”.
Entregar: Un "print screen" en el que se vea que ya está instalado FactoMineR sobre la plataforma R.
FACTOMINER
Ejercicio #6: Explique las principales diferencias entre Estadística y Minería de Datos.
La estadística generalmente analiza muestras de datos para luego hacer inferencia a toda la población, mientras que la minería de datos pretende buscar información útil usando toda la base datos.
La estadística en la mayoría de los casos supone que los datos se comportan de acuerdo a ciertas distribuciones de probabilidad (normal, binomial, geométrica, Poisson, etc), mientras que la minería de datos usa técnicas mucho más exploratorias que vienen de la IA, o del “Analyse des Données”.
A diferencia de la minería de datos, el análisis de datos usualmente no es automatizado, ni trata con volúmenes de datos tan grandes.
Ejercicio #7: Explique las principales diferencias entre una Base de Datos Operativa y una Bodega de Datos.
Aspectos BD operacional Data Warehouse
ObjetivoDe tipo operativo
(operaciones del día a día)
Análisis y toma de decisiones
Proceso De transacciones. Repetitivo y conocido.
De consultas masivas. Puntual y no conocido.
Actividad Predomina la actualización
Predomina la consulta
RendimientoImportancia del tiempo
de respuesta de la transacción instantánea
Importancia de la respuesta masiva.
Explotación Explotación de la información relacionada
Explotación de toda la información interna y
Aspectos BD operacional Data Warehouse
con la operativa de cada aplicación
externa relacionada con el negocio
Volatilidad Actualizable Carga, pero no actualización
Usuarios Usuarios de perfiles medios o bajos
Usuarios de perfiles altos
Organización Estructura normalmente relacional
Visión multidimensional
Granularidad Datos generales desagregados, al detalle
Datos en distintos niveles de detalle y agregación
Horizonte histórico
30 a 90 días 5 a 10 años
Perspectiva Importancia del dato actual
Importancia del dato histórico
Volumen de datos
Pequeño/medio. Del orden del Mb a Gb.
Medio/grande. Del orden del Gb a Tb.