tarea1 vanesa chaluiza

5
UNIVERSIDAD CENTRAL DEL ECUADOR FACULTAD DE CIENCIAS FÍSICAS Y MATEMÁTICAS INFORMÁTICA Nombre: Vanesa Chaluiza Deber: Instalación de software R y paquetes. Materia: Minería de Datos Ejercicio #2: Proceda a instalar la plataforma R, para esto siga los siguientes pasos: Baje R desde http://www.r-project.org/ o desde nuestro sitio web. www.promidat.com enherramientas/Bodega de programas. Instálelo en su computador. Página de Instalación. Descarga según su versión del https://www.r-project.org/ sistema operativo. Proceso de Instalación Pantalla Inicial del Software

Upload: elizabeth-ch

Post on 31-Jan-2016

241 views

Category:

Documents


0 download

DESCRIPTION

campo

TRANSCRIPT

Page 1: Tarea1 Vanesa Chaluiza

UNIVERSIDAD CENTRAL DEL ECUADORFACULTAD DE CIENCIAS FÍSICAS Y MATEMÁTICAS

INFORMÁTICA

Nombre: Vanesa ChaluizaDeber: Instalación de software R y paquetes.Materia: Minería de Datos

Ejercicio #2: Proceda a instalar la plataforma R, para esto siga los siguientes pasos: Baje R desde http://www.r-project.org/ o desde nuestro sitio web.

www.promidat.com enherramientas/Bodega de programas. Instálelo en su computador.

Página de Instalación. Descarga según su versión del https://www.r-project.org/ sistema operativo.

Proceso de Instalación Pantalla Inicial del Software

Ejercicio #3: Proceda a instalar RStudio, para esto siga los siguientes pasos: Baje RStudio desde http://www.rstudio.com/ o desde nuestro sitio web.

www.promidat.com en herramientas/Bodega de programas. Instálelo en su computador. Proceso de Instalación Pantalla Inicial del Software

Page 2: Tarea1 Vanesa Chaluiza

Ejercicio #4: Proceda a instalar el paquete Rattle, para esto siga los pasos que se explican en el documento localizado en el Aula Virtual en la sección de “Material de Apoyo”, denominado "Presentación - Presentación Software e Instalación.PDF”.

Entregar: Un "print screen" en el que se observe que ya está instalado Rattle sobre la plataforma R.

LIBRERÍA RATTLE

Ejercicio #5: Proceda a instalar el paquete FactoMineR, para esto siga los siguientes pasos que se explican en el documento localizado en el Aula Virtual en la sección de “Material de Apoyo”, denominado "Presentación - Presentación Software e Instalación.PDF”.

Entregar: Un "print screen" en el que se vea que ya está instalado FactoMineR sobre la plataforma R.

Page 3: Tarea1 Vanesa Chaluiza

FACTOMINER

Ejercicio #6: Explique las principales diferencias entre Estadística y Minería de Datos.

La estadística generalmente analiza muestras de datos para luego hacer inferencia a toda la población, mientras que la minería de datos pretende buscar información útil usando toda la base datos.

La estadística en la mayoría de los casos supone que los datos se comportan de acuerdo a ciertas distribuciones de probabilidad (normal, binomial, geométrica, Poisson, etc), mientras que la minería de datos usa técnicas mucho más exploratorias que vienen de la IA, o del “Analyse des Données”.

A diferencia de la minería de datos, el análisis de datos usualmente no es automatizado, ni trata con volúmenes de datos tan grandes.

Ejercicio #7: Explique las principales diferencias entre una Base de Datos Operativa y una Bodega de Datos.

Aspectos BD operacional Data Warehouse

ObjetivoDe tipo operativo

(operaciones del día a día)

Análisis y toma de decisiones

Proceso De transacciones. Repetitivo y conocido.

De consultas masivas. Puntual y no conocido.

Actividad Predomina la actualización

Predomina la consulta

RendimientoImportancia del tiempo

de respuesta de la transacción instantánea

Importancia de la respuesta masiva.

Explotación Explotación de la información relacionada

Explotación de toda la información interna y

Page 4: Tarea1 Vanesa Chaluiza

Aspectos BD operacional Data Warehouse

con la operativa de cada aplicación

externa relacionada con el negocio

Volatilidad Actualizable Carga, pero no actualización

Usuarios Usuarios de perfiles medios o bajos

Usuarios de perfiles altos

Organización Estructura normalmente relacional

Visión multidimensional

Granularidad Datos generales desagregados, al detalle

Datos en distintos niveles de detalle y agregación

Horizonte histórico

30 a 90 días 5 a 10 años

Perspectiva Importancia del dato actual

Importancia del dato histórico

Volumen de datos

Pequeño/medio. Del orden del Mb a Gb.

Medio/grande. Del orden del Gb a Tb.