modelos de gestion de la informacion
DESCRIPTION
Diapositivas Básicas Maestría UPEMTRANSCRIPT
SISTEMAS DE INFORMACIÓN PARA LA GESTIÓN EMPRESARIAL
M. en I.S.C. Leonardo M. Moreno Villalba
OBJETIVOS GENERALES DE LA ASIGNATURA
• Comprenderá los conceptos básicos de los sistemas de información administrativa y aplicará los aspectos metodológicos para el desarrollo de sistemas de soporte para la toma de decisiones y un mejor funcionamiento.
CRITERIOS Y PROCEDIMIENTOS DE EVALUACIÓN Y ACREDITACIÓN • Entrega de reporte de ejercicios prácticos
realizados en el aula 20%• Entrega de cuadro sinóptico 20%• Entrega de trabajo de investigación
sobre la toma de decisiones 40% • Dos exámenes parciales 40%
TEMAS Y SUBTEMASIntroducción a los sistemas.
Orígenes de los sistemas de información.La toma de decisión basada en computadora.Los subsistemas de la tecnología.
Administración en el sistema organizacional.¿Qué es un sistema?La perspectiva organizacional en la administración de la información.
Sistemas de administración.Teoría de la administración.¿Cuáles son las funciones gerenciales?La información y la toma de decisiones.
El concepto de informática ante la dirección ¿Qué es la tecnología?La Importancia de la información tecnológica.¿Qué es el hardware y que es el software?.
TEMAS Y SUBTEMAS
Administración de la base de datos y telecomunicaciones.¿Cómo administrar una base de datos?Mecanismos para almacenar y procesar la información.Introducción a las telecomunicaciones.Las diferentes topologías de redes.
Generalidades sobre LAN, MAN Y WAN.El origen de la redes.Desarrollo de las redes de computadoraEl software necesario para el enlace y el manejo de datos.
Aplicaciones sobre redes.¿Qué es el downsizing?La aplicabilidad del downsizing y las aplicaciones cliente / servidor.
TEMAS Y SUBTEMASSistemas de información para la administración (MIS).
Subsistemas de información.Subsistemas de mercadotecnia y finanzas.Subsistemas de producción, recursos humanosSistemas de información ejecutiva.
Sistemas de procesamiento de transacciones, soporte a las dicciones, automatización de oficinas y sistemas basados en el conocimiento.
Revisión de sistemas de información (TPS, DSS, OA y KBS).La importancia de lo sistemas para la toma de decisionesAutomatización de oficinas.
Técnicas para el desarrollo de sistemas de información para la toma de decisiones.Análisis de sistema.Mecanismos y métodos para el análisis y el diseño
Diseño de sistemas de usuario final (End User Computing) .¿Qué es el mis?Diseño de sistema.El usuario de computadoras.
Administración de los recursos de información.La importancia de los recursos.La administración eficiente.
Orígenes de los Sistemas de Información
• Que es un Sistema?• Para que me sirve?• Se han utilizado antes
de el surgimiento de la era digital?
• En donde se utilizan actualmente?
Que es un sistema?• Conjunto de
componentes que interactúan entre sí para lograr un objetivo común.
Que es un sistema?• Podemos definir un sistema
como un conjunto de elementos que interaccionan entre sí, orientados a la consecución de un objetivo común.
• Un sistema suele estar situado en un entorno o ambiente con el que interactúa, recibe entradas y produce salidas.
Que es un sistema para una empresa?
• Conjunto de personas, datos y procedimientos que trabajan coordinadamente. Para alcanzar el objetivo de apoyar el funcionamiento de la organización. Haciendo posible que la empresa mantenga contacto con el medio ambiente que la rodea, es decir con: Clientes, Proveedores, Organizaciones Estatales de contralor y recaudación de impuestos y aportes, Funcionarios, Accionistas o propietarios.
Que es un Subsistema?• Se denominan
Subsistemas las partes que conforma un sistema. Cada subsistema tiene su propia vida, pero permite que el sistema sea un todo y produce una serie de variables para establecer el estado del sistema.
Para que me sirve un Subsistema?• La función y estructura de
un sistema puede ser estudiado, analizado y descrito a través de los subsistemas básicos.
Que es la información• La información es una
síntesis o extracto de los datos, pero no contiene redundancias. Por ello, la información puede ser tangible o intangible, pero siempre reducirá la incertidumbre sobre un estado o suceso.
Pero en síntesis que es la información• La información puede
comprenderse como un conjunto de conocimientos o hechos derivados de datos, que son por naturaleza repetitivos y redundantes, que describen un mundo que consiste en procesos y eventos que ocurren una y otra vez con pequeños cambios
De que esta compuesta?• la información la componen datos
que se han colocado en un contexto significativo y útil y se ha comunicado a un receptor, quien la utiliza para tomar decisiones.
• La información implica la comunicación y recepción de inteligencia o conocimiento. Evalúa y notifica, sorprende y estimula, reduce la incertidumbre, revela alternancias adicionales o ayuda a eliminar las irrelevantes o pobres, e influye sobre otros individuos y estimula acción
Orígenes de los Sistemas de Información
• Desde finales del siglo XIX hasta la actualidad, Documentación y tecnologías de la Información han evolucionado enriqueciéndose mutuamente en su desarrollo.
Orígenes de los Sistemas de Información
• Las diferentes etapas históricas por las que ha atravesado la tecnología electrónica han marcado importantes hitos en la historia de la Documentación.
• Al mismo tiempo, el crecimiento de la información y la evidente necesidad de su tratamiento, han provocado la proliferación de líneas de investigación en el campo de las Tecnologías de la Información.
Elementos empresariales
¿Qué es un sistema ERP?• Un sistema ERP es una aplicación informática que
permite gestionar todos los procesos de negocio de una compañía en forma integrada
• Por lo general este tipo de sistemas esta compuesto de módulos como Recursos Humanos, Ventas, Contabilidad y Finazas, Compras, Producción entre otros, brindado información cruzada e integrada de todos los procesos del negocio.
ERP “Personalizado”• Este software debe ser parametrizado y
adaptado para responder a las necesidades especificas de cada organización. Una vez implementado un ERP permite a los empleados de una empresa administrar los recursos de todas las áreas, simular distintos escenarios y obtener información consolidada en tiempo real.
¿A que conlleva la implementación de un ERP?
A un proceso de transformación
A una redefinición de procesos
A un incremento de la eficiencia y
competitividad
¿Que puede abarcar un ERP?
El objetivo de un sistema de ERP es
automatizar los procesos de una empresa
Módulos Principales de un Sistema ERP
1) Negocio
Comercio
Producción
Calidad
Mantenimiento
Módulos Principales de un Sistema ERP (Cont.)
2) Financiero
Gestión Financiera
Activos Fijos Proyectos
Control
Módulos Principales de un Sistema ERP (Cont.)
3) Propósito especial
Recursos humanos
Flujo de Trabajo
Soluciones Sectoriales
SISTEMAS FUNCIONALES DEL NEGOCIO• Los Sistemas Funcionales del Negocio son una variedad de tipos de Sistemas de
Información (conocidos como: procesamiento de transacciones, información gerencial, soporte de decisiones, etc.) caracterizados por el soporte a las funciones del negocio de contabilidad, finanzas, mercadeo, operaciones gerenciales y, gerencia de recursos humanos.
Ejemplos de Sistemas Funcionales del Negocio (O’Brien, 2004)
SISTEMAS DE PROCESAMIENTO DE TRANSACCIONESConocidos comúnmente como TPS (por las siglas en inglés de Transaction Processing Systems), son SI cross-functional que procesan los datos resultado de la ocurrencia de las transacciones (eventos que ocurren como parte del negocio: ventas, compras, depósitos, retiros, devoluciones, pagos, etc.) del negocio.
El ciclo del procesamiento de una transacción (O’Brien, 2004)
SISTEMAS DE SOPORTE DE DECISIONES
• Sistemas de Información basados en computador que proveen información interactiva que soporta a los gerentes y a los profesionales de los negocios durante el proceso de toma de decisiones.
• Los Sistemas de Soporte de Decisiones (DDS, por las siglas en inglés de Decisión Support Systems), usan:– Modelos analíticos,– Bases de datos especializadas,– Juicios y visiones de los propios tomadores de decisiones, y– Un proceso de modelaje interactivo basado en computador para
soportar las tomas de decisiones de negocio, semiestructuradas e inestructuradas.
SISTEMAS DE SOPORTE DE DECISIONES
Componentes de un Sistema de Soporte de Decisiones de Mercadeo Web-enabled(O’Brien 2004)
SISTEMAS EJECUTIVOS DE INFORMACIÓN
• Un Executive Information System (EIS), conocido también como Executive Support System (ESS), es una tecnología que emerge como respuesta a las necesidades de información de altos ejecutivos.
• Proveen rápido acceso a información actualizada, así como a reportes gerenciales.
• Son muy amigables, soportados por facilidades gráficas y proveen capacidades de elaboración de “reportes excepcionales” y de “búsqueda de detalles”.
• Están fácilmente conectados a servicios de información en línea y correo electrónico.
• Incluyen módulos para: soportar el análisis, las comunicaciones, la automatización de oficina y la inteligencia
FUNCIONALIDADES DE LOS EISAunque sus funcionalidades pueden variar, las más comunes son:
– Drill down (búsqueda detallada).– Factores críticos de éxito e indicadores claves de desempeño.– Acceso a estados actuales.– Análisis de tendencias.– Análisis “ad hoc”.– Reportes de excepción.– EIS inteligente.– Integración con un DSS.
Los DSS, los EIS e Internet. El Web es un medio perfecto para desarrollar Sistemas de Soporte a Decisiones y Sistemas Ejecutivos de Información, sobre aspectos globales para toda una organización; además, permite combinar las distintas capacidades de múltiples DSS e EIS, al mismo tiempo y desde cualquier lugar.
PORTALES DE INFORMACIÓN EMPRESARIAL• No confunda portales con los Sistemas Ejecutivos de Información que han
sido usados en algunas industrias por mucho tiempo. Los Portales son para todos en la compañía, y no sólo para ejecutivos. Se quiere gente al frente de las líneas de toma de decisiones usando browsers y portales más que ejecutivos usando software especializado de Sistemas Ejecutivos de Información (Ouellette, 1999).
• Un Portal de Información Empresarial (EIP, por las siglas en inglés de Enterprise Information Portal) es una aplicación Web integrada a la tecnología Intranet y a otras tecnologías, que da a todos los usuarios de la Intranet y a usuarios selectos de la extranet, acceder a una variedad de aplicaciones del negocio internas y externas, así como a servicios.
• Los componentes de un EIP lo pueden identificar como un DSS e-business que puede ser personalizado para ejecutivos, gerentes, empleados, proveedores, consumidores y otros socios de negocios.
PORTALES DE INFORMACIÓN EMPRESARIAL
Componentes de un Portal de Información Empresarial para la toma de decisiones(O’Brien 2004)
Concepto de red.Una red es, en definitiva, como un sistema de dos o más ordenadores (autónomos) que, mediante una serie de protocolos, dispositivos y medios físicos de interconexión, son capaces de comunicarse con el fin de compartir datos, hardware y software, proporcionando así acceso a un mayor número de recursos con un menor coste económico y facilitando su administración y mantenimiento.
TopologíaLa topología define la estructura de una red. La definición de topología puede dividirse en dos partes. la topología física, que es la disposición real de los cables (los medios) y la topología lógica, que define la forma en que los hosts acceden a los medios.
Topologías Físicas
Topologías Lógicas
La topología lógica de una red es la forma en que los hosts se comunican a través del medio. Los dos tipos más comunes de topologías lógicas son broadcast y transmisión de tokens.
Topologías Lógicas
La topología broadcast simplemente significa que cada host envía sus datos hacia todos los demás hosts del medio de red. Las estaciones no siguen ningún orden para utilizar la red, el orden es el primero que entra, el primero que se sirve.
Topologías LógicasLa transmisión de tokens controla el acceso a la red mediante la transmisión de un token electrónico a cada host de forma secuencial. Cuando un host recibe el token, eso significa que el host puede enviar datos a través de la red. Si el host no tiene ningún dato para enviar, transmite el token al siguiente host y el proceso se vuelve a repetir.
Modelo de referencia OSI.El modelo de referencia OSI permite que los usuarios vean las funciones de red que se producen en cada capa. Más importante aún, el modelo de referencia OSI es un marco que se puede utilizar para comprender cómo viaja la información a través de una red.
Modelo de referencia OSI.
En el modelo de referencia OSI, hay siete capas numeradas, cada una de las cuales ilustra una función de red específica. Esta división de las funciones de networking se denomina división en capas.
Los ERP en México(Video)
Caso Exito Implementación de Un ERP (SAP) Hospital Santa fe
Que es un CRM (Video)
Caso Éxito CRM Office Max
A que nos ayudan los ERP
Los sistemas ERP ayudan a la empresa a monitorear en tiempo real los datos generados y, por lo tanto, tenerles más confianza, es decir, que éstos sean más exactos al momento de revisarlos para tomar una decisión.
CRM - Customer Relationship Management
Un CRM se define como “la integración de tecnologías y los procesos de negocios usados para satisfacer las necesidades de los clientes durante cualquier interacción con los mismos
Que involucra un CRM
CRM involucra la adquisición, el análisis y el uso del conocimiento de los clientes con la finalidad de vender más productos o servicios y hacer dicho proceso de forma más eficiente.
CRM Ejemplo Típico
Un ejemplo típico de CRM está presente en algunas redes de supermercados. Con una simple tarjeta, que también facilita el proceso de pago de los clientes, se tiene en realidad la finalidad de permitir el almacenamiento de todas las compras de cada cliente, en cantidad, código, fecha y valor de cada producto adquirido. De esa manera, en una próxima promoción, el marketing será aún más dirigido y eficiente pues se hará con base en estas informaciones.
EL CRM solo se enfoca a la Venta?
La venta no se resume sólo a una simple digitación del pedido y su consecuente emisión de factura y de factura de crédito. Involucra al telemarketing, la preventa, el soporte postventa, la asistencia técnica, el historial de las últimas compras, el control de las pendencias es decir, la dirección y atención personalizada del cliente.
Call Center
Para realizar parte de estas tareas se utiliza el CTI ( Computer Telephone Interface) que pone a disposición la red de teléfonos como terminales de redes de computadoras.
E-commerce y Supply Chain Management (SCM)
En la Gestión de la Cadena de Suministro se añaden funcionalidades para la gestión de la demanda (Demand Planning, DP) y la planificación de las necesidades de distribución (Distribution Requirement Planning, DRP). Con estos módulos adicionales se prevé el cambio de paradigma en la producción: de producir para llenar almacenes (técnica denominada push, o empujar) a producir para satisfacer la demanda (pull, o tirar).
PLM: Product Lifecycle Management. Gestión del Ciclo de Vida del Producto
Tiene como objetivo dotar a las organizaciones de módulos que permitan el desarrollo de los productos, así como vías de comunicación y colaboración en el ciclo de vida del producto.
PLM Principales Módulos(Según SAP)
Gestión de los datos del ciclo de vida: planificar, gestionar y controlar el proceso de desarrollo del producto y permitir compartir procesos de diseño de producción
PLM Principales Módulos(Según SAP) Cont.
Gestión del proyecto y programa de desarrollo del producto: Herramientas asistidas por ordenador de: CAD (diseño), CAM (fabricación), CAE (ingeniería).
Gestión de la colaboración en el ciclo de vida: integra a todos los participantes en el desarrollo del producto (diseñador, proveedor de bienes, fabricante y cliente)
PLM Principales Módulos(Según SAP) Cont.
PLM Principales Módulos(Según SAP) Cont.
Gestión de la calidad: Incluir la gestión de calidad en todo el proceso del producto.
PLM Principales Módulos(Según SAP) Cont.
Gestión de activos en el ciclo de vida: gestionar activos físicos y equipos desde la primera idea de inversión hasta la amortización del activo.
PLM Principales Módulos(Según SAP) Cont.
Política de Seguridad e Higiene en el trabajo: minimizar los riesgos y reducir costes cumpliendo con las normas legales sobre S&H.
CRM una Mirada Organizacional o Tecnológica
Seminario CRM Parte 1
Seminario CRM Parte 2
Antes de implementar un ERP
Evaluar a todas las áreas o departamentos que conforman la estructura
En especial la de recursos humanos, que es la más difícil de implementar
Determinar el costo-beneficio del desarrollo y aplicación de un sistema como éstos.
Puntos a considerar antes de implementar un ERP “Pilares de Selección”
“El producto”: se refiere al sistema ERP,consideraciones técnicas y funcionales.
Primer Pilar.
Puntos a considerar antes de implementar un ERP “Pilares de Selección”
Segundo Pilar.
“Los procesos”: son las funciones que deben ser soportadas por el sistema ERP,.
Puntos a considerar antes de implementar un ERP “Pilares de Selección”
Adaptación: La implementación de un ERP implica una reingeniería de procesos cuyo
objetivo es adaptar a la empresa a los nuevos modelos de negocio.
Tercer Pilar.
Puntos a considerar antes de implementar un ERP “Pilares de Selección”
Las personas son los recursos humanos, los conocimientos y habilidades de los
involucrados en el ciclo de vida del sistema, usuarios, analistas, consultores y
directivos que empujan el proyecto.
Cuarto Pilar.
METODOLOGÍA PARA LASELECCIÓN DE UN SISTEMA ERP
El objetivo fundamental de MSSE es proveer una guía de pasos que ayude en la selección de un sistema ERP y la empresa consultora que se encargará del trabajo de implementación
Estructura de MSSEMSSE se organiza en tres fases las cuales se dividen en actividades:
- Fase 1 – Selección Del ERP
Fase1(Actividades)Actividad 1 – Documentar Necesidado Análisis De Necesidado Determinar Equipo De Proyecto
Fase 1 (Actividades)
Actividad 2 – Primera Seleccióno Búsqueda En El Mercadoo Primer Contacto Con Proveedoreso Entrevistar Posibles Candidatos y Recopilar Informacióno Armado De Listado De Criterios a tener En Cuentao Evaluar Los Candidatoso Documentación De La Selección y Armado Del Plan De Trabajo
Fase 1 (Actividades)
Actividad 3 – Selección Finalo Organizar Visitas A Los Proveedoreso Demostración Del Productoo Decisión Final – Negociación
Fase 2 (Selección Del Equipo De Consultaría)
Fase 2 Documentar Bases De LaBúsqueda
Actividad 1 – Documentar Bases De La Búsquedao Organizar la búsquedao Armar listado de criterios para seleccionar consultora
Fase 2 Documentar Bases De LaBúsqueda
Actividad 2 –Selección De Candidatoso Entrevistar Posibles Candidatos Y Recopilar Informacióno Evaluar Los Candidatoso Decisión Final – Negociación
Fase 3 Presentación y Planificación General Del Proyecto
Lo primero que se realiza es la selección del sistema a implementar (fase 1), luego se busca la empresa que realizará el trabajo (fase 2) y finalmente se hace una presentación conjunta del equipo y se arma un plan general del proyecto con el objetivo de que todas las partes involucradas organicen sus recursos (fase 3).
Fase 3 Presentación y Planificación General Del Proyecto
Si la empresa por decisiones corporativas o de cualquier índole se viera obligada a implementar un sistema ERP específico, MSSE podría ser usada a partir de la fase 2 para seleccionar la consultora. En cuyo caso la metodología puede utilizarse también para verificar 19 que el sistema que se debe implementar cumple con las necesidades de la empresa.
Arquitectura de un sistema ERP
Arquitectura de un sistema ERP
La arquitectura genérica descrita por David Sprott (2000), en esta se muestran todos los componentes que forman un sistema ERP. Los sistemas de ventajas competitivas son la automatización de los procesos de negocio que están soportados en dos infraestructuras:
• la infraestructura operacional de negocios • la infraestructura técnica.
Metodología de implantación de un sistema ERP
El primer paso en la implantación de un sistema ERP consiste en describirlos procesos de negocio que se quieren automatizar. El problema que se enfrenta aquí es: ¿cómo describir un proceso de negocio?
Proceso de negocio
“Un conjunto de tareas lógicamente relacionadas, las cuales atraviesan la estructura organizacional, que existen para conseguir un resultado bien definido dentro de un negocio; por lo tanto toman una entrada y le agregan valor para producir una salida, que puede ser un producto físico o un servicio”.
Etapas en la implantación de un sistema ERP.
Paso 1: Definición de procesos de negocio actualesExisten diferentes métodos para modelar procesos de negocio, uno de los
más reconocidos es el de definición de integración, IDEF (Mayer and deWitte, 1998).
Otra manera de modelar procesos es a través de los diagramas de actividades y casos de uso del lenguaje de modelado unificado UML (OMG, 2000; Busch et al, 1998).
Existen también métodos de descripción de procesos que pertenecen a compañías particulares: ARIS (Architecture of Integrated Information Systems), que basa el modelado de procesos a través de diagramas EPC (Scheer, 1999); o el método de ATT que utiliza en sus metodologías de mejora continua (AT&T Quality Steering Committee, 1988).
¿En que consiste describir un proceso de negocio?
Consiste en capturar el conocimiento de cómo esa organización realiza sus actividades para obtener un bien o un servicio. Una vez que se tiene descrito el proceso, éste puede ser utilizado para:
• Capacitar a nuevos empleados.
• Apoyar a la certificación de calidad de la organización.
• Establecer los requisitos de un sistema de información que lo soporte.
¿Pero que es un Proceso?
Los procesos son el conocimiento de la organización, pues establecen la forma en cómo esa organización trabaja para lograrsus metas. Los procesos se clasifican en diferentes categorías que van desde procesos de manufactura hasta procesos de negocio
Paso 2: Alineamiento de los procesos actuales contra las mejores prácticas implantadas en el sistema ERP
Una vez que los procesos actuales son descritos, se recomienda hacerles un rediseño de mejora. Al tener hechas las mejoras, se comparan contra los procesos denominados “mejores prácticas” que sonlos que un sistema ERP comercial trae programados. A los procesos resultantes de este rediseño y sus comparaciones se les denomina procesos de negocio propuestos.
Paso 2: Alineamiento de los procesos actuales contra las mejores prácticas implantadas en el sistema ERP
Este paso implica que los especialistas funcionales conozcan cómo son las mejores prácticas programadas en el sistema ERP comercial que se haya adquirido o que se contrate este conocimiento con especialistas del proveedor del sistema ERP.
Paso 3: Revisión y autorización de los procesos de negocio propuestosLos procesos de negocio propuestos se presentan para revisión y autorización de sus usuarios y de un conjunto de asesores, según lo establezca la organización. Ésta es una etapa de mucha interacción con los revisores, pues se evalúa la factibilidad de cada una de sus observaciones y, en su caso, se hacen los ajustes en los procesos. Como resultado de esta revisión se obtiene un proceso de negocio revisado.
Paso 4: Plan de trabajo e implantación de los procesos autorizados en el sistema ERP
Una vez que el proceso de negocio está autorizado, se elabora un plan de trabajo que determina cuáles son las tareas a realizar para implantarlo en el sistema ERP. Con este plan se establecen parámetros en el sistema ERP comercial, de tal manera que los procesos de negocio autorizados queden programados.
Paso 4: Plan de trabajo e implantación de los procesos autorizados en el sistema ERP
La determinación de los parámetros implica modificar todo lo referente a los procesos de mejores prácticas, de tal forma que éstos se conviertan en los procesos autorizados.
Paso 5: Evaluación y pruebas del proceso implantado y capacitación
Una vez que los procesos autorizados están programados en el sistema ERP, se tiene que hacer un plan de pruebas y un plan de capacitación de los usuarios finales del sistema. En seguida es necesario llevar a cabo estos planes, ajustando en el sistema ERP las desviaciones que se hayan encontrado en las pruebas.
Paso 6: Puesta en marcha y validación del proceso automatizadoLa puesta en marcha implica hacer los ajustes finales del sistema y transportarlo a la infraestructura computacional de producción. Esta etapa debe estar bien planeada porque es cuando el sistema entra en operación.
El desarrollo en cada una de las etapas plantea diferentes problemas que se deben solucionar de manera integral desde los implantadores del sistema hasta los encargados de tomar las decisiones.
Data warehouseM. En I.S.C. Leonardo M. Moreno V.
Que es un data warehouse?• William Inmon: un almacén de información
temática orientado a cubrir las necesidades de aplicaciones de los sistemas de Soporte de Decisiones (DSS) y de la Información para Directivos (EIS), que permite acceder a la información corporativa para la gestión, control y apoyo a la toma de decisiones.
Data Warehouse (Almacén de Datos)
• Un Almacén de Datos (o Data Warehouse) es una gran colección de datos que recoge información de múltiples sistemas fuentes u operacionales dispersos, y cuya actividad se centra en la “Toma de Decisiones”.
• Una vez reunidos los datos de los sistemas fuentes se guardan durante mucho tiempo, lo que permite el acceso a datos históricos; asílos Almacenes de Datos proporcionan al usuario una interfaz consolidada única para los datos, lo que hace más fácil escribir las consultas para la Toma de Decisiones.
Diferencias entre Base de Datos y Almacén de Datos
Base de Datos Operacional Almacén de Datos
Datos Operacionales Datos del negocio para Información
Orientados a las aplicaciones Orientados al sujeto, orientados al negocio
Información Actual Información actual e histórica
Detalladas Detalladas y resumidas
Cambian constantemente estables
Características del Almacén de Datos• Organizado en torno a temas.La información se clasifica en base a los
aspectos que son de interés para la empresa.• Integrado.Es el aspecto más importante. La integración de datos consiste en
convenciones de nombres, codificaciones consistentes, medida uniforme de variables, etc.
• Dependiente del tiempo. Esta dependencia aparece de tres formas:– La información representa los datos sobre un horizonte largo de tiempo.– Cada estructura clave contiene (implícita o explícitamente) un elemento de tiempo
(día, semana, mes, etc.).– La información, una vez registrada correctamente, no puede ser actualizada.
• No volátil.El Almacén de Datos sólo permite cargar nuevos datos y acceder a los ya almacenados, pero no permite ni borrar ni modificar losdatos.
Arquitectura del Data warehouse
OLTP (On-Line Transaction Processing)
• Son aplicaciones que definen el comportamiento habitual de un entorno operacional de gestión y ejecutan las operaciones del día a día. Algunas de las características más comunes de este tipo de transacciones podrían ser:
• Altas/Bajas/Modificaciones• Consultas rápidas, escuetas y
predecibles• Poco volumen de información
Transacciones rápidas• Gran nivel de concurrencia• Modo de actualización on-line• Baja redundancia de datos
OLAP (On-Line Analytical Process)
• Son aplicaciones que se encargan de analizar datos del negocio para generar información táctica y estratégica que sirve de soporte para la toma de decisiones. Mientras que las transacciones OLTP utilizan Bases de Datos Relacionales u otro tipo de archivos, OLAP logra su máxima eficiencia y flexibilidad operando sobre Bases de datos Multidimensionales
Middleware• Es un software que reside físicamente
entre un Cliente y en un Servidor de Comunicaciones localizado
Aplicaciones• EIS (Executive Information System)
– Son herramientas para proveer información estratégica a los ejecutivos mediante informes, comparativas y cuadros de mando multidimensionales.
• DSS (Decission Support System)– Herramienta de soporte para la toma de decisiones.
Incorpora reglas de decisión y análisis de datos no predefinidos en las posibilidades de un EIS.
Etapas de Diseño del Almacén de Datos• Origen (Source): Define los orígenes de datos del Almacén de Datos,
como los sistemas de Procesamiento de Transacciones en Línea (On-LineTransactionProcessing, OLTP), las fuentes de datos externas (datos sindicados, datos censales), etc.
• Integración (Integration): Define el mapeo entre los orígenes de datos y el propio Almacén de Datos.
• Almacén de Datos (Data Warehouse):Define la estructura del Almacén de Datos.
• Adaptación (Customization): Define el mapeo entre el Almacén de Datos y las estructuras empleadas por el cliente.
• Cliente (Client): Define las estructuras concretas que son empleadas por los clientes para acceder al Almacén de Datos, como Data Marts o aplicaciones OLAP.
Niveles por Etapa del Diseño del Almacén de DatosCada etapa se analiza desde tres niveles o perspectivas que se crean en el siguiente orden:
– Conceptual: Define el Almacén de Datos desde un punto de vista conceptual, es decir, desde el mayor nivel de abstracción y contiene únicamente los objetos y relaciones más importantes.
– Lógico: Abarca aspectos lógicos del diseño del Almacén de Datos, como la definición de las tablas y claves, la definición de los procesos ETL, etc.
– Físico: Define los aspectos físicos del Almacén de Datos, como el almacenamiento de las estructuras lógicas en diferentes discos o la configuración de los servidores de bases de datos que mantienen el almacén de datos.
Diagramas de FormalizaciónCada etapa o nivel necesita formalismos de modelado diferentes. Una aproximación es la siguiente, donde el diseñador del Almacén de Datos no necesita definir todos los diagramas que se especifican:
Estructura lógica del Almacén de Datos• Metadatos. Describen la estructura de los datos contenidos en el almacén.
– Están en una dimensión distinta al resto de niveles.
• Datos detallados actuales. Obtenidos directamente del procesado de los datos.– Forman el nivel más bajo de detalle.– Ocupan mucho espacio.– Se almacenan en disco, para facilitar el acceso.
• Datos detallados históricos. Igual que los anteriores, pero con datos correspondientes al pasado.– Se suelen almacenar en un medio externo, ya que su acceso es poco frecuente.
• Datos ligeramente resumidos. Primer nivel de agregación de los datos detallados actuales.– Corresponden a consultas habituales.– Se almacenan en disco.
• Datos muy resumidos. Son el nivel más alto de agregación.– Corresponden a consultas que se realizan muy a menudo y que se deben obtener muy rápidamente.– Suelen estar separados del Almacén de datos, formando Supermercados de Datos (Data Marts).
Estructura lógica del Almacén de Datos
Estructura física del Almacén de Datos
• La estructura física puede presentar cualquiera de las siguientes configuraciones:– Arquitectura centralizada. Todo el Almacén de datos se encuentra en un
´único servidor.– Arquitectura distribuida. Los datos del Almacén se reparten entre varios
servidores. Asignando cada servidor a uno o varios temas lógicos.– Arquitectura distribuida por niveles. Refleja la estructura lógica del
Almacén, asignando los servidores en función del nivel de agregación de los datos que contienen. Un servidor está dedicado para los datos de detalle, otro para los resumidos y otro para los muy resumidos.
DataMiningMinería de Datos
¿Por qué Data Mining?• El Data Mining es de gran utilidad para
quienes toman decisiones de alto nivel. • Hoy en día la demanda de información
estratégica corresponde a las organizaciones (tanto grandes como pequeñas) que desean obtener ventaja competitiva o bien posicionarse en el mercad
Definiciones de Data Mining• "Proceso de extracción de información oculta (antes
desconocida), de gran interés y potencialmente útil, de bases de datos de gran tamaño".
• “Descubrimiento de patrones ocultos de grandes bases de datos, preferentemente Data Warehouse o Data Marts, con el objetivo de ayudar a las organizaciones a tomar mejores decisiones sobre la base del conocimiento obtenido”
Definiciones de Data Mining• "Búsqueda de relaciones y patrones existentes en grandes
bases de datos pero que se encuentran ‘ocultos’ en grandes volúmenes de datos, como por ejemplo, relaciones entre datos de pacientes y su diagnóstico médico. Estas relaciones representan un conocimiento valioso acerca de la base de datos y los objetos que residen en ellas".
• "Utilización de una gran variedad de técnicas para identificar ‘pepitas’ de información o conocimiento en los datos y extraerlos de manera que puedan ser utilizados en área
Que es Data Mining?• Data Mining es el proceso de extracción de
información oculta y predecible de grandes bases de datos.
• Un Sistema Datamining es una tecnología de soporte para usuario final cuyo objetivo es extraer conocimiento útil y utilizable a partir de la información contenida en las bases de datos de las empresas.
Que hacen las herramientas de Data Mining?
• Las herramientas de Data Mining predicen futuras tendencias y comportamientos, permitiendo en los negocios tomar decisiones proactivas y orientadas por un conocimiento acabado de la información. Las herramientas de Data Mining pueden responder a preguntas de negocios que tradicionalmente consumen demasiado tiempo para poder ser resueltas y a los cuales los usuarios de esta información casi no están dispuestos a aceptar.
¿Qué puede hacer el Data Ming?• Predicción automática de
comportamientos.• Predicción automática de tendencias.• Descubrimiento automático de
comportamientos desconocidos anteriormente.
Técnicas mas comunes del Data Mining.• Redes Neuronales.
– Son modelos no-lineales inspirados en las redes de neuronas biológicas y se usan generalmente en problemas de clasificación y predicción.
• Arboles de decisión. – Son estructuras en forma de árbol que representan conjuntos de decisiones capaces de
generar reglas para la clasificación de los datos.• Algoritmos genéticos.
– Son modelos inspirados en la evolución de las especies y que se aplican generalmente en problemas de optimización. Permiten incluir fácilmente ligaduras complicadas que limitan la solución a un problema.
• Clustering. – Métodos de agrupación de datos que nos permiten clasificar los datos por su similitud entre
ellos. Son utilizadas con frecuencia para entender los grupos naturales de clientes en empresas o bancos
Proceso de Data Mining• El proceso de descubrimiento de conocimiento (KDD
process) se divide en una serie de etapas que permiten identificar el problema a resolver, preparar los datos e interpretar los resultados.
• De manera general, este proceso comprende tres fases genéricas: – Preparación de los datos. – Operaciones de extracción (o minería). – Presentación de los resultados.
Proceso de Data Mining• Las fases genéricas se pueden desglosar en siete etapas que
permiten una mejor comprensión del proceso, estas son:
Proceso de Data Mining• Identificación del problema.
– Para hacer un buen uso del Data Mining, hay que tener muy claro los objetivos que se quieren obtener, estos objetivos deben tener relación con la organización que emprende el proyecto de Data Mining y con los datos con los que se va a trabajar. No todo problema requiere de una solución mediante Data Mining.
Proceso de Data Mining• Selección de los datos:
– Fase que incluye la adquisición de diversos datos que pueden residir en una o más base de datos, pudiendo ser una base de datos transaccional, un Data Warehouse o un Data Mart.
Proceso de Data Mining• Preparación de los datos:
– Esta etapa corresponde a la consolidación de los datos en una sola base de datos. Considera la identificación y corrección de inconsistencias en la definición de los datos, diferencias de codificación y resuelve la discordancia de múltiples valores para un mismo dato.
Proceso de Data Mining• Construcción del modelo:
– Construir un modelo en una situación donde se conoce la respuesta y luego se aplica en otras situaciones en la que se desconoce la respuesta.
– Un modelo es una abstracción de la realidad. No puede predecir todos los eventos individuales, pero un buen modelo es una guía útil para entender la organización y sugerir acciones que permitan lograr el éxito.
Proceso de Data Mining• Construcción del modelo: – Cada una de las diversas técnicas que utiliza el Data Mining genera dos clases
de modelos, el modelo predictivo y el modelo descriptivo.
• Un modelo predictivo utiliza datos con resultados conocidos para predecir valores para diferentes datos y guiar la estrategia y planificación de la organización.
• Los modelos descriptivos describen patrones en datos existentes para guiar la toma de decisiones.
– La principal diferencia entre estos dos modelos, es que los modelos predictivos realizan predicciones explícitas (ejemplo: la probabilidad de un fraude), mientras que los modelos descriptivos realizan predicciones implícitas (asumen que ciertas características pueden presentarse en colecciones de datos similares).
Proceso de Data Mining• Descubrimiento de patrones:
– En esta fase se aplican algoritmos para generar los patrones, esto resultará más efectivo si se aplica un proceso de exploración asistido por el ordenador.
– Es imprescindible conocer que se entiende por patrones y su diferencia con los conceptos de hechos, reglas y excepciones.
Proceso de Data Mining• Descubrimiento de patrones:
– Los patrones corresponden a “un conjunto de filas que comparten los mismos valores en dos o más columnas”. Observando la siguiente tabla que contiene datos generales de alumnos:
Proceso de Data Mining• Descubrimiento de patrones:
– Se tiene que tres filas (1,2,5) comparten los mismos valores en dos columnas (Ciudad y Año Ingreso), de lo cual se pude deducir la siguiente sentencia:
“La mayoría de los alumnos de Lota ingresan en 1995”.
Proceso de Data Mining• Descubrimiento de patrones:
– La confianza es el porcentaje específico de ocurrencia y se expresa como un porcentaje. La confianza de la sentencia anterior se calcula dividiendo el número de filas que tiene el atributo “Lota” y 1995, o sea 3, por el número de filas que tiene “Lota” y cualquier Año de Ingreso, o sea 4, por lo tanto resulta una confianza del 75%. Cuando la confianza es de 100% se utiliza el término “Todos”, por ejemplo:
“Todos los alumnos de Chillan ingresan en 1994”.
– También es posible presentar un patrón especificando su porcentaje, para el ejemplo inicial:
“25% de los alumnos de Lota ingresan en 1994”.
Proceso de Data Mining• Descubrimiento de patrones:
– Las excepciones se definen como un patrón débil que existe junto con las filas de patrones más poderosos.
– Observando la tabla, la fila 3 es una excepción, puesto que es el único registro que no posee en el campo Año Ingreso el valor de “1995”, como en el resto de los casos que tienen en el campo Ciudad el valor de “Lota”, esto también se puede entender como un error.
Proceso de Data Mining• Descubrimiento de patrones:
– Las excepciones se definen como un patrón débil que existe junto con las filas de patrones más poderosos.
– La diferencia entre hecho y regla, esta dado por la representación o forma en cómo se expresa. Por ejemplo las siguientes sentencias representan a un mismo patrón:Hecho:
La mayoría de los alumnos de Lota ingresan en 1995
Regla:
Sí Ciudad = Lota entonces Año Ingreso = 1995
Proceso de Data Mining• Despliegue de patrones:– Posterior a la construcción del modelo y al
descubrimiento de patrones, se debe evaluar sus resultados e interpretar su significado. Cuando se realiza la validación de los patrones, se encuentra una razón de exactitud. Es importante recordar que esta razón se aplica sólo a los datos con los cuales se construyó el modelo.
Proceso de Data Mining• Monitorización del modelo:
– Tal como cambian los procesos de negocio durante el tiempo, la validez de los patrones descubiertos a partir de los datos históricos pueden verse deteriorados. Es muy importante detectar estos cambios lo más temprano posible, a través de la monitorización constante con relación a los nuevos datos.
Pasos del proceso de descubrimiento de conocimiento• Estudio del dominio de aplicación:
– conocimiento previo y objetivos de uso.
• Creación de un juego de datos objetivo: selección de datos.• Data Cleaning (limpieza de datos) y proceso previo:
– ¡(puede ser el 60 % del esfuerzo!).
• Reducción de datos y transformación: Encontrar rasgos útiles, reducir las dimensionalidad/variabilidad y la representación invariante.
• Elegir las funciones de Data Mining para resumir, clasificar, asociar y agrupar datos.
• Elegir los algoritmos de mining.• Data Mining
Pasos del proceso de descubrimiento de conocimiento• Evaluación de modelos y presentación de los conocimientos:
– Visualización, transformación, eliminación de los modelos redundantes, etc.
• Uso del conocimiento descubierto.
¿En qué tipos de datos se usa Data Mining?• Bases de datos relacionales.• Depósitos de datos.• Bases de datos transaccionales.• Bases de datos avanzadas y en depósitos de información:
– Bases de datos orientadas a objetos y bases de datos relacionadas a objetos.
– Bases de datos espaciales. – Datos de series temporales.– Bases de datos de texto y multimedia.– Bases de datos heterogéneas y de herencia.– World Wide Web (WWW).
Clasificación de sistemas Data Mining
• Funcionalidad general:– Data Mining descriptiva.– Data Mining predictiva.
• Según los tipos de bases de datos para ser extraídas o minadas:– Relacionales, transaccionales, orientadas a objetos, relacionalobjeto,
activa, espacial, temporales, de texto, multimedia, heterogéneas, de herencia, WWW, etc.
• Según los tipos de conocimientos para ser descubiertos:– De caracterización, discriminación, asociación, clasificación,agrupación,
tendencias, desviaciones y análisis outlier.– Funciones múltiples integradas y extracciones de niveles múltiples.