diseño y análisis de sistemas: diseño de datos
Post on 16-Apr-2017
71 Views
Preview:
TRANSCRIPT
Diseño de Datos
Introducción
• Comienza con una revisión de los conceptos de diseño de datos y la terminología, a continuación, se analizan los sistemas basados en archivos y sistemas de bases de datos, incluyendo las bases de datos basadas en la Web
• Concluye con una discusión de almacenamiento de datos y de acceso, incluyendo herramientas estratégicas tales como el almacenamiento de datos y minería de datos, cuestiones de diseño físico, los registros lógicos y físicos, formatos de almacenamiento de datos y controles de datos
Conceptos de diseño de datos
Estructuras de datos Cada archivo o tabla
contiene datos sobre personas, lugares, cosas o eventos que interactúan con el sistema de información
Sistema de archivos orientado
Sistema de gestión de base de datos (DBMS)
Conceptos de diseño de datos
Información general sobre el procesamiento de archivos Procesamiento de
archivos puede ser eficiente y rentable en ciertas situaciones
Problemas potenciales Redundancia de datos Integridad de los datos Estructura de datos
rígido
Conceptos de diseño de datos
Información general sobre el procesamiento de archivos Varios tipos de archivos
Archivo maestro Archivo de la tabla Archivo de transacción Fichero de trabajo Archivo de Seguridad Archivo histórico
Conceptos de diseño de datos
• La evolución de los sistemas de archivos a Bases de Datos• Un sistema de gestión de base
de datos (DBMS) es un conjunto de herramientas, funciones e interfaces que permite a los usuarios añadir, actualizar, gestionar, acceder y analizar el contenido de una base de datos
• La principal ventaja de un DBMS es que ofrece acceso a datos oportuna, interactivos y flexibles
Conceptos de diseño de datos
La evolución de los sistemas de archivos a Bases de Datos Algunas ventajas
Escalabilidad Mejor soporte para los sistemas cliente / servidor Economía de escala El intercambio de datos flexible La aplicación de toda la empresa - administrador de la base (DBA) Normas más estrictas
Componentes de DBMS
• Interfaces para usuarios, administradores de bases de datos y sistemas relacionados• Usuarios
• lenguaje de consulta• Consulta por ejemplo
(QBE)• SQL (lenguaje de
consulta estructurado)• Los administradores de
bases de datos• Un DBA es responsable
de la gestión y el apoyo DBMS
Componentes de DBMS
Interfaces para usuarios, administradores de bases de datos y sistemas relacionados Sistemas de información relacionados
Un DBMS puede soportar varios sistemas de información relacionados que proporcionan las entradas a, y que requieren datos específicos de, el DBMS
No se requiere ninguna intervención humana para la comunicación de dos vías
Componentes de DBMS
Lenguaje de manipulación de datos Un lenguaje de manipulación de datos (DML) controla las
operaciones de bases de datos, incluyendo almacenar, recuperar, actualizar y borrar datos
Esquema La definición completa de una base de datos, incluyendo la
descripción de todos los campos, tablas y relaciones, se llama un esquema
También puede definir una o más esquemas parciales
Componentes de DBMS
Repositorio de datos físicos El diccionario de datos se transforma en un repositorio de
datos físicos, que también contiene el esquema y los esquemas parciales
El repositorio físico podría ser centralizado o distribuido en varios lugares
ODBC - conectividad abierta de bases de datos Java Database Connectivity - JDBC
Diseño de base de datos a través de Internet Characteristics of Web-Based Design
Diseño de base de datos a través de Internet Terminología de Internet
Navegador web Página web HTML (Hypertext Markup Language) Etiquetas Servidor web El sitio web
Diseño de base de datos a través de Internet Terminología de Internet
Intranet Extranet Protocols Web-centric Clients Servers
Diseño de base de datos a través de Internet• Conexión de una base de datos en la Web
• La base de datos debe estar conectado a Internet o intranet• Middleware
• Adobe ColdFusion
• Seguridad de datos• Sistemas bien diseñados proporcionan seguridad en tres niveles: la propia
base de datos, el servidor Web y los enlaces de telecomunicaciones que conectan los componentes del sistema
Terminología de Datos de diseño
Definiciones Entity Table or file Field Record
Tuple
Terminología de Datos de diseño
Campos clave Primary key Candidate key Foreign key Secondary key
Terminología de Datos de diseño
• Integridad referencial• Comprobaciones de validez
pueden ayudar a evitar los errores de introducción de datos
• En una base de datos relacional, la integridad referencial significa que un valor de clave externa no se puede introducir en una mesa a menos que coincide con una clave principal existente en otra tabla
• Huérfano
Diagramas Entidad-Relación
• Dibujo un ERD• El primer paso es hacer una
lista de las entidades que ha identificado durante el proceso de determinación de los hechos y que considere la naturaleza de las relaciones que los vinculan
• Un método popular es la de representar entidades como rectángulos y las relaciones como las formas de diamante
Diagramas Entidad-Relación
Tipos de relaciones Hay tres tipos de
relaciones pueden existir entre las entidades
Uno-a-uno (1: 1) relación de uno a muchos
(1: M) Muchos-a-muchos
relación (M: N)
Diagramas Entidad-Relación
Cardinalidad Notación cardinalidad Notación de pata de gallo Unified Modeling Language
(UML) Ahora que comprende los
elementos de base de datos y sus relaciones, puede empezar a diseñar tablas
Normalización
Formato estándar de notación El diseño de las tablas es más fácil si utiliza un
formato de notación estándar para mostrar la estructura, los campos, y la clave principal de una tabla
Ejemplo: Nombre (campo 1, campo 2, CAMPO 3)
Normalización
Repetición de los grupos y las unnormalized diseñoGrupos de repetición
A menudo se producen en los documentos manuales elaborados por los usuarios
Unnormalized Encerrar el grupo de repetición de los campos dentro de un
segundo conjunto de paréntesis
Normalización
Primera Forma Normal Una tabla está en primera forma normal (1NF) si no contiene un
grupo de repetición Para convertir, debe expandir la clave primaria de la tabla para
incluir la clave principal del grupo de repetición
Normalización
• Segunda Forma Normal• Un diseño de la tabla se encuentra en la segunda forma normal
(2NF) si está en 1NF y si todos los campos que no son parte de la clave primaria son funcionalmente dependiente de toda la clave primaria
• Existe un proceso estándar para la conversión de una tabla de 1NF a 2NF
• El objetivo es romper la tabla original en dos o más tablas nuevas y volver a asignar los campos para que cada campo sin clave dependerá de toda la clave primaria en la tabla
Normalización
• Tercera Forma Normal• 3NF diseño evita la redundancia y la integridad de los datos
problemas que todavía pueden existir en diseños 2NF• Un diseño de la tabla se encuentra en la tercera forma normal (3NF)
si está en 2NF y si no hay ningún campo sin clave depende de otro campo sin clave
• Para convertir la tabla a 3NF, debe quitar todos los campos de la tabla 2NF que dependen de otro campo sin clave y colocarlos en una nueva tabla que utiliza el campo sin clave como clave primaria
Normalización
A Ejemplo Normalización
Uso de códigos durante el diseño de datos Resumen de los códigos
Debido a que los códigos a menudo se utilizan para representar los datos, de que las encuentre constantemente en su vida cotidiana
Ahorran espacio de almacenamiento y costes, reducir el tiempo de transmisión de datos y reducir el tiempo de entrada de datos
Puede reducir los errores de introducción de datos
Uso de códigos durante el diseño de datos Tipos de Códigos
1. Códigos de secuencia2. Códigos de secuencia de
bloques3. Códigos alfabéticos4. Códigos numéricos significativos5. Códigos de derivación6. Códigos de cifrado7. Códigos de acción
Uso de códigos durante el diseño de datos
• El desarrollo de un Código1. Mantenga códigos concisos2. Permitir la expansión3. Mantenga códigos estables4. Hacer códigos únicos5. Utilice los códigos que se pueden ordenar
Uso de códigos durante el diseño de datos El desarrollo de un Código
6. Evitar códigos confusos7. Hacer códigos significativa8. Utilizar un código para un solo propósito9. Mantenga códigos coherentes
Diseño de base de datos: Un paso a la vez1. Crear un ERD inicial2. A continuación, cree un ERD3. Comprueba todos los elementos de datos4. Revisar los diseños 3NF para todas las tablas5. Compruebe todas las entradas del diccionario de datos
Después de crear sus diseños finales ERD y de la tabla normalizada, puede transformarlas en una base de datos
Modelos de bases de datos
Un ejemplo del mundo real de negocios Imagine una empresa que
proporciona servicio in situ para equipos electrónicos, incluyendo piezas y mano de obra
Modelos de bases de datos
Trabajar con una base de datos relacional Para entender el poder y la flexibilidad de una base de datos
relacional, pruebe el siguiente ejercicio Suponga que trabajan en ella, y el equipo de ventas necesita
respuestas a tres preguntas específicas Los datos pueden ser almacenados físicamente en siete
mesas
Almacenamiento de Datos y Acceso
El almacenamiento de datos y el acceso involucran herramientas estratégicas de negocio
Herramientas estratégicas para el almacenamiento de datos y el acceso Almacén de datos - Dimensiones Mercado de datos La minería de datos
Almacenamiento de Datos y Acceso
Lógico y físico de almacenamiento Almacenamiento lógico
Caracteres El elemento de datos o elemento de datos Registro lógico
Almacenamiento físico Registro físico o bloque Buffer Factor de bloqueo
Almacenamiento de Datos y Acceso
Codificación y almacenamiento de datos Binary digits Bit Byte EBCDIC, ASCII, and Binary Unicode
Almacenamiento de Datos y Acceso
Codificación de datos y almacenamiento El almacenamiento de fechas
Problema Y2K La mayoría de los formatos de fecha ahora se
basan en el modelo establecido por la Organización Internacional de Normalización (ISO)
Fecha absoluta
Control de datos
User ID Password Permissions Encryption Backup Recovery procedures Audit log files Audit fields
Resumen
Los archivos y las tablas contienen datos sobre personas, lugares, cosas o eventos que afectan el sistema de información
DBMS diseños son más potentes y flexibles que los sistemas orientado a ficheros tradicionales
Resumen
Una entidad-relación (ERD) es una representación gráfica de todas las entidades del sistema y las relaciones entre ellas
Un código es un conjunto de letras o números usados para representar datos en un sistema de
Los modelos de bases de datos más comunes son relacionales y orientadas a objetos
Resumen
• Almacenamiento lógico es visto a través de información de los ojos del usuario, independientemente de cómo o cuando esta información se organiza o se almacena en realidad
• Almacenamiento físico es relacionado con el hardware y consiste en bloques de lectura y escritura de datos binarios a los medios físicos
• Medidas de control de la base de datos de archivo y incluyen la limitación del acceso a los datos, encriptación de datos, procedimientos de copia de seguridad / recuperación, los archivos de pista de auditoría, y los campos de auditoría interna
top related