base de datos distribuidas
TRANSCRIPT
Introducción
Emily Rubens 2013-1644
Rey Andrés 2013-1547
Juan Carlos 2012-1357
Francisco Gabriel 2012-1347
Brenst Cabrera 2013-1481
Base datos distribuidas (BDD)
Tipos de BDD
Ambientes de BDD
Objetivos de una BDD
Ventajas y desventajas
Base de datos DistribuidasUna base de datos distribuida (BDD) es un conjunto de múltiples bases de datos lógicamente relacionadas las cuales se encuentran distribuidas en diferentes espacios lógicos e interconectados por una red de comunicaciones. Dichas BDD tienen la capacidad de realizar procesamiento autónomo, esto permite realizar operaciones locales o distribuidas.
Breve Historia
La necesidad de almacenar datos de forma masiva dio paso a la creación de los sistemas de bases de datos. En 1970 Edgar Frank Codd escribió un artículo con nombre: "A Relational Model of Data for Large Shared Data Banks" ("Un modelo relacional para grandes bancos de datos compartidos"). Con este artículo y otras publicaciones, definió el modelo de bases de datos relacionales y reglas para poder evaluar un administrador de bases de datos relacionales.
Tipos de Base de datos distribuidas.
Centralizada, Replicada , Fragmentada, e
Híbrida.
Centralizada: Es muy similar al modelo de
Cliente/Servidor en el sentido que la BDD está
centraliza en un lugar y los usuario están
distribuidos.
Replicadas: El esquema de BDD de replicación
consiste en que nada nodo debe tener su copia
completa de la base de datos.
Tipos de Base de datos distribuidas.
Particionadas: Este modelo consiste en que solo hay
una copia de cada elemento, pero la información
esta distribuida a través de los nodos. La
fragmentación se puede realizar también de tres
formas:
• Horizontal
• Vertical
• Mixto
Hibrida: Este esquema simplemente representa la
combinación del esquema de partición y replicación.
Se partición la relación y a al vez los fragmentos están
selectivamente replicados a través del sistema de BDD.
Un Sistema de base de datos distribuida o SBDDEs entonces el resultado de la integración de una base de
datos distribuida con un sistema para su manejo.
SMBDD o Sistema de Manejo de Base de datos. Es aquel que
se encarga del manejo de la BDD y proporciona un
mecanismo de acceso que hace que la distribución sea
transparente a los usuarios.
Ambientes de bases de datos
distribuidas.
Las BDD pueden ser:
Homogéneas:
Todos los sitios tienen el mismo SGBD.
Heterogéneas:
Cada sitio puede tener un SGBD distinto así como esquemas
diferentes.
Los ambientes en los que se encuentra con mayor
frecuencia el uso de las bases de datos distribuidas son:
Cualquier organización que tiene una estructura
descentralizada. Casos típicos de los anterior son:
organismo gubernamentales y/o de servicio privado.
La industria de la manufactura, particularmente,
aquella con plantas múltiples. Por ejemplo, la industria
automotriz.
Aplicaciones de control y comando militar.
Líneas de transportación aérea.
Cadenas hoteleras.
Servicios bancarios y financieros.
Objetivos de las Base de datos
distribuidas 1. Autonomía Local.Los sitios de un sistema distribuido deben ser autónomos. La autonomía local significa que todas las operaciones en un sitio dado se controlan en ese sitio; ningún sitio X deberá depender de algún otro sitio Y para su buen funcionamiento (pues de otra manera el sitio X podría ser incapaz de trabajar, aunque no tenga en sí problema alguno, si cae el sitio Y, situación a todas luces indeseable) La autonomía local implica también un propietario y una administración locales de los datos, con responsabilidad local: todos los datos pertenecen " en realidad" a una base de datos local, aunque sean accesibles desde algún sitio remoto.
2. No dependencia de un sitio central. La autonomía local implica que todos los sitios deben tratarse igual; no debe haber dependencia de un sitio central "maestro" para obtener un servicio central, como por ejemplo un procesamiento centralizado de las consultas o una administración centralizada de las transacciones, de modo que todo el sistema dependa de ese sitio central.
3. Operación continua.En un sistema distribuido, lo mismo que en uno no distribuido, idealmente nunca debería haber necesidad de apagar a propósito el sistema Es decir, el sistema nunca debería necesitar apagarse para que se pueda realizar alguna función, como añadirse un nuevo sitio o instalar una versión mejorada del DBMS en un sitio ya existente.
4. Independencia con respecto a la localización.La idea básica de la independencia con respecto a la localización (también conocida como transparencia de localización) es simple : no debe ser necesario que los usuarios sepan dónde están almacenados físicamente los datos, sino que más bien deben poder comportarse – al menos desde un punto de vista lógico - como si todos los datos estuvieran almacenados en su propio sitio local.
5. Independencia con respecto a la fragmentación.Un sistema maneja fragmentación de los datos si es posible dividir una relación en partes o "fragmentos" para propósitos de almacenamiento físico.
6. Independencia de réplica.Un sistema maneja réplica de datos si una relación dada (ó en términos más generales, un fragmento dado en una relación) se puede representar en el nivel físico mediante varias copias réplicas, en muchos sitios distintos.
7. Procesamiento distribuido de consultas.El sistema debe ser capaz de procesar consultas que afecten a datos de más de un sitio y hacerlo de forma optimizada. Este hecho puede ser considerado como otra razón por la que los sistemas distribuidos siempre son relacionales (Las peticiones relacionales son optimizables , mientras que las no relacionales no lo son).
8. Manejo distribuido de transacciones.El manejo de transacciones tiene dos aspectos principales, el control de recuperación y el control de concurrencia, cada uno de los cuales requiere un tratamiento más amplio en el ambiente distribuido.
9. Independencia con respecto al equipo.En realidad, no hay mucho que decir acerca de este tema, el título lo dice todo. Las instalaciones de cómputo en el mundo real por lo regular incluyen varias máquinas diferentes -máquinas IBM, DEC, HP, UNISYS, PC etc.
o 10. Independencia con respecto al sistema operativo.Es obvia la conveniencia no sólo de poder ejecutar el mismo DBMS en diferentes equipos, sino también poder ejecutarlo en diferentes sistemas operativos y lograr que una versión MVS y una UNIX y una PC/DOS participen todas en el mismo sistema distribuido.
11. Independencia con respecto a la red.Si el sistema ha de poder manejar múltiples sitios diferentes, con equipo
distinto y diferentes sistemas operativos, resulta obvia la conveniencia de poder manejar también varias redes de comunicación distintas.
12. Independencia con respecto al DBMSBajo este título consideramos las implicaciones de relajar la suposición
de homogeneidad estricta.
Ventajas y desventajas Ventajas
Refleja una estructura organizacional - los fragmentos de la base de datos se ubican en los departamentos a los que tienen relación.
Autonomía local - un departamento puede controlar los datos que le pertenecen.
Disponibilidad - un fallo en una parte del sistema solo afectará a un fragmento, en lugar de a toda la base de datos.
Rendimiento - los datos generalmente se ubican cerca del sitio con mayor demanda, también los sistemas trabajan en paralelo, lo cual permite balancear la carga en los servidores.
Economía - es más barato crear una red de muchas computadoras pequeñas, que tener una sola computadora muy poderosa.
Modularidad - se pueden modificar, agregar o quitar sistemas de la base de datos distribuida sin afectar a los demás sistemas (módulos).
Desventajas
Complejidad - Se debe asegurar que la base de datos sea transparente, se debe lidiar con varios sistemas diferentes que pueden presentar dificultades únicas. El diseño de la base de datos se tiene que trabajar tomando en cuenta su naturaleza distribuida, por lo cual no podemos pensar en hacer joins que afecten varios sistemas.
Economía - la complejidad y la infraestructura necesaria implica que se necesitará una mayor mano de obra.
Seguridad - se debe trabajar en la seguridad de la infraestructura así como cada uno de los sistemas.
Integridad - Se vuelve difícil mantener la integridad, aplicar las reglas de integridad a través de la red puede ser muy caro en términos de transmisión de datos.
Falta de experiencia - las bases de datos distribuidas son un campo relativamente nuevo y poco común por lo cual no existe mucho personal con experiencia o conocimientos adecuados.
Carencia de estándares - aún no existen herramientas o metodologías que ayuden a los usuarios a convertir un DBMS centralizado en un DBMS distribuido.
Diseño de la base de datos se vuelve más complejo - además de las dificultades que generalmente se encuentran al diseñar una base de datos, el diseño de una base de datos distribuida debe considerar la fragmentación, replicación y ubicación de los fragmentos en sitios específicos.
Ventajas y desventajas
Gracias por
escucharnos!
Fin de la
Presentación