base de datos distribuidas

Introducción

Emily Rubens 2013-1644

Rey Andrés 2013-1547

Juan Carlos 2012-1357

Francisco Gabriel 2012-1347

Brenst Cabrera 2013-1481

Base datos distribuidas (BDD)

Tipos de BDD

Ambientes de BDD

Objetivos de una BDD

Ventajas y desventajas

Base de datos DistribuidasUna base de datos distribuida (BDD) es un conjunto de múltiples bases de datos lógicamente relacionadas las cuales se encuentran distribuidas en diferentes espacios lógicos e interconectados por una red de comunicaciones. Dichas BDD tienen la capacidad de realizar procesamiento autónomo, esto permite realizar operaciones locales o distribuidas.

Breve Historia

La necesidad de almacenar datos de forma masiva dio paso a la creación de los sistemas de bases de datos. En 1970 Edgar Frank Codd escribió un artículo con nombre: "A Relational Model of Data for Large Shared Data Banks" ("Un modelo relacional para grandes bancos de datos compartidos"). Con este artículo y otras publicaciones, definió el modelo de bases de datos relacionales y reglas para poder evaluar un administrador de bases de datos relacionales.

Tipos de Base de datos distribuidas.

Centralizada, Replicada , Fragmentada, e

Híbrida.

Centralizada: Es muy similar al modelo de

Cliente/Servidor en el sentido que la BDD está

centraliza en un lugar y los usuario están

distribuidos.

Replicadas: El esquema de BDD de replicación

consiste en que nada nodo debe tener su copia

completa de la base de datos.

Tipos de Base de datos distribuidas.

Particionadas: Este modelo consiste en que solo hay

una copia de cada elemento, pero la información

esta distribuida a través de los nodos. La

fragmentación se puede realizar también de tres

formas:

• Horizontal

• Vertical

• Mixto

Hibrida: Este esquema simplemente representa la

combinación del esquema de partición y replicación.

Se partición la relación y a al vez los fragmentos están

selectivamente replicados a través del sistema de BDD.

Un Sistema de base de datos distribuida o SBDDEs entonces el resultado de la integración de una base de

datos distribuida con un sistema para su manejo.

SMBDD o Sistema de Manejo de Base de datos. Es aquel que

se encarga del manejo de la BDD y proporciona un

mecanismo de acceso que hace que la distribución sea

transparente a los usuarios.

Ambientes de bases de datos

distribuidas.

Las BDD pueden ser:

Homogéneas:

Todos los sitios tienen el mismo SGBD.

Heterogéneas:

Cada sitio puede tener un SGBD distinto así como esquemas

diferentes.

Los ambientes en los que se encuentra con mayor

frecuencia el uso de las bases de datos distribuidas son:

Cualquier organización que tiene una estructura

descentralizada. Casos típicos de los anterior son:

organismo gubernamentales y/o de servicio privado.

La industria de la manufactura, particularmente,

aquella con plantas múltiples. Por ejemplo, la industria

automotriz.

Aplicaciones de control y comando militar.

Líneas de transportación aérea.

Cadenas hoteleras.

Servicios bancarios y financieros.

Objetivos de las Base de datos

distribuidas 1. Autonomía Local.Los sitios de un sistema distribuido deben ser autónomos. La autonomía local significa que todas las operaciones en un sitio dado se controlan en ese sitio; ningún sitio X deberá depender de algún otro sitio Y para su buen funcionamiento (pues de otra manera el sitio X podría ser incapaz de trabajar, aunque no tenga en sí problema alguno, si cae el sitio Y, situación a todas luces indeseable) La autonomía local implica también un propietario y una administración locales de los datos, con responsabilidad local: todos los datos pertenecen " en realidad" a una base de datos local, aunque sean accesibles desde algún sitio remoto.

2. No dependencia de un sitio central. La autonomía local implica que todos los sitios deben tratarse igual; no debe haber dependencia de un sitio central "maestro" para obtener un servicio central, como por ejemplo un procesamiento centralizado de las consultas o una administración centralizada de las transacciones, de modo que todo el sistema dependa de ese sitio central.

3. Operación continua.En un sistema distribuido, lo mismo que en uno no distribuido, idealmente nunca debería haber necesidad de apagar a propósito el sistema Es decir, el sistema nunca debería necesitar apagarse para que se pueda realizar alguna función, como añadirse un nuevo sitio o instalar una versión mejorada del DBMS en un sitio ya existente.

4. Independencia con respecto a la localización.La idea básica de la independencia con respecto a la localización (también conocida como transparencia de localización) es simple : no debe ser necesario que los usuarios sepan dónde están almacenados físicamente los datos, sino que más bien deben poder comportarse – al menos desde un punto de vista lógico - como si todos los datos estuvieran almacenados en su propio sitio local.

5. Independencia con respecto a la fragmentación.Un sistema maneja fragmentación de los datos si es posible dividir una relación en partes o "fragmentos" para propósitos de almacenamiento físico.

6. Independencia de réplica.Un sistema maneja réplica de datos si una relación dada (ó en términos más generales, un fragmento dado en una relación) se puede representar en el nivel físico mediante varias copias réplicas, en muchos sitios distintos.

7. Procesamiento distribuido de consultas.El sistema debe ser capaz de procesar consultas que afecten a datos de más de un sitio y hacerlo de forma optimizada. Este hecho puede ser considerado como otra razón por la que los sistemas distribuidos siempre son relacionales (Las peticiones relacionales son optimizables , mientras que las no relacionales no lo son).

8. Manejo distribuido de transacciones.El manejo de transacciones tiene dos aspectos principales, el control de recuperación y el control de concurrencia, cada uno de los cuales requiere un tratamiento más amplio en el ambiente distribuido.

9. Independencia con respecto al equipo.En realidad, no hay mucho que decir acerca de este tema, el título lo dice todo. Las instalaciones de cómputo en el mundo real por lo regular incluyen varias máquinas diferentes -máquinas IBM, DEC, HP, UNISYS, PC etc.

o 10. Independencia con respecto al sistema operativo.Es obvia la conveniencia no sólo de poder ejecutar el mismo DBMS en diferentes equipos, sino también poder ejecutarlo en diferentes sistemas operativos y lograr que una versión MVS y una UNIX y una PC/DOS participen todas en el mismo sistema distribuido.

11. Independencia con respecto a la red.Si el sistema ha de poder manejar múltiples sitios diferentes, con equipo

distinto y diferentes sistemas operativos, resulta obvia la conveniencia de poder manejar también varias redes de comunicación distintas.

12. Independencia con respecto al DBMSBajo este título consideramos las implicaciones de relajar la suposición

de homogeneidad estricta.

Ventajas y desventajas Ventajas

Refleja una estructura organizacional - los fragmentos de la base de datos se ubican en los departamentos a los que tienen relación.

Autonomía local - un departamento puede controlar los datos que le pertenecen.

Disponibilidad - un fallo en una parte del sistema solo afectará a un fragmento, en lugar de a toda la base de datos.

Rendimiento - los datos generalmente se ubican cerca del sitio con mayor demanda, también los sistemas trabajan en paralelo, lo cual permite balancear la carga en los servidores.

Economía - es más barato crear una red de muchas computadoras pequeñas, que tener una sola computadora muy poderosa.

Modularidad - se pueden modificar, agregar o quitar sistemas de la base de datos distribuida sin afectar a los demás sistemas (módulos).

Desventajas

Complejidad - Se debe asegurar que la base de datos sea transparente, se debe lidiar con varios sistemas diferentes que pueden presentar dificultades únicas. El diseño de la base de datos se tiene que trabajar tomando en cuenta su naturaleza distribuida, por lo cual no podemos pensar en hacer joins que afecten varios sistemas.

Economía - la complejidad y la infraestructura necesaria implica que se necesitará una mayor mano de obra.

Seguridad - se debe trabajar en la seguridad de la infraestructura así como cada uno de los sistemas.

Integridad - Se vuelve difícil mantener la integridad, aplicar las reglas de integridad a través de la red puede ser muy caro en términos de transmisión de datos.

Falta de experiencia - las bases de datos distribuidas son un campo relativamente nuevo y poco común por lo cual no existe mucho personal con experiencia o conocimientos adecuados.

Carencia de estándares - aún no existen herramientas o metodologías que ayuden a los usuarios a convertir un DBMS centralizado en un DBMS distribuido.

Diseño de la base de datos se vuelve más complejo - además de las dificultades que generalmente se encuentran al diseñar una base de datos, el diseño de una base de datos distribuida debe considerar la fragmentación, replicación y ubicación de los fragmentos en sitios específicos.

Ventajas y desventajas

Gracias por

escucharnos!

Fin de la

Presentación

base de datos distribuidas

Data & Analytics