01 bases de datos contenido semana 1

15
BASE DE DATOS SEMANA 1

Upload: mario-heredia-carrillo

Post on 18-Dec-2015

26 views

Category:

Documents


2 download

DESCRIPTION

bases de datos iacc semana 1 modulo 8 2015

TRANSCRIPT

  • ESTE DOCUMENTO CONTIENE LA SEMANA 1 1

    BASE DE DATOS

    SEMANA 1

  • ESTE DOCUMENTO CONTIENE LA SEMANA 1 2

    NDICE BASES CONCEPTUALES DEL MODELAMIENTO DE BASES DE DATOS RELACIONALES ................... 3 INTRODUCCIN ............................................................................................................................. 3 APRENDIZAJES ESPERADOS ........................................................................................................... 4 1. BASE DE DATOS ..................................................................................................................... 5 2. DBMS (DATABASE MANAGEMENT SYSTEM) ......................................................................... 6 3. MODELO ENTIDAD/RELACIN .............................................................................................. 9

    3.1. COMPONENTES DE UN MODELO ENTIDAD/RELACIN (E-R) ........................................ 9 3.1.1. ENTIDADES .......................................................................................................... 10 3.1.2. RELACIONES ......................................................................................................... 10 3.1.3. CARDINALIDAD DE LAS RELACIONES ................................................................... 10 3.1.4. ATRIBUTOS .......................................................................................................... 11

    3.2. CONSTRUCCIN DE UN MODELO DE DATOS ENTIDAD/RELACIN............................. 14 4. COMENTARIOS FINALES ...................................................................................................... 14 5. BIBLIOGRAFA ...................................................................................................................... 15

  • ESTE DOCUMENTO CONTIENE LA SEMANA 1 3

    BASES CONCEPTUALES DEL MODELAMIENTO DE BASES DE DATOS RELACIONALES

    INTRODUCCIN

    En un mundo globalizado como el actual, la informacin es un recurso imprescindible en

    cualquier empresa y para cualquier persona. Si no se cuenta con la informacin necesaria es

    imposible realizar cualquier proceso de toma de decisiones.

    Lamentablemente, la informacin no existe en s misma ni est disponible sin un proceso

    previo a su obtencin: la recopilacin de datos. Por lo anterior, se puede afirmar que los datos

    son los hechos que describen sucesos y entidades. Los datos son representados por variados

    tipos de smbolos, por ejemplo, letras del alfabeto, nmeros, puntos y rayas, seales con la

    mano y dibujos, entre otros.

    Los datos no tienen capacidad de comunicar un significado slo con su valor, por tanto, no

    pueden afectar el comportamiento de quien los recibe. Esto significa que un conjunto de

    datos aislados no constituye un aporte en un proceso de toma de decisiones.

    Por ejemplo, piense que en una sala existen cuatro mesas en cada esquina de la sala, en cada

    mesa existe un cuaderno, donde en el primero existe un nombre de una persona por cada

    hoja; en el segundo cuaderno, existe un apellido de una persona en cada hoja; en el tercero

    existe un nmero de RUT de una persona en cada hoja; en el cuarto cuaderno existe una

    direccin de email de una persona por cada hoja.

    Si se toma el cuaderno 1 y se lee cada hoja, esos nombres no sirven de nada, slo son datos de

    nombres; luego, si se toma slo el cuaderno 2, se leer una lista de apellidos que tambin son

    datos que aportan nada; lo mismo si se toma de forma individual el cuaderno 3 y el 4. Sin

    embargo, si se tuviese en un cuaderno el nombre, apellido, RUT y direccin de email de una

    persona, esto tiene un significado. Ello permite, por ejemplo, tomar la decisin de mandar un

    correo a una persona para comunicarse con sta. Por lo tanto, en este caso, no se tienen

    datos, sino informacin de la persona.

    De este modo, cuando se puede relacionar, ordenar, contextualizar o aplicar cualquier

    caracterstica a un conjunto de datos, que sea vlida para la persona que la lee, estos datos se

    transforman en informacin, la que s apoya un proceso de toma de decisiones.

    En consecuencia, es de suma importancia el estudio de cmo guardar datos de forma que las

    relaciones que existen entre ellos sean definidas, de manera que cuando se deseen leer los

    datos de una manera conjunta, estos entreguen informacin a la persona que los lee.

    Los conjuntos de datos relacionados deben mantener su valor comunicativo, es decir, deben

    aportar conocimiento. Para ello, se deben considerar las siguientes cualidades:

  • ESTE DOCUMENTO CONTIENE LA SEMANA 1 4

    Los datos almacenados deben ser precisos, esto es, contener informacin correcta, sin

    errores.

    La informacin debe ser oportuna, vale decir, estar disponible cuando se requiera.

    La informacin debe ser completa para cumplir sus fines, no se puede entregar

    informacin parcial, porque esto conducira a errores en el proceso de toma de

    decisiones.

    La informacin debe ser significativa: el interlocutor debe comprender la informacin y

    otorgarle el valor para el proceso de toma de decisiones. Dicho de otra forma, debe

    poseer el mximo contenido semntico posible, o sea, validar si la informacin es

    verdadera. Un punto importante es el volumen de informacin, condicin

    indispensable para que esta sea significativa. El exceso de informacin muchas veces

    hace que esta pierda significado.

    Debe ser ntegra y coherente, es decir, no contener errores y debe permitir

    relacionarla con otra informacin para que, en conjunto, apoyen el proceso de toma

    de decisiones.

    Hemos clarificado que datos no es lo mismo que informacin. Los datos y sus relaciones

    deben guardarse de manera que, al recuperarlos, se transformen en informacin til, la que

    cumpla con todas las cualidades requeridas. A la estructura que permite almacenar un

    conjunto de datos relacionados de manera ntegra y coherente se le denomina base de datos.

    APRENDIZAJES ESPERADOS Se espera que, al finalizar las actividades de estudio de esta semana, los alumnos estn en

    condiciones de sealar los elementos que componen la arquitectura de un sistema

    administrador de bases de datos relacionales (DBMS). Adicionalmente, se espera que los

    alumnos puedan reconocer el Modelo Entidad Relacin como una herramienta que permite

    representar un problema real y describir los componentes de un Modelo Entidad/Relacin.

  • ESTE DOCUMENTO CONTIENE LA SEMANA 1 5

    1. BASE DE DATOS

    Una base de datos es un conjunto de datos relacionados y pertenecientes a un mismo

    contexto, que son almacenados sistemticamente para su posterior uso.

    En este sentido, por ejemplo, una biblioteca puede considerarse una base de datos,

    compuesta en su mayora por documentos y textos impresos en papel e indexados para su

    consulta.

    Sin embargo, las bases de datos almacenadas y manejadas mediante computadores son un

    conjunto exhaustivo, no redundante, de datos estructurados, organizados

    independientemente de su utilizacin y su implementacin en mquinas accesibles en tiempo

    real y compatible con usuarios concurrentes con necesidad de informacin diferente.

    De la definicin anterior se desprenden ciertas caractersticas que posee una base de datos:

    Conjunto exhaustivo no redundante de datos: significa que no pueden existir datos

    repetidos.

    Datos estructurados organizados: implica que los datos poseen una definicin explcita

    de las relaciones existentes entre los datos almacenados en la base de datos.

    Datos organizados independientemente de su utilizacin: una de las caractersticas

    principales de una base de datos, a diferencia de otros sistemas antiguamente usados,

    es que los datos pueden ser utilizados por diferentes programas para objetivos

    distintos. Recordemos el ejemplo de la biblioteca, en que diferentes personas pueden

    consultar los textos deseados segn sus propios intereses.

    Deben ser accesibles en tiempo real y compatibles con usuarios concurrentes con

    necesidad de informacin diferente. Esta caracterstica es requerida para cumplir con

    la cualidad de oportunidad exigida a la informacin y para que esta sea accesible a

    muchos usuarios al mismo tiempo. Tal es el caso de los clientes de un banco que

    acceden a sus cuentas por internet: todos acceden al mismo tiempo a una misma base

    de datos, por lo que el sistema debe responder a todos sus clientes en forma

    concurrente.

    Para poseer estas caractersticas es necesario un ambiente que permita administrar los datos

    almacenados. De este modo, se asegura que se encuentren disponibles de la forma y en los

    tiempos que los usuarios lo requieran. Estos ambientes son los denominados sistemas

    administradores de bases de datos (DBMS), herramientas que permiten realizar este tipo de

    administracin.

  • ESTE DOCUMENTO CONTIENE LA SEMANA 1 6

    2. DBMS (DATABASE MANAGEMENT SYSTEM)

    Estos sistemas son tambin denominados sistemas de gestin de base de datos (SGBD). En

    trminos generales, son una coleccin de programas que permite a los usuarios crear y

    mantener una base de datos.

    Por lo tanto, un DBMS es un software de propsito general que facilita los procesos de

    definicin, construccin, manipulacin y comparticin de bases de datos, entre varios usuarios

    y aplicaciones.

    Los DBMS cumplen con todas las caractersticas definidas anteriormente para la informacin.

    Para esto, cuentan con las siguientes funcionalidades:

    Manipulacin de datos (consultar, actualizar, generar informes, entre otros).

    Compartir, permitiendo que varios usuarios y programas accedan a la base de datos en

    forma simultnea.

    Proteccin de la base de datos: proteccin del sistema y proteccin de la seguridad.

    Mantencin de la base de datos, permitiendo que el sistema evolucione, segn

    cambian los requerimientos.

    Es importante establecer en este punto que un sistema, aplicacin o software, por ejemplo el

    sitio web de un banco, es un conjunto de dos elementos: por una parte, el software, que es un

    programa que se construye con un lenguaje de programacin (por ejemplo Java), y una base

    de datos, que contiene los datos que son ingresados o recuperados por el programa y

    mostrados al usuario, segn este lo requiera.

    Por este motivo, es importante conocer cmo se estructura un DBMS y cmo interacta con

    una aplicacin, para que el usuario final obtenga los datos que requiere.

    Se establece, entonces, que los datos en una base de datos deben almacenarse de manera que

    se guarden tambin las relaciones existentes entre ellos. Por este motivo, a estos sistemas se

    les denomina sistemas relacionales. En este sentido, cuando se habla de una base de datos,

    nos referimos a bases de datos relacionales; en tanto, los DBMS que permiten su

    administracin son tambin sistemas de administracin de bases de datos relacionales.

    A continuacin, se muestra una figura con los componentes de un DBMS, junto con las

    estructuras externas con las que este interacta.

  • ESTE DOCUMENTO CONTIENE LA SEMANA 1 7

    Fuente: Villarroel, P. (2011). UNIACC.

    En la figura anterior, se identifica que un DBMS tiene cuatro componentes principales. Estos

    son:

    Software para procesar consultas: este componente del DBMS es el encargado de

    validar si la consulta que se le est realizando est bien escrita, o sea con la sintaxis

    correcta, y si el programa o la aplicacin que la realiza tiene los permisos para hacerlo.

    Software para acceder a los datos: este es el encargado de procesar la consulta y

    obtener los datos de respuesta. Para esto, debe acceder a dos porciones de la base de

    datos, a los metadatos y a la base de datos almacenados.

    Metadatos: es una base de datos interna del DBMS, en que se guarda la estructura de

    almacenamiento de los datos y las relaciones que existen entre ellos. Esto es, una

    definicin abstracta de los datos, cmo se organizan y se relacionan en la base de

    datos almacenada.

    Base de datos almacenada: son los datos propiamente tales.

    Por lo tanto, el USUARIO interacta slo con un componente externo al DBMS, que es el

    programa o aplicacin que efecta las consultas al DBMS. Para aclarar el funcionamiento,

    veamos el siguiente ejemplo.

    Suponga que un usuario ingresa al sitio del BancoEstado (www.bancoestado.cl). Para

    autentificarse, debe ingresar su RUT y clave. En esos momentos, el usuario est interactuando

    con la aplicacin, esto es, el programa del sitio del banco. Cuando presiona ENTER, luego de

    ingresar la clave y RUT, el programa se comunica con el DBMS, para as validar que el usuario

    existe en la base de datos del banco. Especficamente, se comunica con la primera parte del

    DBMS, que es el software para procesar consultas, que es el que valida si la consulta est

  • ESTE DOCUMENTO CONTIENE LA SEMANA 1 8

    correctamente realizada; si la respuesta es afirmativa, este software le solicita al software para

    acceder a los datos, que le entregue la informacin de la cuenta. En este momento, se le

    solicita a la estructura que guarda los metadatos, que diga dnde estn los datos en la base de

    datos almacenada, desde ah son recuperados los datos de las cuentas y los saldos

    correspondientes al usuario autentificado.

    La utilizacin de un DBMS trae asociado un conjunto de ventajas, entre ellas:

    Control de la redundancia, esto es, no existen datos repetidos.

    Restriccin del acceso no autorizado.

    Almacenamiento persistente para los objetos del programa.

    Suministro de estructuras de almacenamiento para un procesamiento eficaz de las

    consultas.

    Copia de seguridad y recuperacin.

    Suministro de varias interfaces de usuario.

    Representacin de relaciones complejas entre los datos.

    Implementacin de las restricciones de integridad.

    Inferencia y acciones usando reglas.

    Potencial para implementar estndares.

    Tiempo de desarrollo de aplicacin reducido.

    Flexibilidad.

    Disponibilidad de la informacin actualizada.

    Economas de escala, dado que diferentes programas pueden acceder a los mismos

    datos, de acuerdo con sus necesidades.

    Para la creacin y manipulacin de bases de datos, uno de los DBMS ms conocidos y usados

    del mercado es ORACLE. Otros de los DBMS ms conocidos son SQL Server y My SQL, en el

    caso de Open source.

    Una vez establecida la forma de funcionamiento de un DBMS, es necesario establecer un

    procedimiento para disear la estructura de una base de datos relacional, esto es, cmo

    definir la forma en que sern almacenados los datos y las relaciones existentes entre ellos. A

    esta estructura lgica de organizacin de datos y relaciones entre los datos se les denomina

    modelo de datos.

    Por lo tanto, cuando se desea construir un programa que realice un conjunto de funciones, por

    ejemplo, un programa que mantenga las notas de las asignaturas de su carrera y que calcule

    los promedios para establecer si ha aprobado o reprobado las asignaturas que cursa cada

    semestre, se debe construir el programa que realice estas funciones. Adems, se debe

    construir la base de datos que almacene sus datos, sus notas, los promedios, junto con las

    asignaturas aprobadas y reprobadas en cada semestre.

    Esto significa que la base de datos se debe disear para almacenar los datos requeridos para

    un problema especfico. Sin embargo, cuando dicha base de datos est construida, parte de

    estos datos en conjunto con datos adicionales pueden ser usados por otros sistemas. Por

  • ESTE DOCUMENTO CONTIENE LA SEMANA 1 9

    ejemplo, para el caso expuesto, un sistema que asigna los ramos para el prximo semestre, va

    a consultar los datos de las asignaturas aprobadas y reprobadas en el semestre anterior;

    siendo estos dos sistemas distintos, el primero sera el sistema de administracin acadmica y

    el segundo el sistema de toma de ramos.

    En definitiva, cada vez que se disea una base de datos para un sistema nuevo, este proceso

    debe considerar las estructuras de datos existentes actualmente. De este modo, no se repiten

    datos y se cumple con las caractersticas necesarias de integridad y redundancia.

    El nivel ms abstracto de definicin de la estructura de los datos se realiza mediante el uso de

    un modelo denominado modelo entidad/relacin. Este provee de una representacin grfica

    denominada diagrama entidad/relacin, mediante la cual se representan los datos por

    almacenar y las relaciones existentes entre ellos.

    3. MODELO ENTIDAD/RELACIN

    El diseo de la base de datos se simplifica cuando se utilizan modelos. Los modelos son

    abstracciones simplificadas de eventos y condiciones del mundo real. La importancia de los

    modelos radica en que si los modelos no son lgicamente buenos no se lograrn diseos de

    bases de datos funcionales que permitan obtener informacin til.

    Un modelo de base de datos es un conjunto de ideas lgicas, utilizadas para representar la

    estructura de datos y las relaciones entre ellos. Los modelos se agrupan en dos categoras:

    Modelos lgicos: se enfocan a la naturaleza lgica de la base de datos. Uno de los ms

    utilizados es el modelo entidad-relacin (E-R).

    Modelos fsicos: enfatizan en cmo los datos se representan en la base de datos o en

    cmo se ejecutan las estructuras de datos para representar lo que est modelado. A

    este tipo de modelo se denomina modelo de base de datos relacional.

    3.1. COMPONENTES DE UN MODELO ENTIDAD/RELACIN (E-R)

    El modelo entidad-relacin es un concepto de modelado para bases de datos. Fue propuesto

    por Peter Chen, en 1976. Mediante este se pretende visualizar los objetos que pertenecen a la

    base de datos, como entidades. Estas tienen atributos y se vinculan mediante relaciones.

    Como su nombre lo dice, este modelo cuenta con dos componentes bsicos: las entidades y las

    relaciones. A continuacin, se define cada uno de ellos.

    Existe una caracterstica especfica que diferencia unas relaciones de otras, esto es, la cantidad

    de elementos que existe en una entidad que se relaciona con otra cantidad de elementos de la

    otra entidad. A este concepto se denomina cardinalidad de la relacin.

  • ESTE DOCUMENTO CONTIENE LA SEMANA 1 10

    Adems, la informacin que se desea guardar sobre cada entidad (atributos) es tambin

    identificada en los diagramas entidad/relacin.

    3.1.1. ENTIDADES

    Es el objeto bsico representado por el modelo E-R, que corresponde a una cosa del mundo

    real con una existencia independiente.

    Una entidad puede ser un objeto con una existencia fsica (casa, persona, auto, etc.) o un

    objeto con una existencia conceptual (empresa, curso, cliente, etc.) sobre la que se tiene

    que reunir o guardar datos.

    Una entidad se representa con un rectngulo, el nombre de una entidad (sustantivo

    comn) en singular, como se muestra en las siguientes figuras.

    Fuente: Villarroel, P. (2011). UNIACC.

    Por ejemplo, cuando se habla del sistema que debe guardar las notas de las asignaturas que

    usted cursa en un determinado semestre, se identifican tres entidades: alumnos, notas y las

    asignaturas. Por tanto, se requiere guardar sus datos personales para efectos de asociarlos a

    las asignaturas que usted cursa y las notas obtenidas.

    3.1.2. RELACIONES

    Son asociaciones entre entidades sin existencia propia en el mundo real que se modela.

    Las relaciones son necesarias para reflejar las interacciones existentes entre entidades.

    La relacin se representa con un rombo, como se muestra en la siguiente figura.

    Fuente: Villarroel, P. (2011). UNIACC.

    3.1.3. CARDINALIDAD DE LAS RELACIONES

    Define el tipo de correspondencia o nmero de ocurrencias de una entidad que se

    relaciona con otra entidad.

    Las relaciones pueden ser de tres tipos:

  • ESTE DOCUMENTO CONTIENE LA SEMANA 1 11

    o Relaciones 1-1. Las entidades que intervienen en la relacin se asocian una a

    una (por ejemplo, la entidad HOMBRE, la entidad MUJER y, entre ellas, la

    relacin MATRIMONIO). Se representan colocando un 1 en cada extremo del

    rombo que representa la relacin.

    Fuente: Villarroel, P. (2011). UNIACC.

    o Relaciones 1-n. Una ocurrencia de una entidad est asociada con muchas (n)

    de otra (por ejemplo, la entidad EMPRESA, la entidad TRABAJADOR y entre

    ellos la relacin TRABAJAR-EN, o sea, muchos trabajadores trabajan en una

    empresa).

    Fuente: Villarroel, P. (2011). UNIACC.

    o Relaciones n-n. Cada ocurrencia, en cualquiera de las dos entidades de la

    relacin, puede estar asociada con muchas (n) de la otra y viceversa. Por

    ejemplo, si un trabajador tiene ms de un trabajo, esto se representara como

    muestra la siguiente figura. Se leera: en una empresa trabajan muchos

    trabajadores y un trabajador trabaja en muchas empresas.

    Fuente: Villarroel, P. (2011). UNIACC.

    3.1.4. ATRIBUTOS

    Son las propiedades o caractersticas particulares que describen a cada entidad.

    Una entidad en particular tendr un valor para cada uno de sus atributos.

    Los valores de los atributos que describen cada entidad se convierten en la parte principal

    de los datos almacenados en la base de datos, por ejemplo, para la entidad Empleados

  • ESTE DOCUMENTO CONTIENE LA SEMANA 1 12

    (como se muestra en la siguiente figura) se identifican los atributos: Nombre, Edad y

    Direccin.

    Fuente: Villarroel, P. (2011). UNIACC.

    Los atributos de una entidad son mostrados en un diagrama entidad-relacin en crculos.

    Cada atributo ligado a una entidad es unido al rectngulo que representa la entidad. Esto es

    mostrado en la siguiente figura.

    Fuente: Villarroel, P. (2011). UNIACC.

  • ESTE DOCUMENTO CONTIENE LA SEMANA 1 13

    En este ejemplo, se muestra que la entidad Empleado posee los atributos Nombre,

    Fecha_nacimiento, E_mail, mientras que la entidad Oficina posee los atributos Nombre y

    Direccin.

    En resumen, la estructura lgica de los datos que sern almacenados en la base de datos se

    define por la suma de los siguientes factores: identificacin de las entidades sobre las cuales se

    desea guardar informacin, informacin por guardar (representada por los atributos),

    relaciones que existen entre estas entidades, ms la cardinalidad de cada una de estas

    relaciones.

    Ejemplo:

    Fuente: Villarroel, P. (2011). UNIACC.

    Al examinar este ejemplo, se puede establecer lo siguiente:

    El problema de la realidad que se est diseando se representa por cinco entidades. Estas son:

    Curso

    Profesor

    Estudiante

    Clase

    Sala

  • ESTE DOCUMENTO CONTIENE LA SEMANA 1 14

    Las relaciones existentes entre las entidades son las siguientes:

    Una sala es utilizada por muchos cursos, muchos cursos utilizan una sala.

    Un profesor realiza muchas clases, muchas clases son realizadas por un profesor.

    3.2. CONSTRUCCIN DE UN MODELO DE DATOS

    ENTIDAD/RELACIN

    El proceso de definicin de un modelo entidad-relacin considera los siguientes pasos:

    1. Identificar las entidades involucradas en el problema. Estas se identifican en el

    enunciado del problema por los sustantivos que contiene, por ejemplo:

    o Una factura (entidad) se emite a una persona (entidad) y slo una, pero una

    persona puede tener varias facturas emitidas a su nombre.

    2. Identificar las relaciones existentes entre las entidades especificadas en el paso

    anterior. Para esto, se identifican en el enunciado los verbos que representan algn

    tipo de accin sobre las entidades, por ejemplo:

    o Una factura se emite (relacin) a una persona y slo una, pero una persona

    puede tener varias facturas emitidas a su nombre.

    3. Identificar la cardinalidad de las relaciones identificadas en el paso 2, por ejemplo:

    o Una factura se emite a una persona y slo una, pero una persona puede tener

    varias facturas emitidas a su nombre (es una relacin 1:N).

    4. COMENTARIOS FINALES

    Cualquier problema de la realidad puede ser representado mediante un diagrama E-R. Esta es

    la primera etapa del diseo de una base de datos. En la siguiente etapa de diseo, este

    modelo se transforma en un modelo conceptual, que representa un nivel de diseo de mayor

    detalle. Este permite avanzar hacia el diseo fsico, que es el requerido para implementar en

    un DBMS.

  • ESTE DOCUMENTO CONTIENE LA SEMANA 1 15

    5. BIBLIOGRAFA

    Miguel, C. A. (2001). Diseo de bases de datos: problemas resueltos. Madrid: RA-MA.