diseño de bases de datos para proyectos de investigación lluís codina upf departamento de...

23
Diseño de bases de datos para proyectos de investigación Lluís Codina UPF Departamento de Comunicación - Grupo DigiDoc 2014

Upload: marina-soto-suarez

Post on 02-Feb-2016

213 views

Category:

Documents


1 download

TRANSCRIPT

Page 1: Diseño de bases de datos para proyectos de investigación Lluís Codina UPF Departamento de Comunicación - Grupo DigiDoc 2014

Diseño de bases de datos para proyectos de investigaciónLluís CodinaUPFDepartamento de Comunicación - Grupo DigiDoc2014

Page 2: Diseño de bases de datos para proyectos de investigación Lluís Codina UPF Departamento de Comunicación - Grupo DigiDoc 2014

L. C

odin

a -

Gru

po D

igiD

oc U

PF

Contexto• Objeto de estudio• Una o más entidades: “cosas”• Entidades con facetas o: las cosas tienen propiedades• Su número supera un umbral cuantitativo (algunos cientos…)• Complementan los análisis cualitativos o cuantitativos• Son los únicos análisis posibles

• Ejemplos clásicos. Análisis de:• Noticias• Sitios web• Anuncios• Imágenes• Obras de arte• Films• Series de televisión, etc.

Nov

. 201

4

2

Page 3: Diseño de bases de datos para proyectos de investigación Lluís Codina UPF Departamento de Comunicación - Grupo DigiDoc 2014

L. C

odin

a -

Gru

po D

igiD

oc U

PF

AlternativasBases de datos Hoja de cálculo Editor de texto

Control y Administración

* * * * * *

Explotación * * * * * * *

Funciones * * * * * * * * *

Seguridad * * * * * -

Tratamiento numérico

* * * * * * -

Tratamiento textual

* * * - * *

Componentes multimedia

* * * - * *

Entidades facetadas

* * * * * *

Gran volumen de información

* * * * * *

Nov

. 201

4

3

Page 4: Diseño de bases de datos para proyectos de investigación Lluís Codina UPF Departamento de Comunicación - Grupo DigiDoc 2014

L. C

odin

a -

Gru

po D

igiD

oc U

PF

Una solución común• Diversidad de: • Objetivos• Marcos teóricos• Objetos de estudio

• Una misma necesidad de información:• Controlar información facetada y voluminosa

Nov

. 201

4

4

Page 5: Diseño de bases de datos para proyectos de investigación Lluís Codina UPF Departamento de Comunicación - Grupo DigiDoc 2014

L. C

odin

a -

Gru

po D

igiD

oc U

PF

Principios básicos• Diseñar una base de datos es modelar una parte de la realidad• Que tenemos en el mundo real:• Cosas: Entidades• Propiedades de las cosas: Atributos de la entidades• Relaciones entre las entidades (las cosas tienen relaciones entre

ellas)• En qué se convierte en la base de datos• Entidades: Tablas o Registros• Atributos: Columnas o Campos en un registro• Relaciones: Tablas o Registros adicionales

Nov

. 201

4

5

Page 6: Diseño de bases de datos para proyectos de investigación Lluís Codina UPF Departamento de Comunicación - Grupo DigiDoc 2014

L. C

odin

a -

Gru

po D

igiD

oc U

PF

Tipo y Ocurrencia de Entidad • Diferencia fundamental• Tipo de Entidad > Concepto general• Ocurrencia de Entidad > Caso concreto

Nov

. 201

4

6

Mundo real Base de datos

Tipo de entidad Tabla o Modelo de Registro

Ocurrencia de entidad Fila o Registro número N

Page 7: Diseño de bases de datos para proyectos de investigación Lluís Codina UPF Departamento de Comunicación - Grupo DigiDoc 2014

L. C

odin

a -

Gru

po D

igiD

oc U

PF

Relaciones• Las entidades del mundo real tienen relaciones entre ellas• En la base de datos deben quedar representadas• Tipos de relaciones:• 1 : 1• 1 : N• N : M

• Implicaciones• Si la relación es:

• 1 : 1 > Una sola tabla. Solamente hay una entidad y un atributo• 1 : M > Necesitamos dos tablas: una para cada entidad• N : M > Necesitamos tres tablas, una para cada entidad y otra para la

relación

Nov

. 201

4

7

Page 8: Diseño de bases de datos para proyectos de investigación Lluís Codina UPF Departamento de Comunicación - Grupo DigiDoc 2014

L. C

odin

a -

Gru

po D

igiD

oc U

PF

Una Entidad como una tabla• Tabla = Tipo de Entidad• Filas = Ocurrencia de entidad• Columnas = Propiedades de las entidades• Celdas = Valores adquiridos por la propiedad

Tabla para registrar (p.e.) artículos de revista

Autor Título Fuente Resumen

Nov

. 201

4

8

Page 9: Diseño de bases de datos para proyectos de investigación Lluís Codina UPF Departamento de Comunicación - Grupo DigiDoc 2014

L. C

odin

a -

Gru

po D

igiD

oc U

PF

Una Entidad como una ficha• Modelo de Ficha = Tipo de Entidad• Ficha concreta = Ocurrencia de Entidad• Campos = Propiedades de la Entidad

Autor

Título

Ficha (Modelo de Registro) para registrar artículos de revista

Fuente

Resumen

Nov

. 201

4

9

Page 10: Diseño de bases de datos para proyectos de investigación Lluís Codina UPF Departamento de Comunicación - Grupo DigiDoc 2014

L. C

odin

a -

Gru

po D

igiD

oc U

PF

Resumen

1. Base de datos = un modelo o un mapeado posible de una parte de la realidad

2. Tipos de Entidad = las clases de entidades que queremos representar (controlar) en la base de datos

3. Ocurrencia de Entidad = un individuo o un miembro perteneciente a la clase de entidad

4. Atributos = Características relevantes del tipo de entidad5. Relaciones = conexiones que mantienen los diversos tipos

de entidad entre sí

Nov

. 201

4

10

Page 11: Diseño de bases de datos para proyectos de investigación Lluís Codina UPF Departamento de Comunicación - Grupo DigiDoc 2014

L. C

odin

a -

Gru

po D

igiD

oc U

PF

El Diccionario de Datos• Modelo de representación de la información extraído de la

confluencia de:• Características (de la parte) del mundo real que nos interesa• Tipo de análisis y objetivos de nuestro proyecto

• Componentes:• Lista de entidades• Lista de atributos > campos de cada entidad

Nov

. 201

4

11

Page 12: Diseño de bases de datos para proyectos de investigación Lluís Codina UPF Departamento de Comunicación - Grupo DigiDoc 2014

L. C

odin

a -

Gru

po D

igiD

oc U

PF

Componentes• Tratamiento sistemático para cada campo:• Etiqueta > título corto para nombrar el campo• Dominio > definición o enumeración• Tipo de dato > numérico, textual, fecha, lógico, etc.• Indización > sí/no• Valores admitidos > campo libre o controlado• Restricciones > obligatorio, repetible, único, etc.

• Campos fijos:• ID• Alta• Modificación• Operador

Nov

. 201

4

12

Page 13: Diseño de bases de datos para proyectos de investigación Lluís Codina UPF Departamento de Comunicación - Grupo DigiDoc 2014

L. C

odin

a -

Gru

po D

igiD

oc U

PF

Proceso

1. Análisis mundo real• Tipos de entidades• Propiedades relevantes de las entidades• Relaciones ente entidades• Objetivos del proyecto

2. Factor crítico• Campos con contenidos (valores) controlados:

• Palabras clave• Descriptores• Categorías

Nov

. 201

4

13

Page 14: Diseño de bases de datos para proyectos de investigación Lluís Codina UPF Departamento de Comunicación - Grupo DigiDoc 2014

L. C

odin

a -

Gru

po D

igiD

oc U

PF

Ejemplo – Base de Datos Imago• Base de datos para el análisis del uso de imágenes fotográficas

en cibermedios• Tipos de Entidades• Cibermedios• Fotografías• Relación identificada N : M• Necesitamos tres tablas

• Tabla Fotografías• Tabla Cibermedios• Tabla para la Relación N:M

Nov

. 201

4

14

Page 15: Diseño de bases de datos para proyectos de investigación Lluís Codina UPF Departamento de Comunicación - Grupo DigiDoc 2014

L. C

odin

a -

Gru

po D

igiD

oc U

PF

Ejemplo (2)Campos Tabla Fotografías. Entidad: las fotografías

• Título• Cibermedio (*)• URL• Fecha• Fotógrafo• Elementos icónicos• Elementos conceptuales• Alta• Modificación• Operador• IDNotas: (*) = Campo común (el mismo dominio) con la Tabla Cibermedios.Habrá tantos registros como número total de fotografías analizadas.

Nov

. 201

4

15

Page 16: Diseño de bases de datos para proyectos de investigación Lluís Codina UPF Departamento de Comunicación - Grupo DigiDoc 2014

L. C

odin

a -

Gru

po D

igiD

oc U

PF

Ejemplo (3)

Campos Tabla Cibermedios. Entidad: los medios • Cibermedio (*)• Grupo Editorial• URL• País• Idioma• Categorización

• Notas: Habrá tantos registros como número total de cibermedios objeto de análisis

Nov

. 201

4

16

Page 17: Diseño de bases de datos para proyectos de investigación Lluís Codina UPF Departamento de Comunicación - Grupo DigiDoc 2014

L. C

odin

a -

Gru

po D

igiD

oc U

PF

Ejemplo (4)

Campos Tabla Relación (Cibermedio-Fotografía)

• Cibermedio (*)• Fotografía (*)• Fecha Publicación

• Nota: Habrá tantos registros como el número de veces que se han publicado en total todas las fotografías; pero si la fotografía X se ha publicado en tres ocasiones distintas, habrá tres registros distintos solo para la fotografía X, etc.

Nov

. 201

4

17

Page 18: Diseño de bases de datos para proyectos de investigación Lluís Codina UPF Departamento de Comunicación - Grupo DigiDoc 2014

L. C

odin

a -

Gru

po D

igiD

oc U

PF

Diccionario de datos como documento

Nov

. 201

4

18

Page 19: Diseño de bases de datos para proyectos de investigación Lluís Codina UPF Departamento de Comunicación - Grupo DigiDoc 2014

L. C

odin

a -

Gru

po D

igiD

oc U

PF

El diccionario de datos implementado en un gestor de bases de datos (FileMaker)

Nov

. 201

4

19

Page 20: Diseño de bases de datos para proyectos de investigación Lluís Codina UPF Departamento de Comunicación - Grupo DigiDoc 2014

L. C

odin

a -

Gru

po D

igiD

oc U

PF

Un registro como una fila en una tabla

Nov

. 201

4

20

Page 21: Diseño de bases de datos para proyectos de investigación Lluís Codina UPF Departamento de Comunicación - Grupo DigiDoc 2014

L. C

odin

a -

Gru

po D

igiD

oc U

PF

Un registro como una ficha

Nov

. 201

4

21

Page 22: Diseño de bases de datos para proyectos de investigación Lluís Codina UPF Departamento de Comunicación - Grupo DigiDoc 2014

L. C

odin

a -

Gru

po D

igiD

oc U

PF

Ejercicio 1• Completar el diccionario de datos (campos sombreados) de la

simulación de la base de datos Imago de análisis de fotoperiodismo en cibermedios

• Utilizar la plantilla del Aula Global• Alternativa: diseñe su propia base de datos relacionada con su

proyecto. Identifique las posibles entidades, haga un listado de campos, defina en el diccionario de datos para algunos de los campos.

Nov

. 201

4

22

Page 23: Diseño de bases de datos para proyectos de investigación Lluís Codina UPF Departamento de Comunicación - Grupo DigiDoc 2014

L. C

odin

a -

Gru

po D

igiD

oc U

PF

Ejercicio 2• Pruebas con FileMaker: implementar una parte del

diccionario de datos y probar a dar algunas altas

Nov

. 201

4

23