digitalización: conceptos, formatos de digitalización, equipos de captura y soportes, de javier...

26
DIGITALIZACIÓN AVANZADA Y CREACIÓN DE BIBLIOTECAS DIGITALES Javier Mas García DIGITALIZACIÓN: CONCEPTOS, CRITERIOS PARA LA DETERMINACIÓN DE FORMATOS DE DIGITALIZACIÓN, USO DE FICHEROS DE IMAGEN, EQUIPOS DE CAPTURA Y SOPORTES

Upload: guestc2d800

Post on 13-Jun-2015

18.585 views

Category:

Technology


5 download

DESCRIPTION

Digibis, Digital Libraries, Digitalization, Design, Technology

TRANSCRIPT

Page 1: Digitalización: conceptos, formatos de digitalización, equipos de captura y soportes, de Javier Mas

DIGITALIZACIÓN AVANZADA Y

CREACIÓN DE BIBLIOTECAS DIGITALES

Javier Mas García

DIGITALIZACIÓN: CONCEPTOS, CRITERIOS PARA LA DETERMINACIÓN

DE FORMATOS DE DIGITALIZACIÓN, USO DE FICHEROS DE IMAGEN,

EQUIPOS DE CAPTURA Y SOPORTES

Page 2: Digitalización: conceptos, formatos de digitalización, equipos de captura y soportes, de Javier Mas

• IMAGEN DIGITAL– MAPA DE BITS

– FORMATOS

– RESOLUCIONES

– PROFUNDIDAD DE COLOR

– CONSIDERACIONES Y RECOMENDACIONES PARA LA DIGITALIZACIÓN

• EQUIPOS

– Digitalización de libros y documentos encuadernados

– Digitalización de láminas y fotografías

– Digitalización de planos

– Digitalización de microformas

• ALMACENAMIENTO

• COSTES DE UN PROYECTO DE DIGITALIZACIÓN

Sumario

Page 3: Digitalización: conceptos, formatos de digitalización, equipos de captura y soportes, de Javier Mas

• Las imágenes digitales se guardan normalmente en forma de mapa de bits o mosaico de píxeles. Cada píxel guarda la información de color de la parte de imagen que ocupa

• Principal inconveniente: la ampliación. Cuando un archivo se amplia mucho, se distorsiona la imagen mostrándose el mosaico con "los píxeles" y una degradación en los colores llegando al efecto pixelación.

DetalleVisualización correcta, imagen al 100% Imagen pixelada

Mapa de bits

Page 4: Digitalización: conceptos, formatos de digitalización, equipos de captura y soportes, de Javier Mas

Mapa de bits

ELEMENTOS BÁSICOS QUE DEFINEN LA IMAGEN DIGITAL

• Formatos de ficheros de imagen y niveles de compresión• Resolución• Profundidad de color

Consideración sobre los formatos de mapa de bit y la resolución

• Calidad máxima: Mayor resolución / menor compresión / mayor profundidad de bits = mayor peso de fichero

VENTAJAS

Mayor calidad de imagen

Posibilidad de mayor ampliación

DESVENTAJAS

Mayor peso de ficheros y ocupación en los soportes de grabación

Mayor tiempo de apertura de la imagen

Necesidad de una mayor capacidad de los equipos y software de lectura

Mayores costes de producción

• Objetivo: buscar un equilibrio entre la calidad y el peso de la imagen

Page 5: Digitalización: conceptos, formatos de digitalización, equipos de captura y soportes, de Javier Mas

Formatos de Imagen

FORMATOS Y COMPRESIÓN DE FICHEROS.

Formatos de imagen más comunes

FORMATOS SIN COMPRIMIR. - Ficheros mas estables,- Sin pérdida de calidad- Peso de imagen alto

TIFF, Tagged Image File FormatRAW Imagen “en crudo” PSD Photoshop (Ps)BMP BitMaP o Bit Mapped PicturePDF Portable Document Format

FORMATOS COMPRIMIDOS. - Ficheros mas inestables y más facilmente corrompibles. - Con pérdida mayor o menor de calidad. Algunos formatos permiten la compresión sin pérdida. - Peso de imagen bajo, aptos para publicación o intercambio.

JPEG The Joint Photographers Experts GroupGIF Graphics Interchange FormatPNG Portable Network Graphics

PDF Portable Document FormatTIFF LZWJPEG 2000 Djvu.

Page 6: Digitalización: conceptos, formatos de digitalización, equipos de captura y soportes, de Javier Mas

Formatos de Imagen

Peso de ficheros

sin comprimir: 39,1 Mb

JPEG, comprimido 5%,calidad máxima,13,4 MbJPEG, comprimido 10%, calidad alta, 5 MbJPEG, JPEG, comprimido 50%, calidad media comprimido 50%, calidad media 1,4 Mb1,4 Mb

GIFF, 8 bits, 256 colores, 7,6 Mb

PNG, sin pérdida, no entrelazado: 22,5PNG, sin pérdida, entrelazado: 27,5

PDF, generado desde TIFF, compresión ZIP, sin perdida. 23,1 MbPDF, generado desde JPEG, calidad max., 13,4 MbPDF, generado desde JPEG, calidad media, 1,4 Mb

Imagen: 20 x 27,5 cms, color RGB, 24 bits

FORMATOS Y COMPRESIÓN DE FICHEROS.

FORMATOS SIN COMPRIMIR. - Ficheros mas estables,- Sin pérdida de calidad- Peso de imagen alto

TIFF, Tagged Image File FormatRAW Imagen “en crudo” PSD Photoshop (Ps)BMP BitMaP o Bit Mapped PicturePDF Portable Document Format

FORMATOS COMPRIMIDOS. - Ficheros mas inestables y más facilmente corrompibles. - Con pérdida mayor o menor de calidad. Algunos formatos permiten la compresión sin pérdida. - Peso de imagen bajo, aptos para publicación o intercambio.

JPEG The Joint Photographers Experts GroupGIF Graphics Interchange FormatPNG Portable Network Graphics

PDF Portable Document FormatTIFF LZWJPEG 2000 Djvu.

Page 7: Digitalización: conceptos, formatos de digitalización, equipos de captura y soportes, de Javier Mas

Resolución de Imagen

CONCEPTOS

- Resolución, es la cantidad de píxeles o puntos que componen la imagen. La resolución se utiliza también para clasificar casi todos los dispositivos relacionados con las imágenes digitales ya sean escáneres, pantallas de ordenador, cámaras digitales , etc.

- La calidad de resolución de una imagen expresará el número de píxeles que forman la imagen de mapa de bits

- Expresión de la resolución total de una imagen: la resolución o tamaño de una imagen digital se expresa multiplicando su anchura por la altura en pantalla. Por ejemplo la imagen de 1200 x 1200 píxeles = 1.440.000 píxeles, (expresado en Mp megapixel es igual a 1,4 Mp). Conviene tener en cuenta que 1 Megapíxels = 1.000.000 de píxeles.

- La resolución de impresión: define la cantidad de píxeles que contiene una imagen y la dimensión de estos píxeles expresando de qué forma se reparten en el espacio. La resolución expresada en (ppp) o (dpi), son los píxeles por unidad de longitud, es decir, los píxeles por pulgada. (La pulgada mide 2,54 cm).

Así pues, la resolución de impresión es la relación entre las dimensiones digitales (los píxeles) y las físicas; las que tendría una vez impresa sobre papel.

Page 8: Digitalización: conceptos, formatos de digitalización, equipos de captura y soportes, de Javier Mas

Resolución de Imagen

EJEMPLO DE CALCULO TAMAÑO DE IMPRESIÓN

4285 pixels27,21 cms

5996 pixels38,07 cms

Resolución de imagen: 400 pppTamaño de imágenes: 5996 x 4285(en pixels)

Resolución de impresión

5996/400 = 14,99 pulgadas x 2.54 cms = 38,07 4285/400 = 10,71 pulgadas x 2.54 cms = 27,21

Tamaño de impresión: 38,07 x 27,21 cms

Tamaño de impresión= Número de píxeles/ Resolución (ppp -píxeles por pulgada)

Ejemplo:

Page 9: Digitalización: conceptos, formatos de digitalización, equipos de captura y soportes, de Javier Mas

Resolución de Imagen

PIXELACIÓN

La ampliación excesiva de la imagen para su visualización, producía en la fotografía tradicional un efecto granulado debido a la falta de nitidez. En la fotografía digital el efecto análogo es de una imagen pixelada .

Si reproducimos una imagen con baja resolución quiere decir que el píxel ocupa más espacio y deforma la imagen con el efecto de pixelación; se crean píxeles de gran tamaño aportando poca definición a la imagen. En cambio si la resolución en ppp, es más alta, existe más detalle y más definición,

Imagen correcta Imagen pixelada

Page 10: Digitalización: conceptos, formatos de digitalización, equipos de captura y soportes, de Javier Mas

Resolución de Imagen

CONSEJOS SOBRE RESOLUCIONES DE IMAGEN ADECUADAS

* 72 ppp para visualizar documentos en tamaño fijo de pantalla

* Entre 150 y 200 ppp para consulta en pantalla. Permite cierta ampliación y la impresión en impresora; pero a veces se llega hasta los 300 ppp, para dar óptimos resultados imprimiendo con calidad fotográfica a tamaño real (a escala 1:1). Indicado para copias de uso y publicación

* La resolución fotográfica para obtener un fotolito para imprenta se obtiene igualmente una resolución de imagen de 300 dpi y será este el con una resolución de 300 dpi, tamaño suficiente para generar el proceso de fotomecánica e imprenta.

* 400 ppp en imágenes para ficheros de preservación. Permiten una cierta ampliación con calidad fotográfica sobre el tamaño original (p.e para ampliar un detalle de una imagen o para facilitar procesos de restauración digital)

Page 11: Digitalización: conceptos, formatos de digitalización, equipos de captura y soportes, de Javier Mas

Profundidad de color

COMO GUARDA EL COLOR EL PÍXEL: EL BIT Y EL COLOR

- La profundidad del BIT, profundidad del píxel o profundidad del color, estima los valores que puede llegar a tener cada píxel que forma la imagen. A más cantidad de bits por píxel, más colores, mayor resolución de imagen y mayor tamaño del archivo

- La profundidad del BIT se puede medir en:

1 bit/pixel BIT, blanco o negro8 bits de color y 256 matices de color, monocromo, escala de grises24 bits de color o colores RGB, imágenes en color. 32 bits CMYK, para impresión de las imágenes

Page 12: Digitalización: conceptos, formatos de digitalización, equipos de captura y soportes, de Javier Mas

Profundidad de color

Imagen color RGB, 400 ppp 24 bits ; 73,6 Mb

Imagen en Binario

1 bit; 3.0 MbImagen en escala de grises

8bits; 24,6 MbImagen en color CMYK,

32 bits; 98,1 Mb

Imágenes sin compresión

Ficheros comprimidos

TIFF LZW : 700 KbTIFF CCIT-G4: 320 Kb

1 bit

JPEG calidad máxima:13,4 MbJPEG calidad media : 4,5 Mb

8bits

JPEG calidad máxima: 31 MbJPEG calidad media: 6,96 Mb

8bits

COMO GUARDA EL COLOR EL PÍXEL: PESO DE LOS FICHEROS

Page 13: Digitalización: conceptos, formatos de digitalización, equipos de captura y soportes, de Javier Mas

Recomendaciones generales para la digitalización en la creación de colecciones digitales

1. Establecer los fines y objetivos que motivan el proyecto

- preservación del original- impresión (artes gráficas/imprenta o impresora)- edición en soporte óptico (CD, DVD)- integración en un repositorio accesible desde Internet- OCR - copias accesibles desde el disco duro de nuestro ordenador o servidor dentro de un

sistema de gestión de archivo.

2. La copia master deberá permitir obtener el resto de copias derivadas. Realizar la captura de imágenes con calidad suficiente para obterner copias que cubras las distintas necesidades posibles.

3. Analizar el entorno tecnológico de consulta o edición; y la capacidad de almacenamiento y transferencia de datos de los soportes físicos. Los soportes de grabación de las imágenes de preservación (muy pesadas), el entorno de consulta (internet, intranet, DVD, CD), la capacidad de proceso de las imagenes del software de consulta, la velocidad de descarga y de apertura de las imágenes en el entorno de consulta condicionarán los formatos y la resolución que se deba exigir en el proceso de digitalización, teniendo en cuenta la relación: calidad de imagen/peso de ficheros

Page 14: Digitalización: conceptos, formatos de digitalización, equipos de captura y soportes, de Javier Mas

Recomendaciones generales para la digitalización en la creación de colecciones digitales

4. Escoger formatos normalizados

5. Seguir las Indicaciones y recomendaciones de los grupos de trabajo institucionales nacionales e internacionales afines a nuestro entorno

6. Seguir los estándares dominantes en el mercado

7. Equilibrio entre las prescripciones técnicas, y el entorno tecnológico y presupuesto económico disponible.

Page 15: Digitalización: conceptos, formatos de digitalización, equipos de captura y soportes, de Javier Mas

Recomendaciones generales para la digitalización en la creación de colecciones digitales

Formatos y resoluciones

Cuadro - resumen

Page 16: Digitalización: conceptos, formatos de digitalización, equipos de captura y soportes, de Javier Mas

Atendiendo al tipo de material a digitalizar existen diferentes tipos de escáner con prestaciones específicas adecuadas para cada uno.

• I. Escáneres de libros y documentación histórica

– Luz fría.– Captura cenital o aérea.– Posibilidad de trabajar con o sin cristal superpuesto al documento– Base basculante (Bookcradle). Apto para diferentes grosores de libros o

documentos.– Aptos para escanear libros de distintos tamaños. (A4 x2, A3x2, A2x2, A1x2).– Captura lineal o matricial.– Operan de forma manual consiguiendo una productividad alta (variable según

marcas y modelos).– Costes generalmente bastante elevados (entre 20.000 y 90.000 €) y variables

en función del tamaño de los escáneres y de las marcas.

Equipos de captura

Page 17: Digitalización: conceptos, formatos de digitalización, equipos de captura y soportes, de Javier Mas

Equipos

Proserv ScannTECH A2_A0

Digibook SupraScan I2S A1_A0

Zeutschel OS 10000 A0

• I. Escáneres de libros y documentación histórica, A1 y A0Tamaños A1 y A0Captura linealMuy sofisticados y costosos.

Page 18: Digitalización: conceptos, formatos de digitalización, equipos de captura y soportes, de Javier Mas

• I. Escáneres de libros y documentación históricaEscáneres tamaño (A3, A2) Captura lineal o matricial, dependiendo marcas y modelosSofisticados pero menos y menos costosos.

Equipos

MIINOLTA PS5000 C

OS 14000 TTOS 12000 C OS 10000 TT

Zeutschel

Book2net - MicroboxCopybook HD I2S

Page 19: Digitalización: conceptos, formatos de digitalización, equipos de captura y soportes, de Javier Mas

• I. Escáneres de libros y documentación histórica

Para (A4, A3). Existen soluciones menos sofisticadas y más baratas,

Equipos

... y totalmente caseras

ATIZ BookDrive DIY PS5000 C

Page 20: Digitalización: conceptos, formatos de digitalización, equipos de captura y soportes, de Javier Mas

Equipos

Bookscan APT1200DL 3000 i2S

SupraScan 10000 RGB i2SProserv ScannTECH A0

• II. Escáneres de grandes formatos.

• III. Escáneres automáticos de libros. Muy productivos. NO RECOMENDABLES para patrimonio documental y bibliográfico

Page 21: Digitalización: conceptos, formatos de digitalización, equipos de captura y soportes, de Javier Mas

Equipos

• IV. Escáneres de microformas. Microfilm / microfichas / tarjetas de apertura

• Manuales.

• Binario/efecto grises por interpolación de puntos

• Automáticos

Binario/escala de grises

ScanPro 2000

MEKEL

SUNRISE

ZEUTSCHEL WICKS & WILSON

OCÉ 3000

NETScan-Eclipse

Page 22: Digitalización: conceptos, formatos de digitalización, equipos de captura y soportes, de Javier Mas

Equipos

• II. Digitalización de microformas. Microfilm / microfichas / tarjetas de apertura

La digitalización desde microfilm/microficha supone las siguientes

Ventajas:

– Economía de costes, siempre y cuando se pueda trabajar en modo automático. Si implica procesos manuales (por ejemplo recorte manual de imágenes), los costes se equiparan a la digitalización directa

– No se manipula nuevamente el original para su digitalización.

– Permite obtener un copia digital, cuando no se dispone del material original.

Desventajas

- Reproducción de todos los defectos recogidos en el fotograma, manchas, roturas, pliegues, tintas traspasadas, sin posibilidad de corregirlos o atenuarlos.

- La microfilmación no dispone de la imediatez de visualización y control de calidad por lo que, la digitalización desde este soporte añadirá los posibles defectos derivados de este proceso intermedio, tales como:

- Reflejos- Diferencias de iluminación y contraste dentro de la misma imágen - Defectos de la copia utilizada, mancha, rayas, etc. - La ausencia o repetición de imágenes se mantendrá en la copia digital.- Letras empastadas o de trazo debil y difuso (que pueden provocar la ilegibildad del documentos).

Page 23: Digitalización: conceptos, formatos de digitalización, equipos de captura y soportes, de Javier Mas

Equipos

• II. Digitalización de microformas. Ejemplo de errores arrastrados por falta de calidad de la microfilmación

Problemas

- Manchas producidas por sobreexposición de luz de focos

- Diferencias excesivas de contraste entre claro y oscuro que

impiden hallar una exposición media adecuada para la digitalización

- Exceso de luz y falta de definición en zonas claras

- Exceso de oscuridad con zonas borrosas y empastadas

- En documentos muy grandes, ampliación desenfocada o pixelada

- Hojas delanteras rotas mezclándose imagen de varias páginas

Page 24: Digitalización: conceptos, formatos de digitalización, equipos de captura y soportes, de Javier Mas

Almacenamiento. Soportes

1. UNIDADES DE CINTA. Para ficheros de preservación y de protección de datos

SDLT

LTO 1

LTO 3

2. DISCO DUROS Externos, conexión USB. Para ficheros de preservación y copias de uso.

3. DVD. Solo recomendable para determinadas publicaciones, para ficheros de datos oalmacenamiento de copias de imagen para uso, de poco peso, en general. En desuso paraalmacenamiento masivo, por su limitada capacidad de almacenamiento, inestabilidad y fragilidad. NO RECOMENDADO, en ningún caso, para copias de preservación

Page 25: Digitalización: conceptos, formatos de digitalización, equipos de captura y soportes, de Javier Mas

Costes de un proyecto de digitalización

A. LOS COSTES SON EXTREMADAMENTE VARIABLES

B. FACTORES A TENER EN CUENTA :

1. CARACTERÍSTICAS FÍSICAS DEL MATERIAL A TRATAR Soporte físico (papel, pergamino, fotografía), tamaño del documento, encuadernación, estado de conservación

2. RESOLUCIÓN DE ESCANEADO Y EMPLEO DE GRISES o COLOR

3. NIVEL DE INDEXACIÓN DE LA DOCUMENTACIÓN Número de imágenes por unidad documental

4. SEGUIMIENTOS DE PROTOCOLOS DE CALIDAD Y PROCESOS DE EXTRACCIÓN DE METADATOS TÉCNICOS DE LA DIGITALIZACIÓN

5. ESPECIFICACIONES ADICIONALES DE POSTPRODUCCIÓN. - Formatos de imagen requeridos a entregar. Imágenes originales y copias derivadas, para preservación, uso y publicación. - Necesidad o no de aplicar OCR, y formatos de salida de texto - Retoque fotográfico - Preparación imágenes para artes gráficas - Soportes de grabación

7. FORMACIÓN Y ESPECIALIZACIÓN DEL PERSONAL TÉCNICO

Page 26: Digitalización: conceptos, formatos de digitalización, equipos de captura y soportes, de Javier Mas

Digitalización y creación de Bibliotecas Digitales

FINGRACIAS POR LA ATENCIÓN

Javier Mas GarcíaCoordinador Técnico