2. texto. - umdis.um.es/~jfernand/0506/smig/tema2.pdf · zlas ventajas de crear archivos en otras...

24
1 Sistemas Multimedia e Interacción Gráfica- Curso 2005/06 1 2. Texto. 2.1. 2.1. INTRODUCCIÓN. INTRODUCCIÓN. 2.2. 2.2. ESTÁNDARES DE TEXTO. ESTÁNDARES DE TEXTO. 2.2.1 ASCII ( 2.2.1 ASCII ( American American Standard Standard Code Code for for Information Information Interchange Interchange). ). 2.2.2 2.2.2 Unicode Unicode. 2.2.3 RTF ( 2.2.3 RTF ( Rich Rich Text Text Format Format). ). 2.2.4 Adobe PostScript. 2.2.4 Adobe PostScript. 2.2.5 Adobe PDF. 2.2.5 Adobe PDF. 2.2.6 PostScript 2.2.6 PostScript vs vs PDF PDF 2.3. 2.3. ESTÁNDARES ORIENTADOS A CONTENIDOS WEB ESTÁNDARES ORIENTADOS A CONTENIDOS WEB 2.3.1. 2.3.1. SGML (Standard SGML (Standard Generalized Generalized Markup Markup Language Language). ). 2.3.2. 2.3.2. HTML ( HTML ( HyperText HyperText Markup Markup Language Language). ). 2.3.2.1. 2.3.2.1. PDF PDF vs vs HTML. HTML. 2.3.3. 2.3.3. XML ( XML ( eXtensible eXtensible Markup Markup Language Language). ). 2.4. 2.4. OTROS ESTÁNDARES OTROS ESTÁNDARES 2.5. 2.5. ASPECTOS TECNOLÓGICOS RELATIVOS AL TEXTO. ASPECTOS TECNOLÓGICOS RELATIVOS AL TEXTO. Sistemas Multimedia e Interacción Gráfica- Curso 2005/06 2 2.1.- Introducción ENTRE LAS DISTINTAS FUENTES DE INFORMACIÓN DE LOS ENTRE LAS DISTINTAS FUENTES DE INFORMACIÓN DE LOS SISTEMAS MULTIMEDIA, EL TEXTO ES EL MEDIO BÁSICO, SISTEMAS MULTIMEDIA, EL TEXTO ES EL MEDIO BÁSICO, TANTO POR SU VETERANÍA CÓMO POR SU USO TANTO POR SU VETERANÍA CÓMO POR SU USO GENERALIZADO. GENERALIZADO. EN ESTE TEMA VEREMOS LAS DISTINTAS FORMAS DE EN ESTE TEMA VEREMOS LAS DISTINTAS FORMAS DE REPRESENTAR ESTE MEDIO, EMPEZANDO POR LAS MÁS REPRESENTAR ESTE MEDIO, EMPEZANDO POR LAS MÁS SIMPLES E INTRODUCIENDO FORMAS, CADA VEZ MÁS SIMPLES E INTRODUCIENDO FORMAS, CADA VEZ MÁS COMPLEJAS, DE DESCRIPCIÓN DE DOCUMENTOS BASADOS EN COMPLEJAS, DE DESCRIPCIÓN DE DOCUMENTOS BASADOS EN TEXTO, HASTA LLEGAR A LO QUE PODRÍAMOS CONSIDERAR TEXTO, HASTA LLEGAR A LO QUE PODRÍAMOS CONSIDERAR LENGUAJES DE DESCRIPCIÓN DE DOCUMENTOS MULTIMEDIA. LENGUAJES DE DESCRIPCIÓN DE DOCUMENTOS MULTIMEDIA.

Upload: others

Post on 13-May-2020

19 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: 2. Texto. - UMdis.um.es/~jfernand/0506/smig/tema2.pdf · zlas ventajas de crear archivos en otras aplicaciones y convertirlos a pdf son las siguientes: – es un proceso rÁpido y

1

Sistemas Multimedia e Interacción Gráfica- Curso 2005/06 1

2. Texto. 2.1.2.1. INTRODUCCIÓN.INTRODUCCIÓN.

2.2.2.2. ESTÁNDARES DE TEXTO.ESTÁNDARES DE TEXTO.2.2.1 ASCII ( 2.2.1 ASCII ( AmericanAmerican Standard Standard CodeCode forfor InformationInformation InterchangeInterchange).).2.2.2 2.2.2 UnicodeUnicode..2.2.3 RTF ( 2.2.3 RTF ( RichRich TextText FormatFormat).).2.2.4 Adobe PostScript.2.2.4 Adobe PostScript.2.2.5 Adobe PDF.2.2.5 Adobe PDF.2.2.6 PostScript 2.2.6 PostScript vsvs PDFPDF

2.3.2.3. ESTÁNDARES ORIENTADOS A CONTENIDOS WEBESTÁNDARES ORIENTADOS A CONTENIDOS WEB2.3.1.2.3.1. SGML (Standard SGML (Standard GeneralizedGeneralized MarkupMarkup LanguageLanguage).).2.3.2.2.3.2. HTML ( HTML ( HyperTextHyperText MarkupMarkup LanguageLanguage).).

2.3.2.1.2.3.2.1. PDF PDF vsvs HTML.HTML.2.3.3.2.3.3. XML ( XML ( eXtensibleeXtensible MarkupMarkup LanguageLanguage).).

2.4.2.4. OTROS ESTÁNDARESOTROS ESTÁNDARES

2.5.2.5. ASPECTOS TECNOLÓGICOS RELATIVOS AL TEXTO.ASPECTOS TECNOLÓGICOS RELATIVOS AL TEXTO.

Sistemas Multimedia e Interacción Gráfica- Curso 2005/06 2

2.1.- Introducción

ENTRE LAS DISTINTAS FUENTES DE INFORMACIÓN DE LOS ENTRE LAS DISTINTAS FUENTES DE INFORMACIÓN DE LOS SISTEMAS MULTIMEDIA, EL TEXTO ES EL MEDIO BÁSICO, SISTEMAS MULTIMEDIA, EL TEXTO ES EL MEDIO BÁSICO, TANTO POR SU VETERANÍA CÓMO POR SU USO TANTO POR SU VETERANÍA CÓMO POR SU USO GENERALIZADO.GENERALIZADO.

EN ESTE TEMA VEREMOS LAS DISTINTAS FORMAS DE EN ESTE TEMA VEREMOS LAS DISTINTAS FORMAS DE REPRESENTAR ESTE MEDIO, EMPEZANDO POR LAS MÁS REPRESENTAR ESTE MEDIO, EMPEZANDO POR LAS MÁS SIMPLES E INTRODUCIENDO FORMAS, CADA VEZ MÁS SIMPLES E INTRODUCIENDO FORMAS, CADA VEZ MÁS COMPLEJAS, DE DESCRIPCIÓN DE DOCUMENTOS BASADOS EN COMPLEJAS, DE DESCRIPCIÓN DE DOCUMENTOS BASADOS EN TEXTO, HASTA LLEGAR A LO QUE PODRÍAMOS CONSIDERAR TEXTO, HASTA LLEGAR A LO QUE PODRÍAMOS CONSIDERAR LENGUAJES DE DESCRIPCIÓN DE DOCUMENTOS MULTIMEDIA.LENGUAJES DE DESCRIPCIÓN DE DOCUMENTOS MULTIMEDIA.

Page 2: 2. Texto. - UMdis.um.es/~jfernand/0506/smig/tema2.pdf · zlas ventajas de crear archivos en otras aplicaciones y convertirlos a pdf son las siguientes: – es un proceso rÁpido y

2

Sistemas Multimedia e Interacción Gráfica- Curso 2005/06 3

2.2.- Estándares

(en nuestro contexto) Conjunto de normas que (en nuestro contexto) Conjunto de normas que establecen una forma mayoritariamente aceptada y establecen una forma mayoritariamente aceptada y adoptada de representar informaciadoptada de representar informacióón n

TambiTambiéén puede ser por imposicin puede ser por imposicióónn

Importancia para el usuario/ desarrollador informImportancia para el usuario/ desarrollador informáático:tico:–– SimplicidadSimplicidad–– UniformidadUniformidad–– CompatibilidadCompatibilidad

Sistemas Multimedia e Interacción Gráfica- Curso 2005/06 4

2.2.- Tipos de estándaresLos estLos estáándares se pueden clasificar en:ndares se pueden clasificar en:

–– ““de factode facto”” ((““de hechode hecho””):): aquellos que se han impuesto, sin ninguna definiciaquellos que se han impuesto, sin ninguna definicióón n formal, sino mformal, sino máás bien por su s bien por su ééxito en determinado sector (ej: plataforma PC o xito en determinado sector (ej: plataforma PC o PDF). Suelen ser propietarios.PDF). Suelen ser propietarios.

–– ““de jurede jure”” ((““por leypor ley””):): aquellos que han sido desarrollados por organismos aquellos que han sido desarrollados por organismos oficialmente reconocidos. Existen instituciones dedicadas a estaoficialmente reconocidos. Existen instituciones dedicadas a estas labores como:s labores como:

ANSI ANSI (American National Standards Institut(American National Standards Institute)e)ITU ITU (International Telecommunication Unio(International Telecommunication Union)n)IEEE IEEE (Institute of Electrical and Electronic Engineer(Institute of Electrical and Electronic Engineers)s)ISO ISO (International Standards Organizatio(International Standards Organization)n)VESA VESA (Video Electronics Standards Associatio(Video Electronics Standards Association)n)AENOR (AsociaciAENOR (Asociacióón Espan Españñola de Normalizaciola de Normalizacióón).n).

EstEstáándares abiertos / invariablesndares abiertos / invariables

EstEstáándares en creacindares en creacióón digitaln digital–– Coste de creaciCoste de creacióón y tiempo de vidan y tiempo de vida–– LongevidadLongevidad–– PortabilidadPortabilidad–– Rentabilidad de recursosRentabilidad de recursos

Page 3: 2. Texto. - UMdis.um.es/~jfernand/0506/smig/tema2.pdf · zlas ventajas de crear archivos en otras aplicaciones y convertirlos a pdf son las siguientes: – es un proceso rÁpido y

3

Sistemas Multimedia e Interacción Gráfica- Curso 2005/06 5

Conjuntos de caracteres

ASCII

UNICODE

Sistemas Multimedia e Interacción Gráfica- Curso 2005/06 6

ASCII (American Standard Code forInformation Interchange) (I).

Page 4: 2. Texto. - UMdis.um.es/~jfernand/0506/smig/tema2.pdf · zlas ventajas de crear archivos en otras aplicaciones y convertirlos a pdf son las siguientes: – es un proceso rÁpido y

4

Sistemas Multimedia e Interacción Gráfica- Curso 2005/06 7

ASCII (American Standard Code forInformation Interchange) (II).

CÓDIGOS EXTENDIDOS 8 BITS: LETRAS, SIMBOLOS, CÓDIGOS EXTENDIDOS 8 BITS: LETRAS, SIMBOLOS, OPERADORES (EJ. ASCII extendido)OPERADORES (EJ. ASCII extendido)

ISO LATIN 1, UTILIZADO POR DIFERENTES ISO LATIN 1, UTILIZADO POR DIFERENTES SISTEMAS OPERATIVOS Y SERVICIOS DE WEB SISTEMAS OPERATIVOS Y SERVICIOS DE WEB (navegadores, protocolos y lenguajes). OFICIALMENTE (navegadores, protocolos y lenguajes). OFICIALMENTE SE LE DENOMINA ISOSE LE DENOMINA ISO--88598859--1.1.

OTRO CONJUNTO UTILIZADO EN LOS GRANDES OTRO CONJUNTO UTILIZADO EN LOS GRANDES SISTEMAS DE IBM ES EL EBCDIC (Extended SISTEMAS DE IBM ES EL EBCDIC (Extended BinaryBinary--CodedCoded Decimal Decimal InterchangeInterchange CodeCode).).

Sistemas Multimedia e Interacción Gráfica- Curso 2005/06 8

Unicode (I).

CÓDIGO DE CARACTERES DE 16 BITS DISEÑADO PARA CÓDIGO DE CARACTERES DE 16 BITS DISEÑADO PARA CODIFICAR TEXTO EN SU UTILIZACIÓN POR PARTE DE CODIFICAR TEXTO EN SU UTILIZACIÓN POR PARTE DE SISTEMAS BASADOS EN COMPUTADORES.SISTEMAS BASADOS EN COMPUTADORES.

SIMPLICIDAD Y CONSISTENCIA DEL CONJUNTO DE CÓDIGOS SIMPLICIDAD Y CONSISTENCIA DEL CONJUNTO DE CÓDIGOS ASCII (en particular la versión ampliada ISO LatinASCII (en particular la versión ampliada ISO Latin--1 y otras 1 y otras versiones ampliadas del mismo)versiones ampliadas del mismo)

CUBRE TODOS LOS CARACTERES QUE SE UTILIZAN EN CUBRE TODOS LOS CARACTERES QUE SE UTILIZAN EN TODAS LAS LETRAS ESCRITAS DEL MUNDO.TODAS LAS LETRAS ESCRITAS DEL MUNDO.

CÓDIGOS ASOCIADOS A LOS PRINCIPALES ALFABETOS CÓDIGOS ASOCIADOS A LOS PRINCIPALES ALFABETOS UTILIZADOS HOY EN DÍA: LATÍN, CIRÍLICO (USADO EN UTILIZADOS HOY EN DÍA: LATÍN, CIRÍLICO (USADO EN LENGUAS CÓMO EL RUSO, GRIEGO, HEBRERO Y ARÁBIGO), LENGUAS CÓMO EL RUSO, GRIEGO, HEBRERO Y ARÁBIGO), JAPONÉS, COREANO Y CHINO.JAPONÉS, COREANO Y CHINO.

Page 5: 2. Texto. - UMdis.um.es/~jfernand/0506/smig/tema2.pdf · zlas ventajas de crear archivos en otras aplicaciones y convertirlos a pdf son las siguientes: – es un proceso rÁpido y

5

Sistemas Multimedia e Interacción Gráfica- Curso 2005/06 9

Unicode (II).

TAMBIÉN INCLUYE CONJUNTOS DE SÍMBOLOS: SIGNOS DE TAMBIÉN INCLUYE CONJUNTOS DE SÍMBOLOS: SIGNOS DE PUNTUACIÓN, MATEMÁTICOS, TÉCNICOS, FLECHAS, ETC.PUNTUACIÓN, MATEMÁTICOS, TÉCNICOS, FLECHAS, ETC.

ACTUALMENTE QUEDAN, APROXIMADAMENTE, UNOS 29.000 ACTUALMENTE QUEDAN, APROXIMADAMENTE, UNOS 29.000 CÓDIGOS LIBRESCÓDIGOS LIBRES

PREVISTOS 3600 NUEVOS CARACTERESPREVISTOS 3600 NUEVOS CARACTERES ORIENTALES ORIENTALES ((UnicodeUnicode e ISO 10646)e ISO 10646)

PARA USO PRIVADO SE HAN RESERVADO 6.000 CÓDIGOS PARA USO PRIVADO SE HAN RESERVADO 6.000 CÓDIGOS QUE DESARROLLADORES HARDWARE Y SOFTWARE PUEDEN QUE DESARROLLADORES HARDWARE Y SOFTWARE PUEDEN ASIGNAR INTERNAMENTE PARA SUS PROPIOS CARACTERES ASIGNAR INTERNAMENTE PARA SUS PROPIOS CARACTERES Y SÍMBOLOS.Y SÍMBOLOS.

Sistemas Multimedia e Interacción Gráfica- Curso 2005/06 10

Estándares de texto formateado

RTF

POSTSCRIPT

PDF

Page 6: 2. Texto. - UMdis.um.es/~jfernand/0506/smig/tema2.pdf · zlas ventajas de crear archivos en otras aplicaciones y convertirlos a pdf son las siguientes: – es un proceso rÁpido y

6

Sistemas Multimedia e Interacción Gráfica- Curso 2005/06 11

RTF (Rich Text Format)

ES UN ESTÁNDAR DE CODIFICACIÓN DE TEXTO Y GRÁFICOS CON ES UN ESTÁNDAR DE CODIFICACIÓN DE TEXTO Y GRÁFICOS CON FORMATO CUYO OBJETIVO ES FACILITAR LA TRANSFERENCIA ENTRE FORMATO CUYO OBJETIVO ES FACILITAR LA TRANSFERENCIA ENTRE APLICACIONES Y PLATAFORMAS DESARROLLADO POR MICROSOFT.APLICACIONES Y PLATAFORMAS DESARROLLADO POR MICROSOFT.

PUEDE SER UTILIZADO POR DIFERENTES DISPOSITIVOS DE SALIDA, PUEDE SER UTILIZADO POR DIFERENTES DISPOSITIVOS DE SALIDA, ENTORNOS Y SISTEMAS OPERATIVOS.ENTORNOS Y SISTEMAS OPERATIVOS.

CONJUNTO DE CARACTERES ANSI (PCCONJUNTO DE CARACTERES ANSI (PC--8 de Macintosh o IBM) PARA 8 de Macintosh o IBM) PARA CODIFICAR EL CONTENIDO Y FORMATO DE UN DOCUMENTO, TANTO CODIFICAR EL CONTENIDO Y FORMATO DE UN DOCUMENTO, TANTO EN PANTALLA COMO PARA SU IMPRESIÓN EN PAPEL.EN PANTALLA COMO PARA SU IMPRESIÓN EN PAPEL.

ELEMENTOS DE UN ARCHIVO RTFELEMENTOS DE UN ARCHIVO RTF–– Texto sin formato : ASCIITexto sin formato : ASCII–– Códigos de control “Códigos de control “\\secuencia_letras_alfabéticassecuencia_letras_alfabéticas <Delimitador>”<Delimitador>”–– Símbolos de control “Símbolos de control “\\+1carácter no alfabético”+1carácter no alfabético”–– Grupos “{ textos|códigos de control|símbolos de control}*”Grupos “{ textos|códigos de control|símbolos de control}*”

Sistemas Multimedia e Interacción Gráfica- Curso 2005/06 12

Sintaxis de RTF (I). EL INTERIOR DE UN ARCHIVO EN FORMATO RTF CONSISTE EN UNA EL INTERIOR DE UN ARCHIVO EN FORMATO RTF CONSISTE EN UNA SERIE DE CÓDIGOS ORGANIZADOS DE LA FORMA:SERIE DE CÓDIGOS ORGANIZADOS DE LA FORMA:

{<{<headerheader><><documentdocument>>}}

–– Encabezado (Encabezado (headerheader):): Contiene elementos como la versión de RTF, conjunto de Contiene elementos como la versión de RTF, conjunto de caracteres, tablas de fuentes, fuentes contenidas (caracteres, tablas de fuentes, fuentes contenidas (EmbeddingEmbedding), soporte de ), soporte de códigos de página, tablas de ficheros, tablas de color, definicicódigos de página, tablas de ficheros, tablas de color, definición de estilos y ón de estilos y marcas de revisión.marcas de revisión.

<<headerheader>: >: ||rtfrtf <<charsetcharset> | > | deffdeff??<<fonttblfonttbl><><filetblfiletbl>?<>?<colortblcolortbl>?<>?<stylesheetstylesheet>?<>?<revtblrevtbl>?>?

Conjunto de caracteresConjunto de caracteres: incluye Windows ANSI, IBM PC, IBM 850 y Macintosh.: incluye Windows ANSI, IBM PC, IBM 850 y Macintosh.Tabla de fuentes (Tabla de fuentes (fontsfonts)): incluye una lista de las fuentes utilizadas en el documento. : incluye una lista de las fuentes utilizadas en el documento. Éstas son Éstas son mapeadasmapeadas sobre las fuentes disponibles en la aplicación recipiendaria.sobre las fuentes disponibles en la aplicación recipiendaria.Tabla de coloresTabla de colores: incluye una lista de los colores utilizados en el documento pa: incluye una lista de los colores utilizados en el documento para ra remarcar el texto. remarcar el texto.

Page 7: 2. Texto. - UMdis.um.es/~jfernand/0506/smig/tema2.pdf · zlas ventajas de crear archivos en otras aplicaciones y convertirlos a pdf son las siguientes: – es un proceso rÁpido y

7

Sistemas Multimedia e Interacción Gráfica- Curso 2005/06 13

Sintaxis de RTF (II).

–– Área de Documento (Área de Documento (documentdocument):): donde se encuentra la codificación de grupos de donde se encuentra la codificación de grupos de información, propiedades de formato del documento, texto y propiinformación, propiedades de formato del documento, texto y propiedades de la edades de la sección, cabeceras y pies de página, párrafos y propiedades, sansección, cabeceras y pies de página, párrafos y propiedades, sangrías, listas, grías, listas, bordes y sombras de párrafos, posición de objetos y marcos, tablbordes y sombras de párrafos, posición de objetos y marcos, tablas, caracteres y as, caracteres y propiedades de los mismos, etc.propiedades de los mismos, etc.

<<documentdocument>: <>: <infoinfo>? <>? <docfmtdocfmt>* <>* <sectionsection>+>+

Formato del documentoFormato del documento: márgenes e : márgenes e indentaciónindentación de párrafos con relación a los de párrafos con relación a los márgenes.márgenes.Formato de seccionesFormato de secciones: saltos de sección y saltos de página.: saltos de sección y saltos de página.Formato de párrafosFormato de párrafos: caracteres de control para justificación de párrafos, posición: caracteres de control para justificación de párrafos, posición de de tabuladores, tabuladores, indentaciónindentación y espaciado entre párrafos.y espaciado entre párrafos.Formato generalFormato general: incluye notas al pie de página, anotaciones, marcas y dibujos.: incluye notas al pie de página, anotaciones, marcas y dibujos.Formato de caracteresFormato de caracteres: negrita, itálica, subrayado, sombreado y : negrita, itálica, subrayado, sombreado y outlineoutline, subíndices y , subíndices y superíndices.superíndices.Caracteres especialesCaracteres especiales: : backslashesbackslashes, etc., etc.

Sistemas Multimedia e Interacción Gráfica- Curso 2005/06 14

Adobe PostScript (I).

¿FORMATO DE TEXTO O LENGUAJE DE PROGRAMACIÓN?

IMPRESIONES DE GRAN CALIDAD y FIABILIDAD EN EDICIÓN PROFESIONAL

SOPORTADO POR IMPRESORAS, MONITORES, PRENSAS DIGITALES.

CARÁCTER VECTORIAL. PÁGINAS COMO UNA SERIE DE OBJETOS GEOMÉTRICOS ABSTRACTOS.

LOS TIPOS DE LETRA POSTSCRIPT DEFINEN EL CONTORNO (outline) DE CADA CARÁCTER.

Page 8: 2. Texto. - UMdis.um.es/~jfernand/0506/smig/tema2.pdf · zlas ventajas de crear archivos en otras aplicaciones y convertirlos a pdf son las siguientes: – es un proceso rÁpido y

8

Sistemas Multimedia e Interacción Gráfica- Curso 2005/06 15

Adobe PostScript (II).

IMPRESORAS NO POSTSCRIPT MAPAS DE BITS

CADA IMPRESORA PS CONTIENE UN INTÉRPRETE QUE EJECUTA LAS ÓRDENES PS (driver).

EXISTEN TRES VERSIONES BÁSICAS DE POSTSCRIPT: Level 1, Level 2 (mejor para color) y PostScript 3 (más fuentes, mejores gráficos, aceleración).

Sistemas Multimedia e Interacción Gráfica- Curso 2005/06 16

Adobe PDF (I)

ALGUNOS PROBLEMAS COMUNES SON LOS SIGUIENTES– INDISPONIBILIDAD DE APLICACIONES ORIGINARIAS.– INCOMPATIBILIDADES DE FORMATO y VERSIONES.– IMPRESIÓN INCORRECTA.

ESTÁNDAR DE FACTO EN LA DISTRIBUCIÓN DE DOCUMENTOS ELECTRÓNICOS

PRESERVA TODAS LAS FUENTES, EL FORMATO, LOS COLORES Y LOS GRÁFICOS (además de hipervínculos y controles ActiveX) DE CUALQUIER DOCUMENTO FUENTE, SIN QUE IMPORTE LA APLICACIÓN NI LA PLATAFORMA USADAS EN SU CREACIÓN.

BASADO EN EL LENGUAJE PS Y CÓMO ESTE, DESCRIBE LOS TIPOS DE LETRA, IMÁGENES Y OTROS ELEMENTOS DE UNA PÁGINA COMO UNA SERIE DE OBJETOS Y RELACIONES MATEMÁTICAS.

Page 9: 2. Texto. - UMdis.um.es/~jfernand/0506/smig/tema2.pdf · zlas ventajas de crear archivos en otras aplicaciones y convertirlos a pdf son las siguientes: – es un proceso rÁpido y

9

Sistemas Multimedia e Interacción Gráfica- Curso 2005/06 17

Adobe PDF (II)

LAS FUENTES DE CARACTERES SE CODIFICAN CÓMO DESCRIPCIONES MATEMÁTICAS DE LÍNEAS, CURVAS Y DISTANCIAS ENTRE CONJUNTOS DE PUNTOS.

– Ej: EL CARÁCTER V CONSTA FUNDAMENTALMENTE DE TRES PUNTOS (superior izquierdo, superior derecho y el inferior donde las dos líneas confluyen). LA DESCRIPCIÓN MATEMÁTICA DESCRIBE LAS LÍNEAS EXISTENTES ENTRE LOS TRES PUNTOS, LA DISTANCIA RELATIVA ENTRE ELLOS, EL GROSOR DE LA LÍNEA Y EL TAMAÑO DEL CARÁCTER.

PERMITEN VER EN PANTALLA LA FORMA QUE EL DOCUMENTO TOMA A LA HORA DE SER IMPRESO, POR LO QUE SE DENOMINAN WYSIWYG (what you see is what you get)

LOS ARCHIVOS PDF SON COMPACTOS (más pequeños que sus archivos fuente)

Sistemas Multimedia e Interacción Gráfica- Curso 2005/06 18

Adobe PDF (III)

LOS ARCHIVOS PDF PUEDEN PUBLICARSE Y DISTRIBUIRSE EN TODAS PARTES: IMPRESOS, ADJUNTOS EN UN MENSAJE DE CORREO ELECTRÓNICO, EN SERVIDORES CORPORATIVOS, EN SITIOS WEB O EN CD-ROM.

CREACIÓN DE DOCUMENTOS– USANDO CÓDIGOS PS– CREAR LOS DOCUMENTOS CON OTRAS APLICACIONES Y CONVERTIDOS

A PDF.

LAS VENTAJAS DE CREAR ARCHIVOS EN OTRAS APLICACIONES Y CONVERTIRLOS A PDF SON LAS SIGUIENTES:

– ES UN PROCESO RÁPIDO Y SENCILLO.– EL DOCUMENTO FINAL PDF MANTIENE EL FORMATO DE LA

PÁGINA, LAS FUENTES Y LA CALIDAD DE IMÁGENES DEL ORIGINAL.

– PERMITE AL USUARIO SEGUIR UTILIZANDO LAS HERRAMIENTAS QUE LE SON FAMILIARES.

Page 10: 2. Texto. - UMdis.um.es/~jfernand/0506/smig/tema2.pdf · zlas ventajas de crear archivos en otras aplicaciones y convertirlos a pdf son las siguientes: – es un proceso rÁpido y

10

Sistemas Multimedia e Interacción Gráfica- Curso 2005/06 19

PostScript vs PDF (I)

POSTSCRIPT ESTÁ DISEÑADO PARA UNA ÚNICA COSA: DESCRIBIR DE FORMA PRECISA LO QUE DEBE APARECER EN UNA PÁGINA.

– NECESITA SER PROCESADO O EJECUTADO.– ESTO LO REALIZA UNA COMBINACIÓN DE HARDWARE Y

SOFTWARE (QUÉ TÍPICAMENTE RESIDE EN UNA IMPRESORA) Y QUE SE LLAMA RIP (RASTER IMAGE PROCESSOR).

– UN RIP TOMA EL CÓDIGO POSTSCRIPT Y LO TRADUCE A PUNTOS EN UNA PÁGINA.

– TAMBIÉN ES POSIBLE TRABAJAR CON FICHEROS EPS (ENCAPSULATED POSTSCRIPT) QUE, SIMPLEMENTE, SON UN PROGRAMA POSTSCRIPT , GUARDADO EN FORMA DE FICHERO QUE INCLUYE UNA VERSIÓN DE MENOR RESOLUCIÓN VISUALIZABLE “ENCAPSULADA” EN SU INTERIOR..

Sistemas Multimedia e Interacción Gráfica- Curso 2005/06 20

PostScript & PDF (II)

PDF ESTÁ CONSTRUIDO SOBRE EL LENGUAJE PDF ESTÁ CONSTRUIDO SOBRE EL LENGUAJE POSTSCRIPT Y ADEMAS DE DESCRIBIR, RECOGE POSTSCRIPT Y ADEMAS DE DESCRIBIR, RECOGE INFORMACIÓN ACERCA DEL TIPO DE INFORMACIÓN ESTÁ INFORMACIÓN ACERCA DEL TIPO DE INFORMACIÓN ESTÁ CONTENIDA EN EL FICHERO.CONTENIDA EN EL FICHERO.

UN ARCHIVO PDF PUEDE CONTENER FUENTES DE UN ARCHIVO PDF PUEDE CONTENER FUENTES DE LETRAS, IMÁGENES, INSTRUCCIONES DE IMPRESIÓN, LETRAS, IMÁGENES, INSTRUCCIONES DE IMPRESIÓN, PALABRAS CLAVE PARA REALIZAR BÚSQUEDAS Y PALABRAS CLAVE PARA REALIZAR BÚSQUEDAS Y CATALOGACIONES, MARCADORES, ENLACES CATALOGACIONES, MARCADORES, ENLACES INTERACTIVOS, VIDEOS, MECANISMOS DE PROTECCIÓN, INTERACTIVOS, VIDEOS, MECANISMOS DE PROTECCIÓN, ETC.ETC.

UN FICHERO PDF ES, REALMENTE, UN FICHERO POSTSCRIPT UN FICHERO PDF ES, REALMENTE, UN FICHERO POSTSCRIPT QUE YA HA SIDO INTERPRETADO Y DESCOMPUESTO EN QUE YA HA SIDO INTERPRETADO Y DESCOMPUESTO EN OBJETOS CLARAMENTE DEFINIDOS.OBJETOS CLARAMENTE DEFINIDOS.

Page 11: 2. Texto. - UMdis.um.es/~jfernand/0506/smig/tema2.pdf · zlas ventajas de crear archivos en otras aplicaciones y convertirlos a pdf son las siguientes: – es un proceso rÁpido y

11

Sistemas Multimedia e Interacción Gráfica- Curso 2005/06 21

PostScript & PDF (III)

ESTOS OBJETOS SON VISIBLES EN PANTALLA, NO ESTOS OBJETOS SON VISIBLES EN PANTALLA, NO CÓMO CÓDIGO, SINO COMO LA APARIENCIA FINAL CÓMO CÓDIGO, SINO COMO LA APARIENCIA FINAL DE ESOS OBJETOS.DE ESOS OBJETOS.

PUESTO QUE LOS OBJETOS YA HAN SIDO PUESTO QUE LOS OBJETOS YA HAN SIDO INTERPRETADOS, SON MÁS FIABLES QUE UN INTERPRETADOS, SON MÁS FIABLES QUE UN ARCHIVO EPS O PS.ARCHIVO EPS O PS.

LA VISUALIZACION EN PANTALLA PERMITE LA VISUALIZACION EN PANTALLA PERMITE IDENTIFICAR POSIBLES ERRORES EN LA IDENTIFICAR POSIBLES ERRORES EN LA OPERACIÓN DE IMPRESIÓN.OPERACIÓN DE IMPRESIÓN.

Sistemas Multimedia e Interacción Gráfica- Curso 2005/06 22

PostScript & PDF (IV)Para imprimir un fichero PDF, sin embargo, aPara imprimir un fichero PDF, sin embargo, aúún hay que reconstruir n hay que reconstruir los objetos PDF en la plos objetos PDF en la páágina y una impresora PostScript sigue gina y una impresora PostScript sigue siendo la forma msiendo la forma máás fiable de hacer este proceso. s fiable de hacer este proceso.

Existen impresoras que reconocen el lenguaje PostScript y el PDFExisten impresoras que reconocen el lenguaje PostScript y el PDF. .

PDF ha reemplazado a EPS y es utilizado como formato de PDF ha reemplazado a EPS y es utilizado como formato de distribucidistribucióón para el envn para el envíío de publicaciones completas a la imprenta, o de publicaciones completas a la imprenta, comprobacicomprobacióón de resultados en n de resultados en maquetacimaquetacióónn, distribuci, distribucióón en n en Internet y almacenamiento de ficheros puesto que es totalmente Internet y almacenamiento de ficheros puesto que es totalmente autocontenidoautocontenido..

Sin embargo, para imprimir PDF con la mayor calidad se precisa dSin embargo, para imprimir PDF con la mayor calidad se precisa de e un dispositivo, al menos compatible, Adobe PostScript para obtenun dispositivo, al menos compatible, Adobe PostScript para obtener er una buena calidad.una buena calidad.

Page 12: 2. Texto. - UMdis.um.es/~jfernand/0506/smig/tema2.pdf · zlas ventajas de crear archivos en otras aplicaciones y convertirlos a pdf son las siguientes: – es un proceso rÁpido y

12

Sistemas Multimedia e Interacción Gráfica- Curso 2005/06 23

Estándares orientados a contenidos web

SGML

HTML

XML

Sistemas Multimedia e Interacción Gráfica- Curso 2005/06 24

IntroducciónBasados en mark-up (marcado)– Anotaciones junto al texto original para mejorar la

apariencia– Permite incluir información (códigos) para el

procesado electrónicoMarcado original (procedural)– Especificación detallada de apariencia– Se pierde la estructura del documento– Falta de portabilidad y flexibilidad– Alta tasa de errores

Page 13: 2. Texto. - UMdis.um.es/~jfernand/0506/smig/tema2.pdf · zlas ventajas de crear archivos en otras aplicaciones y convertirlos a pdf son las siguientes: – es un proceso rÁpido y

13

Sistemas Multimedia e Interacción Gráfica- Curso 2005/06 25

Evolución del marcadoCodificación genérica

– Uso de etiquetas de estilo– Mayor portabilidad y flexibilidad– Mayor fidelidad a la descripción de la estructura del

documento (cita, título,..)– Posibilidad de ciertos procesos automáticos (p.ej.,

índices)

Lenguajes de marcado generalizado– Descripción de la estructura del documento frente a

formato y estilo anterior– Marcado único– Formalismo para su procesamiento automático

Sistemas Multimedia e Interacción Gráfica- Curso 2005/06 26

SGML (Standard Generalized MarkupLanguage) (I).

SGML fue desarrollado en 1986 por ISO (ISO 8879) SGML fue desarrollado en 1986 por ISO (ISO 8879) cómo estándar de lenguaje de marcado generalizado cómo estándar de lenguaje de marcado generalizado para el intercambio de documentos en soporte para el intercambio de documentos en soporte electrónico, su almacenamiento y procesado.electrónico, su almacenamiento y procesado.

SGML es la base de dos estándares esenciales en SGML es la base de dos estándares esenciales en Internet:Internet:

–– HTML, el estándar más usado en la realización de páginas HTML, el estándar más usado en la realización de páginas WEB.WEB.

–– XML, metalenguaje de definición de lenguajes de marcas.XML, metalenguaje de definición de lenguajes de marcas.

Page 14: 2. Texto. - UMdis.um.es/~jfernand/0506/smig/tema2.pdf · zlas ventajas de crear archivos en otras aplicaciones y convertirlos a pdf son las siguientes: – es un proceso rÁpido y

14

Sistemas Multimedia e Interacción Gráfica- Curso 2005/06 27

SGML (Standard Generalized MarkupLanguage) (II).

Ámbito de usoÁmbito de usoComplejidad Complejidad Descripción de Descripción de DTDsDTDsNo especifica formatoNo especifica formatoObjetivo: Estructura, ignora aparienciaObjetivo: Estructura, ignora aparienciaEstructura: elementos + relacionesEstructura: elementos + relaciones

Sistemas Multimedia e Interacción Gráfica- Curso 2005/06 28

SGML (Standard Generalized MarkupLanguage) (III).

No impone No impone estructura…seestructura…se adapta a ellaadapta a ella

Posibles tratamientos a partir de la estructuraPosibles tratamientos a partir de la estructura–– Formato de documentoFormato de documento–– Generación de índices o elementos relevantesGeneración de índices o elementos relevantes–– Conversiones de estructuraConversiones de estructura–– Adaptación a diversos dispositivos de salidaAdaptación a diversos dispositivos de salida

Reutilización de documentos SGMLReutilización de documentos SGML

Page 15: 2. Texto. - UMdis.um.es/~jfernand/0506/smig/tema2.pdf · zlas ventajas de crear archivos en otras aplicaciones y convertirlos a pdf son las siguientes: – es un proceso rÁpido y

15

Sistemas Multimedia e Interacción Gráfica- Curso 2005/06 29

HTML (HyperText Markup Language) (I). ES UN LENGUAJE DE MARCAS BASE DE LA ACTUAL WWW.ES UN LENGUAJE DE MARCAS BASE DE LA ACTUAL WWW.

ES UN FORMATO NO PROPIETARIO BASADO EN SGML.ES UN FORMATO NO PROPIETARIO BASADO EN SGML.

LOS TÍTULOS, CABECERAS, PÁRRAFOS, ETC. ESTÁN LOS TÍTULOS, CABECERAS, PÁRRAFOS, ETC. ESTÁN INDICADOS CÓMO TALES EN EL DOCUMENTO.INDICADOS CÓMO TALES EN EL DOCUMENTO.

ES POSIBLE LA INCLUSIÓN DE ENLACES EN EL DOCUMENTO, ES POSIBLE LA INCLUSIÓN DE ENLACES EN EL DOCUMENTO, GRACIAS A LAS POSIBILIDADES HIPERMEDIA DE ESTE GRACIAS A LAS POSIBILIDADES HIPERMEDIA DE ESTE LENGUAJE.LENGUAJE.

ES IMPORTANTE INDICAR QUE DEPENDIENDO DEL ES IMPORTANTE INDICAR QUE DEPENDIENDO DEL VISUALIZADOR UTILIZADO, EL ASPECTO FINAL DE LOS VISUALIZADOR UTILIZADO, EL ASPECTO FINAL DE LOS DIFERENTES ELEMENTOS INCLUIDOS EN EL DOCUMENTO, DIFERENTES ELEMENTOS INCLUIDOS EN EL DOCUMENTO, PUEDE SER DIFERENTE.PUEDE SER DIFERENTE.

Sistemas Multimedia e Interacción Gráfica- Curso 2005/06 30

HTML (HyperText Markup Language) (II).

UN DOCUMENTO HTML ESTÁ CODIFICADO EN TEXTO PLANO UN DOCUMENTO HTML ESTÁ CODIFICADO EN TEXTO PLANO (ASCII) POR LO QUE PUEDE SER GENERADO CON CASI (ASCII) POR LO QUE PUEDE SER GENERADO CON CASI CUALQUIER EDITOR DE TEXTO: VI, EDIT, NOTEPAD, ETC., EN CUALQUIER EDITOR DE TEXTO: VI, EDIT, NOTEPAD, ETC., EN GENERAL, CUALQUIER PROCESADOR DE TEXTO QUE PERMITA GENERAL, CUALQUIER PROCESADOR DE TEXTO QUE PERMITA GUARDAR LOS DOCUMENTOS EN FORMATO DE TEXTO.GUARDAR LOS DOCUMENTOS EN FORMATO DE TEXTO.

EL FORMATO DEL DOCUMENTO SE ESPECIFICA MEDIANTE EL FORMATO DEL DOCUMENTO SE ESPECIFICA MEDIANTE MARCADORES O TAGS QUE INDICAN EL INICIO Y EL FIN DE UNA MARCADORES O TAGS QUE INDICAN EL INICIO Y EL FIN DE UNA DETERMINADA OPCIÓN DE FORMATO APLICABLE AL TEXTO DETERMINADA OPCIÓN DE FORMATO APLICABLE AL TEXTO SITUADO ENTRE AMBOS.SITUADO ENTRE AMBOS.

LOS CÓDIGOS DE CONTROL COMIENZAN CON EL SÍMBOLO “<“ Y LOS CÓDIGOS DE CONTROL COMIENZAN CON EL SÍMBOLO “<“ Y TERMINAN CON EL SÍMBOLO “>”.TERMINAN CON EL SÍMBOLO “>”.

Page 16: 2. Texto. - UMdis.um.es/~jfernand/0506/smig/tema2.pdf · zlas ventajas de crear archivos en otras aplicaciones y convertirlos a pdf son las siguientes: – es un proceso rÁpido y

16

Sistemas Multimedia e Interacción Gráfica- Curso 2005/06 31

HTML (HyperText Markup Language) (III).

LA MAYORÍA TIENEN SU CORRESPONDIENTE MARCADOR DE LA MAYORÍA TIENEN SU CORRESPONDIENTE MARCADOR DE FINAL, QUE ES SIMILAR AL INICIAL, PERO INCLUYENDO EL FINAL, QUE ES SIMILAR AL INICIAL, PERO INCLUYENDO EL CARÁCTER “/”. Ej: <title> Titulo </title>. CARÁCTER “/”. Ej: <title> Titulo </title>.

De acuerdo con el estándar, para que un texto sea reconocido comDe acuerdo con el estándar, para que un texto sea reconocido como o HTML deberá incorporar:HTML deberá incorporar:

–– identificador de tipo de documento mediante el marcador <identificador de tipo de documento mediante el marcador <htmlhtml> al > al principio del fichero y >/principio del fichero y >/htmlhtml> al final del mismo.> al final del mismo.

–– Tendrá una estructura básica que consta de:Tendrá una estructura básica que consta de:cabecera (<cabecera (<headhead>).>).Título Título --> Dentro de la cabecera (<> Dentro de la cabecera (<titletitle>).>).Cuerpo del documento (<Cuerpo del documento (<bodybody>).>).

–– El fichero debe tener además la extensión “.html” (ó .htm).El fichero debe tener además la extensión “.html” (ó .htm).

Sistemas Multimedia e Interacción Gráfica- Curso 2005/06 32

PDF vs HTML –– PortabilidadPortabilidad

–– AparienciaApariencia

–– PaginaciónPaginación

–– Control de visualización e impresiónControl de visualización e impresión

–– Facilidad para cambiosFacilidad para cambios

–– TamañoTamaño

–– Propiedad del formatoPropiedad del formato

–– Coste de conversiónCoste de conversión

Page 17: 2. Texto. - UMdis.um.es/~jfernand/0506/smig/tema2.pdf · zlas ventajas de crear archivos en otras aplicaciones y convertirlos a pdf son las siguientes: – es un proceso rÁpido y

17

Sistemas Multimedia e Interacción Gráfica- Curso 2005/06 33

XML Introducción

Manteniendo la filosofía SGML, de él se derivó XML como subconjuManteniendo la filosofía SGML, de él se derivó XML como subconjunto nto simplificado, eliminando las partes más engorrosas y menos útilesimplificado, eliminando las partes más engorrosas y menos útiles. s.

XML es un XML es un METALENGUAJEMETALENGUAJE: es un lenguaje para definir lenguajes.: es un lenguaje para definir lenguajes.

Sistemas Multimedia e Interacción Gráfica- Curso 2005/06 34

Estructura de un documento XML(I).

EN EL SIGUIENTE EJEMPLO PODEMOS COMPRENDER RÁPIDAMENTE EN EL SIGUIENTE EJEMPLO PODEMOS COMPRENDER RÁPIDAMENTE LA ESTRUCTURA DE UN DOCUMENTO XML (LA ESTRUCTURA DE UN DOCUMENTO XML (mensaje.xmlmensaje.xml).).

<?xml version="1.0“<?xml version="1.0“?>?><!DOCTYPE MENSAJE SYSTEM “mensaje.dtd”><!DOCTYPE MENSAJE SYSTEM “mensaje.dtd”><<mensajemensaje> > <<remiteremite>><nombre><nombre>JesualdoJesualdo Fernández</nombre>Fernández</nombre><<emailemail>>[email protected]@dif.um.es</email></email>

</remite></remite><destinatario><destinatario><nombre>Pedro Pérez</nombre/><nombre>Pedro Pérez</nombre/><<emailemail>>[email protected]@wanadoo.es</email></email>

</destinatario></destinatario><asunto>Hola Pedro</asunto><asunto>Hola Pedro</asunto><texto><texto><<parrafoparrafo>¿Hola que tal? Hace <>¿Hola que tal? Hace <enfasisenfasis>mucho</>mucho</enfasisenfasis> que> queno escribes. A ver si llamas y quedamos para tomar algo.</no escribes. A ver si llamas y quedamos para tomar algo.</parrafoparrafo>>

</texto></texto></mensaje></mensaje>

Page 18: 2. Texto. - UMdis.um.es/~jfernand/0506/smig/tema2.pdf · zlas ventajas de crear archivos en otras aplicaciones y convertirlos a pdf son las siguientes: – es un proceso rÁpido y

18

Sistemas Multimedia e Interacción Gráfica- Curso 2005/06 35

Estructura de un documento XML(II).

Este mismo documento puede verse de forma gráfica, para comprendEste mismo documento puede verse de forma gráfica, para comprender mejor er mejor la estructura de un documento XML.la estructura de un documento XML.

mensaje

remite

destinatario

asunto: Hola Pedro

texto

nombre: Jesualdo Fernández

email: [email protected]

nombre: Pedro Pérez

email: [email protected]

parrafo: ¿Hola que tal? ...

.....................

Sistemas Multimedia e Interacción Gráfica- Curso 2005/06 36

Estructura de un documento XML(III).

AUNQUE NO ES OBLIGATORIO, LOS DOCUMENTOS XML PUEDEN EMPEZAR CON UNAS LÍNEAS QUE DESCRIBEN LA VERSIÓN DE XML, EL TIPO DE DOCUMENTO Y OTRAS COSAS.

<?xml version=“1.0” encoding=“UTF-7” standalone=“yes”?>

Page 19: 2. Texto. - UMdis.um.es/~jfernand/0506/smig/tema2.pdf · zlas ventajas de crear archivos en otras aplicaciones y convertirlos a pdf son las siguientes: – es un proceso rÁpido y

19

Sistemas Multimedia e Interacción Gráfica- Curso 2005/06 37

LA SEGUNDA LÍNEA O “DECLARACIÓN DE TIPO DE DOCUMENTO” LA SEGUNDA LÍNEA O “DECLARACIÓN DE TIPO DE DOCUMENTO” DEFINE QUE DTD (DOCUMENT TYPE DEFINITION) VALIDA Y DEFINE DEFINE QUE DTD (DOCUMENT TYPE DEFINITION) VALIDA Y DEFINE LOS DATOS QUE CONTIENE NUESTRO DOCUMENTO XML.LOS DATOS QUE CONTIENE NUESTRO DOCUMENTO XML.

<!DOCTYPE mensaje SYSTEM <!DOCTYPE mensaje SYSTEM “mensaje.dtd”“mensaje.dtd”>><mensaje><mensaje>

<!<!–– El contenido mensaje va aquí El contenido mensaje va aquí !!-->></mensaje></mensaje>

<!DOCTYPE etiqueta SYSTEM <!DOCTYPE etiqueta SYSTEM “http://www.empresa.com/dtds/etiqueta.dtd”“http://www.empresa.com/dtds/etiqueta.dtd”>><etiqueta><etiqueta>

<!<!–– El contenido etiqueta va aquí El contenido etiqueta va aquí !!-->></etiqueta></etiqueta>

Estructura de un documento XML(IV).

Sistemas Multimedia e Interacción Gráfica- Curso 2005/06 38

Estructura de un documento XML(IV).

LOS ELEMENTOS XML PUEDEN TENER CONTENIDO (MÁS LOS ELEMENTOS XML PUEDEN TENER CONTENIDO (MÁS ELEMENTOS, ATRIBUTOS, O AMBOS A LA VEZ, O BIEN SER ELEMENTOS, ATRIBUTOS, O AMBOS A LA VEZ, O BIEN SER ELEMENTOS VACÍOS.ELEMENTOS VACÍOS.

EJEMPLOS DE ELEMENTOS CON CONTENIDO SON LOS EJEMPLOS DE ELEMENTOS CON CONTENIDO SON LOS SIGUIENTES:SIGUIENTES:

<nombre><nombre>JesualdoJesualdo FernándezFernández</nombre></nombre><alarma tipo=<alarma tipo=“robo” “robo” planta=planta=“primera”“primera” puerta=puerta=“1.9”“1.9”>>Evacuen el edificioEvacuen el edificio</alarma></alarma>

LOS ELEMENTOS XML SIEMPRE EMPIEZAN CON UNA <etiqueta> LOS ELEMENTOS XML SIEMPRE EMPIEZAN CON UNA <etiqueta> QUE PUEDE CONTENER ATRIBUTOS O NO, Y TERMINA CON QUE PUEDE CONTENER ATRIBUTOS O NO, Y TERMINA CON UNA </etiqueta> QUE DEBE TENER EL MISMO NOMBRE. AL UNA </etiqueta> QUE DEBE TENER EL MISMO NOMBRE. AL CONTRARIO QUE EN HTML, EN XML SIEMPRE SE DEBE “cerrar” CONTRARIO QUE EN HTML, EN XML SIEMPRE SE DEBE “cerrar” UN ELEMENTO.UN ELEMENTO.

Page 20: 2. Texto. - UMdis.um.es/~jfernand/0506/smig/tema2.pdf · zlas ventajas de crear archivos en otras aplicaciones y convertirlos a pdf son las siguientes: – es un proceso rÁpido y

20

Sistemas Multimedia e Interacción Gráfica- Curso 2005/06 39

DOCUMENT TYPE DEFINITIONS (DTDs) (I).

CREAR UNA DEFINICIÓN DEL TIPO DE DOCUMENTO (DTD) ES CREAR UNA DEFINICIÓN DEL TIPO DE DOCUMENTO (DTD) ES COMO CREAR NUESTRO PROPIO LENGUAJE DE MARCADO, COMO CREAR NUESTRO PROPIO LENGUAJE DE MARCADO, PARA UNA APLICACIÓN ESPECÍFICA.PARA UNA APLICACIÓN ESPECÍFICA.

POR EJEMPLO, PODRÍAMOS CREAR UN DTD QUE DEFINA UNA POR EJEMPLO, PODRÍAMOS CREAR UN DTD QUE DEFINA UNA TARJETA DE VISITA. A PARTIR DE ESTE DTD, TENDRÍAMOS TARJETA DE VISITA. A PARTIR DE ESTE DTD, TENDRÍAMOS UNA SERIE DE ELEMENTOS XML QUE NOS PERMITIRÍAN UNA SERIE DE ELEMENTOS XML QUE NOS PERMITIRÍAN DEFINIR TARJETAS DE VISITA.DEFINIR TARJETAS DE VISITA.

EL DTD DEFINE LOS TIPOS DE ELEMENTOS, ATRIBUTOS Y EL DTD DEFINE LOS TIPOS DE ELEMENTOS, ATRIBUTOS Y ENTIDADES PERMITIDAS, Y PUEDE EXPRESAR ALGUNAS ENTIDADES PERMITIDAS, Y PUEDE EXPRESAR ALGUNAS LIMITACIONES PARA COMBINARLOS.LIMITACIONES PARA COMBINARLOS.

Sistemas Multimedia e Interacción Gráfica- Curso 2005/06 40

DOCUMENT TYPE DEFINITIONS (DTDs) (II).

LA DTD PUEDE RESIDIR EN UN FICHERO EXTERNO O BIEN ESTARÁ LA DTD PUEDE RESIDIR EN UN FICHERO EXTERNO O BIEN ESTARÁ CONTENIDO EN EL PROPIO DOCUMENTO XML (CONTENIDO EN EL PROPIO DOCUMENTO XML (standalonestandalone).).

Ejemplo:Ejemplo:<!DOCTYPE <!DOCTYPE direcciondireccion [[<!ELEMENT <!ELEMENT direccion(nombre_calledireccion(nombre_calle, , poblacionpoblacion, , cpcp, ciudad, , ciudad, paispais))>><!ELEMENT <!ELEMENT nombre_callenombre_calle (#PCDATA)>(#PCDATA)><!ELEMENT <!ELEMENT poblacionpoblacion (#PCDATA)>(#PCDATA)><!ELEMENT <!ELEMENT cpcp (#PCDATA)>(#PCDATA)><!ELEMENT <!ELEMENT ciudadciudad (#PCDATA)>(#PCDATA)><!ELEMENT <!ELEMENT paispais (#PCDATA)>(#PCDATA)>]>]>

<<direcciondireccion>><nombre_calle><nombre_calle>Calle MayorCalle Mayor</nombre_calle></nombre_calle><<poblacionpoblacion>>MonteagudoMonteagudo</</poblacionpoblacion>><<cpcp>>3016030160</</cpcp>><ciudad><ciudad>MurciaMurcia</ciudad></ciudad><<paispais>>EspañaEspaña</</paispais>></</direcciondireccion>>

Page 21: 2. Texto. - UMdis.um.es/~jfernand/0506/smig/tema2.pdf · zlas ventajas de crear archivos en otras aplicaciones y convertirlos a pdf son las siguientes: – es un proceso rÁpido y

21

Sistemas Multimedia e Interacción Gráfica- Curso 2005/06 41

Ejemplo de DTD (I). Crear un DTD para representar la información de un listín telefóCrear un DTD para representar la información de un listín telefónico con la nico con la información siguiente:información siguiente:

El listín estará formado por varias personas.El listín estará formado por varias personas.

Los datos que necesitamos conocer para cada persona son los siguLos datos que necesitamos conocer para cada persona son los siguientes:ientes:Cada persona debe tener un identificador único que la representeCada persona debe tener un identificador único que la represente..Nombre.Nombre.Dirección, formada por CP, población y provincia.Dirección, formada por CP, población y provincia.Teléfono.Teléfono.0 o más e0 o más e--mailsmails..Género.Género.

Sistemas Multimedia e Interacción Gráfica- Curso 2005/06 42

Ejemplo de DTD (II). Fichero LISTIN.DTD

<?xml encoding=“UTF-8”?><!ELEMENT listin (persona)+><!ELEMENT persona (nombre, direccion, email*)><!ATTLIST persona id ID #REQUIRED><!ATTLIST persona género (hombre | mujer) #IMPLIED><!ELEMENT nombre (#PCDATA)><!ELEMENT direccion (cp, poblacion, provincia)><!ELEMENT cp (#PCDATA)><!ELEMENT poblacion (#PCDATA)><!ELEMENT provincia (#PCDATA)><!ELEMENT email (#PCDATA)>

Basándonos en el anterior DTD podemos escribir el siguiente listín:

<?xml version=“1.0”?><!DOCTYPE listin SYSTEM “LISTIN.DTD”><listin>

<persona género=“hombre” id=“luis”><nombre>Luis Andrés</nombre><direccion>

<cp>10000</cp><poblacion>Madrid</poblacion><provincia>Madrid</provincia>

</direccion><email>[email protected]</email></persona>

</listin>

Page 22: 2. Texto. - UMdis.um.es/~jfernand/0506/smig/tema2.pdf · zlas ventajas de crear archivos en otras aplicaciones y convertirlos a pdf son las siguientes: – es un proceso rÁpido y

22

Sistemas Multimedia e Interacción Gráfica- Curso 2005/06 43

Ejercicio para casaHacer un DTD de un catálogo de productos.– Un catálogo contiene una serie de productos– Un producto tiene una serie de especificaciones, un

precio, y opcionalmente opciones y comentarios.– Las especificaciones, opciones y comentarios son

cadenas de texto– Un producto tiene un atributo nombre que es una

cadena de texto– Un precio tiene tres atributos: valor, % impuestos y

descuento que son cadenas de texto

Sistemas Multimedia e Interacción Gráfica- Curso 2005/06 44

Comparativa Plano vs HTML vs XML

Ejemplo 1. Texto PlanoJohn Citizen, 01/01/2000

Ejemplo 2. HTML<html><head><title>Name and Date of Births</title></head><body><table><tr><td>First Name</td><td>Last Name</td><td>Date

of Birth</td></tr><tr><td>John</td><td>Citizen</td><td>01/01/2001</td>

</tr></table>

</body></html>

Ejemplo 3. XML<name><first>John</first><last>John</last>

</name><date_of_birth><month>January</month><day>01</day><year>2001</year>

</date_of_birth>

Page 23: 2. Texto. - UMdis.um.es/~jfernand/0506/smig/tema2.pdf · zlas ventajas de crear archivos en otras aplicaciones y convertirlos a pdf son las siguientes: – es un proceso rÁpido y

23

Sistemas Multimedia e Interacción Gráfica- Curso 2005/06 45

2.4 Otros estándares

MHEG (http://www.mheg.org)– Mecanismos de intercambio de objetos independiente del

formato y estructura de ficherosPREMO (http://db.cwi.nl/projecten/project.php4?prjnr=106)

– Mecanismos de Presentación de contenidos y medios de forma integrada

HYTIME (http://www.hytime.org/)– Combinación de tipos de información en tiempo y espacio

MRML (http://www.mrml.net/)– Obtención de información de componentes software

multimedia

Sistemas Multimedia e Interacción Gráfica- Curso 2005/06 46

Ejemplo

Page 24: 2. Texto. - UMdis.um.es/~jfernand/0506/smig/tema2.pdf · zlas ventajas de crear archivos en otras aplicaciones y convertirlos a pdf son las siguientes: – es un proceso rÁpido y

24

Sistemas Multimedia e Interacción Gráfica- Curso 2005/06 47

Ejemplo

{:Application ("turin.mh5" 0) :OnStartUp ( // sequence of initialization actions :TransitionTo (("main_scene.mh5" 0)) // activation of the first scene ) }

{ :Scene ("main_scene.mh5" 0) :OnStartUp ( // sequence of initialization actions preload (2) // the connection to the source of the video clip is set up ... setCounterTrigger (2 3 190000) // book a time code event at 190000 msec ... ) :Items ( // both presentable ingredients and links

{:Bitmap 1 // background bitmap :InitiallyActive true :CHook 3 // JPEG :OrigContent:ContentRef ("background.jpg") :OrigBoxSize 800 600 :OrigPosition 0 0 }

{:Stream 2 // video clip :InitiallyActive false :CHook 101 // MPEG-1 :OrigContent:ContentRef ("turin.mpg") :Multiplex ( {:Audio 3 // audio component of the video clip :ComponentTag 1 // refers to audio elementary stream :InitiallyActive true }

Sistemas Multimedia e Interacción Gráfica- Curso 2005/06 48

2.5.- Aspectos tecnológicos relativos al texto

Otras tecnologOtras tecnologíías relacionadas con el texto que de un modo u otro as relacionadas con el texto que de un modo u otro facilitan el procesado electrfacilitan el procesado electróónico de documentos son:nico de documentos son:

–– Reconocimiento Reconocimiento óóptico de caracteres (ptico de caracteres (OCR: OCR: OpticalOptical CharacterCharacterRecognitionRecognition).).

–– Reconocimiento de voz (Reconocimiento de voz (SpeechSpeech--toto--TextText).).

–– SSííntesis de voz (ntesis de voz (TextText--toto--SpeechSpeech).).