uso de xml en el manejo de documentos legislativos

Post on 29-Jul-2015

23 Views

Category:

Documents

1 Downloads

Preview:

Click to see full reader

DESCRIPTION

El documento contiene una revisión de proyectos y formatos con XML para manejo de información legislativa

TRANSCRIPT

Versionado de documentos legislativos usando XML

Maria Hallo

Escuela Politécnica Nacional Quito-Ecuador

mhallo1700@hotmail.com

Dr Pablo de la Fuente

Dra Mercedes Martínez

Universidad de Valladolid-España

Problemática

• Documentos legislativos en diferentes fuentes, formatos , lenguajes, estructuras internas

• Modificaciones en el tiempo

• Necesidad de consolidación automática

• En cada jurisdicción diferentes formas de asignar identidades para versionado

Modelos de datos basados en XML

• Permite más sofisticadas búsquedas, Manejo de versiones de documentos y sus partes

• Formato no propietario

• Preservación a largo plazo

• Apropiado para difusión en la Web semántica

Experiencias

En redacción de texto legislativo:

• Tasmania, Canadá, USA, Sud Australia, Italia, España

En administrar documentos legislativos digitales :

• UK, Singapur, Tasmania, Canadá USA y un número de estados de USA

Formatos XML para documentos legales

Experiencias en Europa• NormeInRete (Italia)• Cen Metalex• SDU BWB (Holanda)• LexDania (Dinamarca)• eLaw (Austria)• CHLexML (Suiza)

• General formats for legal sources,2007

Formatos XML para documentos legales

Otras experiencias

• Akoma Ntoso (Africa)

• En Act (Tasmania)

• Legal RDF en USA

• Dynamic Relationship Modelling (Spain)

• Cronelex System (Spain)

Estándares XML legales Primera generación, describen texto y

estructura considerando entidades

Segunda generación ponen atención a la estructura del texto,descripción y metadatos sin un análisis previo de clases originando un gran número de DTDs y esquemas (Norme in Rete..)

Tercera generación basada en patrones describiendo clases, propiedades , modelos de contenidos y ontologias. Akoma Notoso, Cen Metalex

Estándares XML legales

Cuarta generación de estándares:

Usan patrones y validaciones basadas en reglas. Ej uso de:

Schematron : Lenguaje de esquema estructural expresado en XML,

RELAX NG: Regular languaje for XML next generation

Capas para representar el modelado de doc legales

• Texto

• Estructura

• Metadatos

• Ontologías

• Reglas legales

Norme in Rete(Legislation on the Net)

Proyecto iniciado en 1999, financiado por el Ministerio de Justicia Italiano.

Productos:

Máquina de búsqueda para recuperar leyes publicadas en diferentes sitios Web de la administración pública

implementado en Sistema Norma. (migrado a normattiva.it)

Estándares NIR (basados en XML, RDF): • DTD para describir la estructura formal y funcional• URN para documentos legales independiente de

URL

Norme in Rete DTDS

• DTD estricto: usado para marcar doc legales (180 elementos)

• Loose DTD: tiene pocas reglas obligatorias

• DTD base: subconjunto del DTD estricto, mínimo para garantizar la interoperabilidad (100 elementos)

Norme in Rete

1.global.dtd:contiene definiciones globales

2. norme.dtd: contiene definiciones de la estructura de división

3. text.dtd: para definiciones de estructuras de texto, tablas and formas;

4. meta.dtd: contiene definiciones de esquemas de metadatos.

Ej NIR

Urn:nir:<authority> :<measure> :<details> :<annex>* @<version>? #<partition>?

urn:nir:stato:decreto.legislativo:1992-07-24;358#art5

@fecha de la última modifición

0 o más veces

? 0 o una vez

Elementos del DTD

• Estructurales: título, preámbulo, sección, artículo, párrafo.

• Especiales: referencias a otras leyes• Metadatos. Fecha de publicación, relaciones,

clasificación• Elementos semánticos:

Provisiones: Obligaciones, Prohibiciones, Modificaciones

Roles

Norme.DTD

Estructura formal del texto normativo• Título(tipoDoc|dataDoc|numDoc|títuloDoc|

dataDoc..)• Fórmula inicial, Preámbulo• Articulado(Libro|parte|título|capítulo|secc|

párrafo|artículo)• Fórmula final• Conclusiones• Anexos

Metadatos• Dublincore (dc:title | dc:creator | dc:subject |

dc:description | dc:publisher|dc:contributor |dc:date | dc:type | dc:format |dc:identifier | dc:source | dc:language |dc:relation | dc:coverage | dc:rights)

• Disposiciones: Modificaciones….• Trabajos preparatorios• Editoriales • Comentarios

Disposiciones

• Describen el significado de cada fragmento de texto, su tiempo de validez, derogación, etc.

Sistema Norma

• Cubre todas las fases del ciclo de vida de un documento legal

• Los documentos siguen el DTD de Norme In Rete

Modelo de datos Sistema Norma

Modelo E-R Sistema Norma(metadata)

Almacenamiento de metadatos

Los metadatos que describen la cadena de versionamiento de cada documento y para cada versión su intervalo de tiempo, referencias normativas y anexos se almacenan en un sistema relacional

Consolidación

Se realiza con tres paquetes

• Documentos y anexos modificantes

• Documentos y anexos a modificarse

• Lista de provisiones modificatorias

• Cada paso del proceso de modificación es anotado en el texto modificado: Tipo de modificación, nombre del documento modificante, partición de texto modificado

Consolidación

• Se convierten los paquetes XML a formato Word

Problemas

• Estructura estricta del texto

• Documentos almacenados en sistema de archivos

• Sistema ligado a la estructura

• Consultables versiones de documentos

• Consolidaciones semiautomáticas

Akoma Ntoso (Africa) Architectrure for Knowledge-Oriented Management of Any

normative Texts using Open Standards and Ontologies

Conjunto de estándares y metodologías para e-servicios parlamentarios en el contexto Pan-Africano:

• Akoma-Ntoso XML schema,

• Convenciones de nombres para identificación de recursos legales(URI2)

• Guias para preparación de documentos legislativos bien estructurados

Usos de Akoma Notoso

Formatos usados en

• Legislación primaria

• Debates parlamentarios

• Listas de modificaciones

• Documentos judiciales

Patrones

• Container: estructuras secuenciales no jerárquicas. Ej prefacio, preámbulo, conclusiones, cuerpo

• Hcontainer: Contenedores jerárquicos de estructuras. Ej capítulo, sección, artículo, cláusula

• Blocks: Contenedores de texto. Ej Párrafos

Patrones

• Inline : Contenedores de texto. Ref, título, fecha

• Marker: Ej imágenes, notas

• Popup: Ej notas de autoría, firmas pies de documentos

• www.akomanotoso.org

Formato de Intercambio abierto para

recursos legales y legislativos

CWA 15710:2010

CEN METALEX

Rediseñado considerando lecciones de Norme in Rete y Akoma Notoso

CEN METALEX

MetalexCaracterísticas

• Independiente de lenguaje y jurisdicción• No interfiere con formatos propietarios• Estructura basada en contenedores que a su

vez contienen otros bloques o contenedores• Basado en XML, RDF, RDF(S), OWL, Xlink,

XHTML. XSL• Soporta URIs a un nivel muy detallado• Combinable con GML para encadenar

regulaciones a áreas espaciales

Entidades Bibliográficas en Metalex

Conceptos

Fuente de ley bibliográfica: objeto, bibliográfico que fue es o puede ser referenciado

MetalexPrincipios de diseño

• Cada elemento Metalex es definido por un nombre, modelo de contenido y uno o más atributos

• La Estructura de un doc legislativo es definida por artículos agrupados en particiones y a su vez compuestos de partes y subpartes

• Se puede tener varias versiones en varios lenguajes el mismo documento (atrib lang)

MetalexPrincipios de diseño

• Cada elemento puede tener zero o más anotaciones

• Se exige identificación con URIs pero no se restringe a un formato

• Los metadatos se pueden almacenar dentro de los documentos y además separados como triples RDF

MetalexPrincipios de diseño

• Containers: book, chapter, section

• Blocks: sentences, titles, indices, etc.

• MetaLex: (containers +) articles (+ subcontainers) + text

MetalexManejo del tiempo

Permite almacenar:• Fechas de publicación, promulgación,

derogación• Períodos de validez, de eficacia.(El período de

tiempo en el cual deben haber ocurrido los hechos para que la legislación sea aplicable)

• Es posible tener varias versiones de un texto en el mismo documento

MetalexMetadatos

Ontologías de metadatos contienen:

Entidades Bibliográficas: Trabajo, expresión, manifestación, item y modelo de contenidos

Referencias entre entidades bibliográficas

Actividades: Acciones y roles de entidades bibliográficas (creación, derogación, promulgación)

Agentes y competencias usados en actividades legislativas

MetalexTransformaciones a RDF

Los Metadatos pueden ser envueltos en manifestaciones XML y representados como atributos pueden ser transformados a RDF con hojas de estilo XSL.

MetalexAdministración de versiones

El esquema de metadatos Metalex OWL incluye definiciones de tipos de evento a nivel de expresión

Creación de una entidad bibliográfica, entrada en vigor de una expresión (versión), derogación de una expresión

Expresiones modificantes

• A nivel de container inserción/borrado de una parte

• A nivel de bloque inserción/borrado /modificación de texto

Metalex Document Server

Metalex Document Server doc.metalex.eu

Almacena las versiones de estatutos y regulaciones del sitio holandés http://wetten.overheid.nl publicado desde mayo del 2011 como CEN Metalex y como Linked Data

Wetten.overheid.nl

Es la fuente de datos para información legislativa en Holanda. Permite búsquedas por un artículo específico asi como por la versión de un texto a una fecha específica. Proporciona una API para recuperar manifestaciones XML de estatutos y regulaciones

Wetten.overheid.nl

• Problemas : identificadores no consistentes (varios apuntan al mismo elemento)

• Se recupera solamente la última versión

• Fecha reportada como fecha de modificación es la fecha del registro en e l CMS

• Metadatos en tablas HTML

Conversión

• Modela cada documento segun FRBR

• Crea URIs para todas las partes del texto legislativo (modelo UK)

• Genera metadatos RDF de cada documento y sus elementos asi como de los eventos y procesos que los modifican

Estructura de un doc en Metalex

Metadatos

El MDS usa para metadatos:• La Ontología Metalex para representar

eventos de modificaciones• El Modelo de Eventos (Simple Event

Model)• OPMV (Open Provenance Model

Vocabulary) para una descripción de procesos e información de orígenes de datos.

Modificaciones

• Cada elemento es identificado con una URI opaca con un valor Hash SHA1 del contenido textual de un elemento XML y simultáneamente mantienen un link entre el URI opaco y el identificador permitiendo distinguir diferentes expresiones en el tiempo.

• (Metalex Doc Server)

Legislation.gov.uk

• El sitio contiene legislación como fué originalmente promulgada y versiones presentando cambios a la legislación en el tiempo

Modificaciones

Modelo de datos• Estructura en árbol implementada con XML para los

documentos y metadatos y un grafo representado en RDF para los metadatos

• Se usa una base de datos XML para los documentos y metadatos y un repositorio RDF para los metadatos

Estructura de un acto legislativo (última versión)

Adapted from: http:www.legislation.gov.uk/ukpga/1985/65/data.xml

Metadata

Dublin Core metadata

Links Unapplied effects

Legislation

Preliminary Body

Pblock(Section)

Pgroup(Paragraphs)

Part

Appendix Schedule Changes Explanatory Notes

PBlock amendement

XML doc

Others

La estructura de un item legislative está definida en legislative.xsd

Entidades (FRBR)(Requisitos Funcionales de Registros Bibliográficos)

Item legislativo (Work)

( Acto, Parte, Sección, Schedule (Párrafo))

Versión ( Expression)

(previa, actual, prospectiva, a una fecha dada)

Publicación ( Manifestation)

(pdf, rdf, xml, htm)

copias (items)

• Recursivo

Modificaciones

Los elementos usados para marcar cambios en textos se describen en Changes.xsd

•Tipos de cambios: Adición, sustitución, referencias a comentarios, acrónimos, abreviaciones, citaciones

Modificaciones

Proceso editorialhttp://www.legislation.gov.uk/pdfs/GuideToRevisedLegislation_Jan_2012.pdf

• Una nueva pieza de legislación se graba como una versión promulgada (enacted)

• Se prepara una versión revisada tabulando efectos en otras legislación es y añadiendo anotaciones a la versión revisada (Ej. Fechas de entrada en vigor, alcance geográfico, etc) (toma de 4 a 8 semanas)

• Los efectos tabulados se presentan en el website en la sección cambios a la legislación

Legislación revisada vs promulgadahttp://www.legislation.gov.uk/pdfs/GuideToRevisedLegislation_Jan_20

12.pdf

Tipos de anotaciones

Hay varios tipos de anotaciones:

•Modificaciones textuales (F-notes)

•Información adicional (E-Notes)

•Modificaciones que no alteran el texto (C-notes)

•Información de inicio de los cambios (I-notes)

•Citas marginales (M-notes)

•Información editorial (X notes)

Annotations

Ej de anotación en el Acto analizado1985 que no alteran el texto (tipo C).

• C1 Act amended by S.I. 1986/1628, reg. 5(2)(3)• Los cambios realizados aparecen en el

contenido y son referenciados con anotaciones

Annotaciones

Ej: S.14A(7) applied (with modifications) (30.12.2005) Adoption and Children Act 2002 by Ca.29(6) (with Sch 4 paras 6-8); S.I.2005/2213, art. 2(c).

• Provisión afectada- subsección (7) de la sección 14A• El tipo de efecto: applied (with modifications)• La fecha en la que la provisión afectante entra en vigor

(30.12.2005)• La legislación afectante Adoption and Children Act 2002• La provisión afectante : subsec 6, sección 29• La provisión que origina la entrada en vigor

S.I.2005/2213, art. 2(c).

URIshttp://www.legislation.gov.uk/developer/uris

• URIs de identificación

http://www.legislation.gov.uk/id/{type}/{year}/{number}[/{section}]

URIs

• URIs de representaciones

Cada documento es disponible en múltiples formatos. La Uri para un formato en particular sigue el template:

http://www.legislation.gov.uk/{type}/{year}/{number}[/{section}][/{authority}][/{extent}][/{version}]/data.ext

Documento Legislativo (version original promulgada)

Transport Act 1985 1985 Chapter 67

• Content table:• Introductory Text• Part I General Provisions Relating to Road Passenger

Transport• Abolition of road service licensing• 1. Abolition of road service licensing.• Meaning of “local service”• 2. Local services.• Traffic commissioners• 3. Traffic commissioners.• 4. Inquiries held by traffic commissioners.• 5. Assistance for traffic commissioners in considering

financial questions.• ……………

Ej cambio• Modificación prospectiva de texto: section-26-6

http://www.legislation.gov.uk/id/ukpga/1985/67/section/26/6

s. 26(6) text amended by 2008 c. 26 s. 62(9)

s. 26(6)(a) text amended by 2008 c. 26 s. 62(9)(b)

6.A condition attached to a licence under subsection (5) above shall—

(a)apply only to vehicles which have their operating centre in the traffic area for which the commissioner acts; and

(b)be in addition to (and not be taken as prejudicing in any way) any conditions attached to the licence under section 16 of the 1981 Act as to the maximum number of vehicles which the operator may at any one time use under the licence.

• Según sección-62-9 de http://www.legislation.gov.uk/id/ukpga/2008/26/section/62/9

(9)In subsection (6)—(a)for “subsection (5)” substitute “ subsection (5A) ”;(b)in paragraph (a) after “the commissioner” insert “ who attached that condition ”.

http://legislation.data.gov.uk/ukpga/1985/67/data.xmlúltima versión

Metadata (dc elements)

• <Legislation xmlns=http://www.legislation.gov.uk/namespaces/legislation DocumentURI="http://www.legislation.gov.uk/ukpga/1985/67" IdURI="http://www.legislation.gov.uk/id/ukpga/1985/67" NumberOfProvisions="305“ xml:base="http://www.legislation.gov.uk/id/ukpga/1985/67">

• - <ukm:Metadata xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:dct="http://purl.org/dc/terms/" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:ukm="http://www.legislation.gov.uk/namespaces/metadata><dc:ident>http://www.legislation.gov.uk/ukpga/1985/67</dc:iden>

•   <dc:title>Transport Act 1985</dc:title> •   <dc:description>An Act to amend the law relating to road

passenger transport; to make provision for the transfer of the operations of t he National Bus Company……….</dc:description>

•   <dc:date>1985-10-30</dc:date> •   ………… •   <dc:modified>2011-05-27</dc:modified> •   <dct:valid>2009-09-01</dct:valid>

http://legislation.data.gov.uk/ukpga/1985/67/data.xmlMetadata (atom link elements)

– atom:link rel="self" type="application/xml" href="http://legislation.data.gov.uk/ukpga/1985/67/data.xml" />

–   <atom:link rel="http://www.legislation.gov.uk/def/navigation/resources" href="http://www.legislation.gov.uk/ukpga/1985/67/resources" title="More Resources" />

–   <atom:link rel="http://www.legislation.gov.uk/def/navigation/act" href="http://www.legislation.gov.uk/ukpga/1985/67" title="whole act" />

–   <atom:link rel="http://www.legislation.gov.uk/def/navigation/introduction" href="http://www.legislation.gov.uk/ukpga/1985/67/introduction" title="introduction" />

–   <atom:link rel="http://www.legislation.gov.uk/def/navigation/body" href="http://www.legislation.gov.uk/ukpga/1985/67/body" title="body" />

–   <atom:link rel="http://www.legislation.gov.uk/def/navigation/schedules" href="http://www.legislation.gov.uk/ukpga/1985/67/schedules" title="schedules" />

–   <atom:link rel="alternate" type="application/rdf+xml" href="http://legislation.data.gov.uk/ukpga/1985/67/data.rdf" title="RDF/XML" />

– <atom:link rel="alternate" type="application/xhtml+xml" href="http://legislation.data.gov.uk/ukpga/1985/67/data.htm" title="HTML snippet" />

– ………………..

http://legislation.data.gov.uk/ukpga/1985/67/data.xmlPrimaryMetadata

• <ukm:PrimaryMetadata>• - <ukm:DocumentClassification>•   <ukm:DocumentCategory Value="primary" /> •   <ukm:DocumentMainType

Value="UnitedKingdomPublicGeneralAct" /> •   <ukm:DocumentStatus Value="revised" /> •   </ukm:DocumentClassification>•   <ukm:Year Value="1985" /> •   <ukm:Number Value="67" /> •   <ukm:EnactmentDate Date="1985-10-30" />

http://legislation.data.gov.uk/ukpga/1985/67/data.xmlUnapplied effects: Text amended

<ukm:UnappliedEffect Row="4160" Type="text amended" Index="57" Modified="2012-05-25T15:44:39.594+01:00" AffectedClass="UnitedKingdomPublicGeneralAct“ AffectedYear="1985" AffectedNumber="67" AffectedProvisions="s. 26(6)" AffectingClass="UnitedKingdomPublicGeneralAct" AffectingYear="2008" AffectingNumber="26" AffectingProvisions="s. 62(9)" AffectedURI=http://www.legislation.gov.uk/id/ukpga/1985/67 AffectingURI=http://www.legislation.gov.uk/id/ukpga/2008/26 AffectingCommencementSections="http://www.legislation.gov.uk/id/ukpga/2008/26/section/134http://www.legislation.gov.uk/id/ukpga/2008/26/section/134"

http://legislation.data.gov.uk/ukpga/1985/67/data.xmlUnapplied effects: Text amended

<ukm:AffectedProvisions>  <ukm:Section Ref="section-26-6“

URI=http://www.legislation.gov.uk/id/ukpga/1985/67/section/26/6 StartDate="1991-01“  

</ukm:AffectedProvisions>- <ukm:AffectingProvisions>  <ukm:Section Ref="section-62-9"

URI=http://www.legislation.gov.uk/id/ukpga/2008/26/section/62/9 StartDate="Prospective“ ukm:Section>

  </ukm:AffectingProvisions>  <ukm:AffectedTitle>Transport Act1985</ukm:AffectedTitle>

<ukm:AffectingTitle>Local Transport Act 2008</ukm:AffectingTitle>

</ukm:UnappliedEffect>

Efectos no aplicados

• La ontologia Metalex se usa para describir los efectos que se usan listando esa lógica

• Un Trabajo (Work) es realizado por alguna versión (Expression)

• Esa version es el estado inicial de alguna Modificación legislativa

• La modificación legislativa tiene legislaciones afectantes de otra legislación

(RDF/XML)

Problemas

Cada versión de un item legislativo es grabada en un archivo lo cual implica redundancia de datos y posibilidades de inconsistencia en el caso de corrección de errores

Los tiempos requeridos para anotaciones son muy largos de 4 a 8 semanas por texto legislativo

Existe dificultad en obtener los datos necesarios para construir las versiones revisadas de textos histórico

Conclusiones

Es necesario estudiar alternativas de manejo de versiones de textos legislativos

• Usando RDF y ontologías estándar• Buscando optimizar el almacenamiento,

tiempos de búsqueda y recuperación de versiones de textos y fragmentos legislativos consolidados.

• Usando sistemas de administración de bases de datos XML

Conclusiones

Es necesario estudiar alternativas de manejo de versiones de textos legislativos

• Usando modelos de grafos y ontologías estándar

• Buscando optimizar el almacenamiento, tiempos de búsqueda y recuperación de versiones de textos y fragmentos legislativos.

• Usando sistemas de administración de bases de datos XML y repositorios RDF

Bibliografia

• Palmirani M and Brighi R. Norma-System: A Legal Document System for Managing Consolidated Acts. DEXA 2002. Database and Expert Systems Applications, Springer, 2002; 310-320

• Sheridan J. Legislation.gov.uk, in VoxPopuLII. 2010, Cornell University Law School. http://blog.law.cornell.edu/voxpop/tag/legal-linked-data/(2011, accessed march 2012).

• Hoekstra R. The MetaLex Document Server, in VoxPopulLII. http://blog.law.cornell.edu/voxpop/2011/10/25/the-metalex-document-server/ (2011, accessed Nov 2011)

• Martínez-González M, Derniame J and De la Fuente P. A method for the dynamic generation of virtual versions of evolving documents. In: 17th ACM Simposium on Applied Computing (SAC 2002), Special Track on Database and Digital Library Technologies. Madrid , Spain, March 2002.

Bibliografia

• Palmirani, M. et al. Deliverable 3.1. General XML format(s) for legal Sources, University of Amsterdam, University of Bologna, http://www.estrellaproject.org/doc/D3.1-General-XML-formats-For-Legal-Sources.pdf (2006, accessed Nov 2011)

• Francesconi E. The “Norme in Rete”- project: Standards and Tools for Italian Legislation. International Journal of Legal Information, 2006; 34: 358-376.

Agradecimientos

Al grupo GRINBD del Departamento de Informática de la Universidad de Valladolid

top related