bases de datos - parte 10/10 xpath

Sistemas de Información II

Tema 10. XPath

Carlos Castillo

UPF – 2007

Base para otras tecnologías

XQuery

XPointer

Lenguaje “básico” para buscar en XML

Tan importante para documentos estructurados como es SQL para BD

relacionales

Tecnologías interdependientes

XML (Modelo de datos)

XPath (direccionamiento)

XQuery XSLT ...

Ejemplo: XQuery requiere XPath

<bookswithprices> { FOR $a in document("A/bib.xml")//book, $b in document("B/reviews.xml")//entry WHERE $b/title = $a/title RETURN <bookwithprices> { $b/title } <priceA> { $a/price/text() } </priceA> <priceB> { $b/price/text() } </priceB> </bookwithprices> } </bookswithprices>

Ejemplo: XSLT requiere XPath

<xsl:template match="/doc"> <otherdoc> <xsl:foreach select="item"> <otheritem> <xsl:valueof select="subitem/*"/> </otheritem> </xsl:foreach> </otherdoc></xsl:template></xsl:stylesheet>

Un documento como un árbol

Email Edad

Persona

Apellido

MaternoPaterno

<Persona> <Apellido> <Paterno> Perez </Paterno> <Materno> Tapia </Materno> </Apellido> <Edad>42</Edad> <Email>jperez@</Email></persona>

Una ruta en el árbol

Email Edad

Persona

Apellido

MaternoPaterno

<Persona> <Apellido> <Paterno> Perez </Paterno> <Materno> Tapia </Materno> </Apellido> <Edad>42</Edad> <Email>jperez@</Email></persona>

/persona/apellido/paterno=

“Perez”

Objetivo de XPath

Identificar elementos

A una profundidad arbitraria

En base al conjunto de nodos en el camino

Importante: siempre hay un nodo de contexto

Expresiones XPath

Tienen la forma

nodo1/nodo2/.../nodoN

En el ejemplo: persona/apellido/materno

Describen un camino (path)

Resultado:

Un conjunto de nodos

String, número o boolean

El resultado podría no ser un doc. XML

Parecido a sist. de archivos

Ficheros y directorios

Respecto a directorio actual

* = cualquier cosa

Un fichero por ruta

Nodos dentro de nodos

Respecto a nodo actual o de contexto

* = cualquier nodo

Uno o varios nodos por ruta

Expresiones XPathFalta: cómo seleccionar entre múltiples posibilidades

Para esto se usan predicados entre corchetes [ ... ]

Falta: cómo buscar en múltiples documentos

No pueden realizar “joins”

Ventajas

Compacto, eficiente

“Encontrar en la lista de autores el apellido de un autor que tenga el atributo tipo con el valor clásico”autores/autor[tipo='clasico']/apellido

Funciones básicas

Strings, números

Rutas “child” (nodos hijo)

<noticia> <titulo>Título</titulo> <fuente>upi</fuente> <cuerpo fecha=”hoy”> <reportero cod=”3”> Juan </reportero> Párrafo uno Párrafo dos </cuerpo></noticia>

child::fuente

child::*

child::text()

(nada)

child::cuerpo/child::reportero

child::cuerpo/child::p/child::text()

Párrafo

Abreviado: “child::p” es igual a “p”

doc.xml

“parent”, “ancestor”, “self”

parent::cuerpo/parent::noticia

Abreviado: “parent::*” es igual a “..”

../../fuente

ancestor::noticia/titulo

<titulo>Título<titulo>

self::reportero

Abreviado: “self::*” es igual a “.”

doc.xml

“attribute”,“descendant”,“root”

attribute::fecha

Abreviado: “attribute::x” es igual a “@x”

reportero/@cod

descendant::b

uno

Abreviado: “descendant::b” igual a “.//b“

.//noticia

p/b/text()

doc.xml

“preceding”, “following”

preceding::*

following::p

Párrafo dos

doc.xml

Partición<noticia>

<titulo>Título</titulo>

</reportero>

Párrafo

uno

Párrafo dos

</cuerpo>

</noticia>

Los ejes definen una particion

No se intersectan como node-sets

Ancestor

Preceding

Following

Descendant

Sí pueden ser uno child:: de otro

Predicados (condiciones)

reportero[@cod=2]

(nada)

p[position()=1]

Párrafo uno

p[position()=last()]

Párrafo dos</o>

p[child::b] ó p[b]

Párrafo uno

reportero[.='Juan']

Se puede combinar ... “/libro/capitulo[position()=3]/seccion[position()=2]”

doc.xml

Resumen de sintaxis abreviada 1/2

X – hijo elemento “X”

* - todos los hijos elemento

text() - todos los hijos texto

@Y – atributo “Y”

X[1] – primer hijo “X”

X[last()] - último hijo “X”

*/X – nietos “X”

X//Y – descendientes “Y” de hijo “X”

Resumen de sintaxis abreviada 2/2

//Y – descendientes “Y” de la RAIZ

//Y/X - descendientes “Y” de HIJO “X”

.. - padre

//X[1][@Y=”Z”] - primeros hijos X con atributo Y=”Z”

Valor de text() de un nodo

text(Este es un nodo)

Este es un nodo

text()

(nada, string vacio)

text(Texto)

Buscar por contenido

libro[titulo = 'XXX']/año

libro[not(titulo = 'XXX')]

libros.xml

Buscar con funcionesconcat(libro[1]/titulo, libro[2]/año)

XXX1950

libro[starts-with(titulo,'X')]/año

libro[contains(año,9)]/año

libros.xml

Funciones básicas

libro[position()=last()]/año

count(libro)3

libro[count(titulo)=0]/año

count(libro/titulo)2

libros.xml

Funciones de strings (cont.)Busqueda de caracteres

substringafter( 'axbyc','x')='byc'

substringbefore( 'axbyc','x')='a'

Los indices empiezan desde '1', tipico de los estandares de XML

substring(“abcde”, 2, 4) = “bcd”

stringlength(“tres”) = 4

Traducir caracteres string,fuente,destino

translate(“BAR”,”ABC”,”abc”) = “baR”

Experimentar con XPath

http://www.zvon.org:9001/

/saxon/cgi-bin/XLab/XML/extras.html

Buscar “Zvon Xpath Xlab”

Procesamiento de XPath

XPath funciona como un filtro, no como un procedimiento

<noticia><titulo>Titulo</titulo><fuente>upi</fuente><cuerpo fecha="hoy"> <reportero cod="3"> Juan</reportero> Parrafo uno Parrafo dos</cuerpo></noticia>

1: <noticia> ... </noticia>2: <cuerpo>...</cuerpo>3: uno4: Parrafo dos

//*[position()=last()]

doc.xmlRespuesta correcta

No es ir buscando el último hijo de cada nodoSí es ir verificando si cada nodo es un último hijo

Procesamiento XPath usando DOM

1.- Cargar documento a memoria

Usualmente 10x tamaño del documento

2.- Convertir expresión en funciones DOM

Muy fácil de programar

Ineficiente si lo que buscamos es un fragmento pequeño en un documento

grande

Ejemplo: //recipe[1]

public static void main(String[] args) { DOMParser p = new DOMParser(); p.parse(args[0]); Document doc = p.getDocument(); Node n = doc.getDocumentElement();

n = n.getFirstChild(); while (n!=null && !n.getNodeName().equals("recipe")) { n = n.getNextSibling(); } }

Procesamiento XPath usando SAX

1.- Procesar documento en línea

Muy difícil de programar

2.- Evitar volver atrás en el documento

A veces es inevitable

Estructuras necesarias

Consulta como lista de nodos

Stack (pila) con consulta parcialmente resuelta

Ejemplo de procesamiento usando SAX

libro[@titulo = “X”]/autor<libro titulo=”z”><autor>z_a</autor></libro>

libro[titulo=”X”]/autor<libro><titulo>z</titulo><autor>z_a</autor>...

<libro><titulo>x</titulo><autor>x_a</autor>...

Problemas al buscar usando SAX

libro[titulo=”X”]/autor<libro><autor>z_a</autor><titulo>z</titulo>...

<libro><autor>x_a</autor><titulo>x</titulo>...

Casi siempre es necesario poder devolverse

Necesitamos indexar estructura

Resumen

Lenguaje para consultar XML

Sintaxis abreviada

Base para otros lenguajes

Procesar XPath

Usando DOM

Usando SAX

bases de datos - parte 10/10 xpath

de hijo

es igual

este es

xml libro

gt

libro

juan

child

Technology

bases de datos - parte 2/10 sistemas de bases de datos

bases concurso internacional de fotografía: 10° tenemos

xml intro y semiestructurados.ppt -...

bases de datos - parte 4/10 modelo er continuación

bases de datos - parte 3/10 modelo er

bases inv adaptativa 2015 (10)

bases de datos sept 16 10

bases de datos - parte 7/10 almacenamiento físico

artÍculo 10: incorporaciÓn bases grÁficas...

validación de xml -...

bases de...

bases arado (10)

sessión 1 - introducción a...

10- mejoramiento de subrasante -bases y sub-bases

bases 45106002-005-10 i.t. puruandiroreglamento modificado...

apuntes xpath

¿cÓmo manejar xml en oracle? - …/voucher> xpath junto al...

1. xpath....

xslt y xpath

bases que rexen a convocatoria en concorrencia...