a_2_modelo_informacion_estudiante.doc

50
Guía de auto-aprendizaje en SDMX Libro del estudiante n. 2 - El modelo de información SDMX Guía de auto-aprendizaje en SDMX n. 2 Libro del estudiante El modelo de información SDMX 1/50

Upload: omardom

Post on 12-Sep-2015

214 views

Category:

Documents


0 download

TRANSCRIPT

Student book on SDMX

Gua de auto-aprendizaje en SDMX

Libro del estudiante n. 2 - El modelo de informacin SDMX

Gua de auto-aprendizaje en SDMX n. 2Libro del estudianteEl modelo de informacin SDMX

AutorEurostat, Direccin A: Cooperacin en el Sistema Estadstico Europeo; cooperacin internacional; recursos

Unidad A6: Cooperacin estadstica

ltima actualizacinSeptiembre 2012

Versin1.0

TABLA DE CONTENIDOS

41Objetivo del Libro del Estudiante

52Datos Estadsticos y Metadatos Estructurales y de Referencia

52.1Datos Estadsticos

62.1.1Datos en Formato de Serie Temporal (Time series)

62.1.2Datos en Formato Transversal (Cross-sectional)

62.2Metadatos Estadsticos

72.2.1Metadatos Estructurales

72.2.2Metadatos de Referencia

93Breve Introduccin al Modelo de Informacin SDMX (SDMX Information Model)

124Los Objetos SDMX Principales

124.1Introduccin

124.2Concepto y Esquema de Concepto

134.3Listas de Cdigos (Code List)

154.4Definicin de Estructura de Datos (DSD)

214.5Conjunto de Datos (Dataset)

214.5.1Conjunto de datos de serie temporal (Time series Dataset)

224.5.2Conjunto de Datos Transversal (Cross-sectional)

244.6Definicin de Estructura de Metadatos (MSD: Metadata Structure Definition)

254.7Conjuntos de Metadatos

264.8Definicin de Flujo de Datos (Dataflow )y Metadatos (Metadata Flow)

294.9Proveedor de Datos (Data Provider)

294.10Acuerdo de Provisin (Provision Agreement)

294.11Restricciones (Constraints)

314.12Esquema de Categora (Category Scheme)

335Glosario

1 Objetivo del Libro del EstudianteEl libro del estudiante tiene como objetivo proporcionar a los usuarios interesados una introduccin general al Modelo de Informacin SDMX (SDMX Information Model): el modelo de informacin SDMX (SDMX Information Model) para datos; el modelo de informacin SDMX (SDMX Information Model) para metadatos; los objetos principales del modelo de informacin SDMX (SDMX Information Model);Al finalizar el libro del estudiante, el lector deber ser capaz de entender el funcionamiento bsico del modelo de informacin SDMX (SDMX Information Model).El libro del estudiante es el segundo de un nmero de libros que juntos, ofrecen un conjunto completo de informacin para operar SDMX, con una atencin especial en el modelo de datos. Ref.Ttulo

[01]Introduccin a SDMX

[02]El Modelo de Informacin SDMX (SDMX Information Model)

[03]Mensajes SDMX-ML

[04]Definicin de Estructura de Datos (Data Structure Definition)

[05]Definicion de Estructura de Metadatos (Metadata Structure Definition)

[06]Tecnologas basadas en XML usadas en SDMX

[07]Arquitecturas SDMX de mtodo pull para compartir datos - Parte 1

[08]Arquitecturas SDMX de mtodo pull para compartir datos - Parte 2

Tabla 1 Libros del estudiante sobre SDMX

PrerrequisitosEste libro del estudiante puede que requiera la lectura del primer libro del estudiante.2 Datos Estadsticos y Metadatos Estructurales y de Referencia2.1 Datos EstadsticosLos datos estadsticos son a menudo un conjunto de observaciones numricas que tienen alguna referencia de tiempo asociada a las mismas. Se asocian con un conjunto de valores de metadatos, que representan conceptos especficos, y que adems, actan como identificadores y descriptores de los datos. Estos valores de metadatos y conceptos pueden entenderse como dimensiones identificadas de un sistema multidimensional coordinado, que a su vez describen lo que a menudo se conoce como cubo de datos (dibujo 1).

Dibujo 1 Cubo multidimensional de datos

Existen diferentes organizaciones de datos a la hora de presentar datos estadsticos. Los datos de tabla se pueden formatear como una tabla multidimensional, en formato de serie temporal (Time series) o en formato de datos transversales (Cross-sectional).El ejemplo de organizacin de datos de serie temporal (Time series) (tabla 2) presenta los datos estadsticos de acuerdo a perodos de observacin anuales. En esta tabla solo nos fijamos en una entidad (FR = Francia) geogrfica (GEO) para el desarrollo del nmero de tipos de establecimientos tursticos a lo largo de un perodo especfico.

La organizacin de datos transversales (Cross-sectional) se usa para el intercambio de datos con ms de un tipo de observacin en un conjunto de datos (tabla 3). Esto significa que est indicada para situaciones donde los datos estadsticos consisten de mltiples observaciones (A100 Hoteles y similares, B010 Campings de turistas y B020 Residencias vacacionales) en un momento concreto de tiempo.

Un ejemplo de tabla estadstica multidimensional se presenta en el dibujo 3 (en la pgina 7). En este ejemplo se presentan dos capas de dimensin en las columnas de la tabla (actividad y tiempo)2.1.1 Datos en Formato de Serie Temporal (Time series)Nmero de establecimientos tursticos Serie temporal (Time series)

FREC: A Anual

GEO: FR FranciaTOUR_INDICATOR: A001 EstablecimientosUNIT: NBR Nmero

ActividadA100Hoteles y similaresB010Campings de turistasB020Residencias vacacionales

Tiempo

2002A001876883541934

2003A001861783311968

2004A001859882892251

2005A001868981742329

Tabla 2 Datos en formato de serie temporal (Time series)2.1.2 Datos en Formato Transversal (Cross-sectional)Nmero de establecimientos tursticos Transversal (Cross-sectional)

TIEMPO: 2007A00 TOUR_INDICATOR: A001 - EstablecimientosUNIT: NBR Nmero

ActividadA100Hoteles y similaresB010Campings de turistasB020Residencias vacacionales

Pas

AT142045403388

ES1782712204843

FR1813580522406

IT34058258761810

Tabla 3 Datos en formato de datos transversales (Cross-sectional)2.2 Metadatos EstadsticosEl trmino metadatos es, sin lugar a dudas, muy amplio. Para empezar, se puede hacer una distincin entre metadatos estructurales, que son aquellos conceptos usados en la descripcin e identificacin de datos y metadatos estadsticos, y metadatos de referencia (metadatos explicativos adicionales, por ejemplo, a una metodologa o aspectos de calidad). Los siguientes prrafos proporcionarn una explicacin ms en profundidad de estos dos tipos, metadatos estructurales y de referencia, usados para expresar estructuras de datos y metadatos y para entender conjuntos de metadatos y datos en relacin al modelo de informacin SDMX (SDMX Information Model).2.2.1 Metadatos EstructuralesLos conjuntos de datos estadsticos son descritos por un conjunto de valores de metadatos, tomados de conceptos especficos. Los conceptos actan como identificadores y descriptores de los datos. Este sistema de conceptos que identifican y describen datos toma la forma de dimensiones identificadas en un cubo multidimensional de datos.Los metadatos estructurales se organizan en definiciones de estructuras. Una Definicin de Estructura de Datos (DSD, Data Structure Definition, en ingls)/Definicin de Estructura de Metadatos (MSD, Metadata Structure Definition) describe cmo se organizan los conjuntos de datos/metadatos y define el mecanismo para aadir referencias a aquellos conjuntos de datos/metadatos que son descritos por los metadatos estructurales.

A los conceptos que se usan en una definicin de estructura de datos se les da un "rol de uso" de dimensin, atributo, y medida en esa misma definicin. La definicin de la estructura de datos, cualquiera que sea la estructura modelada de un cubo de datos, puede incluir tambin conceptos especiales, como por ejemplo la dimensin medida, para representar las medidas mltiples de una organizacin de datos transversales.

Cuando los conceptos toman su valor de un conjunto de valores conocidos (cdigos), entonces los objetos conocidos como "Listas de Cdigos" (Code List) pueden ser vinculados a la representacin de conceptos o, ms frecuentemente, asignados al concepto relacionado en la DSD (Familia Clave) (Key Family).2.2.2 Metadatos de ReferenciaLos conjuntos de metadatos mencionados arriba se relacionan con el modelo SDMX para aportar metadatos explicativos adicionales, que a menudos son expresados en SDMX como metadatos de referencia. Los metadatos de referencia se presentan generalmente en un formato textual, usando conceptos que describen el contenido, la metodologa y la calidad de los datos, que pueden desgranarse de la siguiente manera: metadatos conceptuales, que describen a los conceptos usados y su implementacin prctica; metadatos metodolgicos, que describen a los mtodos usados en la generacin de datos; metadatos de calidad, que describen los distintos aspectos relacionados con la calidad de los datos estadsticos.Estos son, en su mayora, metadatos que no forman parte integral del conjunto de datos estadsticos. Por el contrario, stos tienen que ver con metadatos relacionados con colecciones enteras de datos. Los metadatos de referencia son metadatos de contenido que aportan ms informacin sobre los datos estadsticos, con el fin de que su interpretacin sea ms significativa.

Los metadatos de referencia se estructuran en relacin a una "definicin de estructura de metadatos" (MSD: Metadata Structure Definition). Una definicin de estructura de metadatos describe cmo se organizan los conjuntos de metadatos que contienen metadatos de referencia, y define el mecanismo para aadir referencias a los datos estadsticos o los metadatos estructurales con los que estos metadatos de referencia se relacionan.Eurostat tiene definida una estructura de metadatos que se llama estructura de metadatos Euro-SDMX (ESMS: Euro-SDMX Metadata Structure). sta contiene la descripcin y representacin de conceptos de metadatos estadsticos que han de usarse para documentar datos estadsticos y proporcionar informacin til para asegurar la calidad de los datos y el proceso de produccin en general.3 Breve Introduccin al Modelo de Informacin SDMX (SDMX Information Model)El modelo de informacin SDMX (SDMX Information Model) proporciona un amplio conjunto de objetos formales y sus relaciones existentes para representar datos y metadatos estadsticos, actores, procesos, y recursos presentes en intercambios estadsticos. Aparte de los objetos descritos en detalle en el libro del estudiante, el modelo de informacin SDMX (SDMX Information Model) incluye definiciones en detalle de modelos tcnicos y dems componentes que se muestran de forma resumida a continuacin:Conjunto de Estructuras y Mapeados (Structure Set and Mappings): los conjuntos de estructuras permiten agrupar metadatos estructurales para formar una descripcin completa de las relaciones entre conjuntos especficos relacionados de datos y metadatos. Los conjuntos de estructuras pueden usarse para mapear dimensiones y atributos entre s, para mapear conceptos, mapear listas de cdigos (Codelist) y mapear esquemas de categora (Category Schemes).

Informe taxonmico: un informe taxonmico permite a una organizacin vincular (opcionalmente de una forma jerarquizada) un nmero de cubos de datos o definiciones de flujo de datos, que forman un informe completo de datos o metadatos.

Proceso y Transiciones: en cualquier sistema que procese datos y metadatos, el propio sistema est constituido por una serie de procesos y en cada uno de estos procesos, los datos o metadatos pueden sufrir una serie de transiciones. El modelo de proceso es un modelo genrico que puede capturar informacin clave acerca de estas fases de una manera textual y tambin de una manera ms formalizada mediante el uso de expresiones.Transformacin y Expresiones: en el modelo, este paquete permite hacer un seguimiento de cmo los datos se adquieren o derivan. El modelo puede usarse igualmente para definir transformaciones/derivaciones de datos y para definir comprobaciones de integridad con la ayuda de expresiones (ej.: la suma de A+B ha de ser igual a C).

El dibujo 2 a continuacin describe las caractersticas esenciales que ofrece el modelo de informacin SDMX (SDMX Information Model) para la presentacin de datos y metadatos.

Dibujo 2 Elementos principales del modelo de informacin SDMX (SDMX Information Model)El soporte de este diagrama es el flujo de datos o metadatos (Data/Metadata Flow), que es mantenido por la organizacin que recoge datos o metadatos. El flujo de datos se vincula a una definicin de estructura de datos (DSD: Data Structure Definition) mientras que un flujo de metadatos se vincula a una definicin de estructura de metadatos (MSD: Metadata Structure Definition). La DSD o MSD definen a la estructura de datos o metadatos e identifican los elementos con los que los metadatos relacionados se pueden relacionar.

Los datos o metadatos estn a disposicin de muchos proveedores. Cualquier proveedor puede proporcionar o publicar datos o metadatos para varios flujos de datos o metadatos, en relacin al acuerdo de provisin.El flujo de datos y metadatos puede vincularse tambin a uno o ms temas estadsticos (categora) dentro de un esquema de materias (esquema de categora) (Category Scheme). Un esquema de categora proporciona una forma de clasificar datos para su recogida, informe o publicacin.

Los estndares SDMX ofrecen un modelo comn y mltiples formatos de datos que ofrecen la posibilidad de intercambian cualquier tipo de cubo de datos. Para que se puedan procesar automticamente los datos de una variedad de fuentes, la estructura de este cubo tiene que estar definida de una manera que se ajuste al modelo de informacin SDMX (SDMX Information Model).

En el modelo de informacin SDMX (SDMX Information Model), los metadatos estructurales se representan mediante una lista de conceptos organizados por listas denominadas "esquemas de conceptos" (Concept Schemes). Los conceptos son las piezas bsicas del engranaje SDMX: los conceptos existen y se mantienen separados de cualquier estructura que los use.El modelo de informacin SDMX (SDMX Information Model) proporciona objetos para la estructuracin no solo de datos, sino tambin de metadatos de referencia.

El modelo de informacin SDMX (SDMX Information Model) permite el intercambio y el almacenamiento de metadatos de referencia independientemente de los datos que se estn describiendo. Los metadatos de referencia se pueden mantener guardados en lo que se conoce como repositorio de metadatos. En consecuencia, un sistema de difusin puede difundir datos con los metadatos de referencia relacionados, que se extraen a peticin desde el repositorio de metadatos de referencia.Los metadatos de referencia tambin se pueden indexar para ofrecer funciones de bsqueda. Para lograr esto, un informe de metadatos podra ser procesado, por ejemplo, por un servicio de registro para extraer su informacin estructural. Esta informacin estructural permite catalogar los metadatos y que un usuario lo pueda solicitar.

El proceso de provisin y gestin del flujo de conjuntos de datos o metadatos est cubierto tambin por el modelo de informacin SDMX (SDMX Information Model), mediante metadatos asociados que se ocupan del aprovisionamiento de datos. Los metadatos son tiles para aqullos que necesitan entender el contenido y la forma de una produccin de datos del proveedor. Cada proveedor de datos puede describir de una manera estndar el contenido y las dependencias existentes en los conjuntos de datos y metadatos que estos producen, y aportar informacin sobre la planificacin y el mecanismo que sigue la provisin de sus datos y metadatos. Esto permite la automatizacin de algunas funciones de validacin y control, as como la posibilidad de gestionar el informe de datos.Para organizar y gestionar el intercambio y la difusin de datos y metadatos, el modelo de informacin SDMX (SDMX Information Model) incluye tambin informacin sobre esquemas de clasificacin y categoras de dominios, junto con sus relaciones con conjuntos de datos y metadatos (por favor comprese con la seccin 4.12).

4 Los Objetos SDMX Principales4.1 IntroduccinEl modelo de informacin SDMX (SDMX-IM SDMX Information Model) describe un conjunto de objetos formales con el fin de mostrar una visin estndar del proceso de intercambio estadstico.

Est basado en un conjunto de objetos que conceptualiza al mundo real en el marco de actividades para compartir e intercambiar datos/metadatos estadsticos. Los siguientes prrafos tratan de clarificar los principales objetos necesarios para entender las funciones bsicas del modelo de informacin SDMX (SDMX Information Model).4.2 Concepto y Esquema de ConceptoLos conceptos juegan un papel importante en el modelo de informacin SDMX (SDMX Information Model), ya que se usan para describir la estructura de una tabla estadstica multidimensional (dibujo 3 - Tabla estadstica multidimensional con sus conceptos) o la estructura de un informe de metadatos. En el modelo de informacin SDMX (SDMX Information Model), los conceptos pueden tener una representacin de valor especfica (valor codificado, formato numrico, formato de fecha, cadena, etc.) que puede definirse a su vez en el esquema de concepto.

En el ejemplo inferior, los conceptos identifican los diferentes elementos pertenecientes a una tabla estadstica multidimensional de turismo. La tabla 4 muestra la lista de conceptos usados adems de su representacin codificada.

Dibujo 3 Tabla estadstica multidimensional con sus conceptosTabla 4 Ejemplo de estructura de concepto de la tabla superiorLos conceptos se identifican en esquemas de conceptos mediante un ID y un nombre en al menos una lengua, y tambin pueden aadirse descripciones multilinges opcionales de los conceptos.

Ejemplo: un concepto que describe a un pas de referencia podra definirse de la siguiente manera:

Concepto: rea de referencia

IDREF_AREA

Nombre(Ingls)

Reference country code(Francs) Code du pays de rfrence

Descripcin(Ingls)

Country from which the population migrate(Francs) Pays partir duquel la population migre

Tabla 5 rea de referencia de concepto Un esquema de concepto (Concept Scheme) es un objeto SDMX mantenido por una agencia y que contiene una lista de conceptos sobre los que se pueden construir definiciones de estructuras de datos y metadatos (Data Structure Definition & Metadata Structure Definition). Se pueden crear muchos esquemas de conceptos. Los esquemas de concepto (Concept Schemes) generalmente agrupan conceptos relevantes para una nica estructura, aunque una definicin de estructura de datos/metadatos (Data/Metada Structure Definition) puede usar conceptos de esquemas de concepto (Concept Schemes) diferentes.4.3 Listas de Cdigos (Code List)En el modelo de informacin SDMX (SDMX Information Model), una lista de cdigos (Code List) es un objeto que contiene una lista de cdigos, y que adems, estn mantenidos por una agencia. Una lista de cdigos es simplemente un conjunto de valores que se usan para la representacin de un concepto (dimensin o atributo) en definiciones de estructuras de datos/metadatos (Data/Metadata Structure Definitions).

Ejemplo: CL_UNIT_MULT

Cdigo Descripcin

0 Unidades

1 Decenas

2 Centenas

3 Miles

4 Decenas de miles

6 Millones

9 Miles de millones

Tabla 6 Ejemplo de lista de cdigos (Code List) de unidades multiplicadorasCada cdigo est definido exclusivamente por un valor y una descripcin que puede proporcionarse en varios idiomas.

El modelo permite que una lista de cdigos (Code List) tenga una jerarqua simple de cdigos. En ese caso, la jerarqua se hace mediante la definicin de un cdigo padre como mximo para cdigos hijo.

Ejemplo : CL_NUTS

Cdigo DescripcinCdigo padre

BE2VLAAMS GEWEST

BE3REGIONE WALLONE

BE31Prov. Brabant WallonBE3

BE32Prov. HainautBE3

BE321AthBE32

BE322CharleroiBE32

BE323MonsBE32

BE324MouscronBE32

BE33Prov. LiejaBE3

BE34Prov. Luxemburgo (B)BE3

BE35Prov. NamurBE3

Tabla 7 Lista jerrquica de cdigos (Code List) de regiones (NUTS, siglas en francs de Nomenclatura de las Unidades Territoriales Estadsticas)

4.4 Definicin de Estructura de Datos (DSD)La definicin de estructura de datos es el nombre que recibe un conjunto de explicaciones sobre cmo se construye un conjunto de datos y cmo habr de interpretarse. Esta descripcin de datos se construye sobre conceptos estadsticos. Muchas organizaciones se refieren a esta definicin de estructura de datos (Data Structure Definition) como familia clave (Key Family), y por tanto, los dos nombres son sinnimos.

La definicin de estructura de datos, mantenida por una agencia de mantenimiento (ej.: Eurostat) es una descripcin de todos los metadatos estructurales necesarios para comprender la estructura del conjunto de datos. De hecho, la definicin de estructura de datos vincula los datos estadsticos a los metadatos estructurales mediante la asignacin de conceptos descriptores a los elementos de los datos estadsticos.

Dibujo 4 Definicin de estructura de datos (Data Structure Definition)Como se muestra en el dibujo superior, la definicin de estructura de datos est formada por tres conjuntos de conceptos: dimensiones que comprenden dimensiones no asociadas a claves y listas de claves: descriptor de clave; descriptor(es) de clave de grupo; puede haber ms de un descriptor de clave de grupo. lista de medidas.

lista de atributos.

Los conceptos dimensiones, medidas, y atributos se pueden tomar de cualquier esquema de concepto (Concept Scheme) que se encuentre mantenido, y estos no tienen que venir de la misma agencia o esquema.Las dimensiones son aquellos conceptos que describen datos estadsticos y forman el identificador (clave) de los datos relacionados. Para lograr esto, las dimensiones se agrupan en claves, que permitirn la identificacin de un conjunto de datos particular (por ejemplo, una serie).

La lista de medidas comprende una medida para los datos de serie temporal (Time series): la medida primaria. sta suele asociarse con el concepto OBS_VALUE y mide un fenmeno estadstico a lo largo de un perodo de tiempo. Solamente puede haber una medida primaria declarada en la DSD (Data Structure Definition). Esto significa que en una serie temporal (Time series) SDMX solo puede haber un concepto de medida.

Por otro lado, para la organizacin de datos transversales (Cross-sectional), se puede declarar una dimensin de medida que contenga las medidas transversales mltiples (ver seccin 4.5.2).La lista de atributos comprende uno o ms atributos. Los atributos son conceptos que se usan para proporcionar ms informacin sobre alguna parte de un conjunto de datos. Cada atributo de la definicin de estructura de datos debe asignarse a una parte identificada del conjunto de datos (en el modelo, esto se conoce como nivel de asociacin o nivel de agrupamiento).

Las claves consisten en dimensiones, cuyos valores combinados en un conjunto de datos identifican nicamente valores de datos observados (serie o seccin). Un valor de observacin particular en una serie temporal se identifica con la clave y con el tiempo de este valor particular. El modelo de informacin SDMX (SDMX Information Model) permite crear subconjuntos de claves llamados claves de grupo. Este subconjunto de dimensiones de clave forma una clave parcial cuyos valores combinados identifican un subconjunto del cubo, al que los atributos estn vinculados, aportando metadatos sobre el objeto identificado. Por tanto, el propsito del descriptor de clave de grupo es el de definir un subconjunto perteneciente al descriptor de clave completa al que se pueden adjuntar atributos de datos.

Dentro de un grupo, algunos conceptos descriptores tienen valores que son los mismos para todas las series dentro del grupo, mientras que otros conceptos descriptores s se pueden cambiar. La regla a cumplir es que los conceptos descriptores han de ser adjuntados al nivel de agrupamiento donde se vuelven variables. Por tanto, si dentro de un nico conjunto de datos, todos los contenidos de una serie comparten un nico valor para un concepto descriptor, entonces ese concepto descriptor deber adjuntarse al nivel de serie. Esta regla tambin asume que el nivel elegido es el nivel estructural ms alto, donde todos los subgrupos compartirn el mismo valor.Los niveles de asociacin de conceptos descriptores siempre se encuentran al menos en el nivel donde el concepto resulta significativo: as pues, no se puede adjuntar el concepto descriptor frecuencia en el nivel de observacin, porque como concepto que es, solamente puede operar en el nivel de serie (esto es, con mltiples observaciones hechas durante un tiempo).

El siguiente ejemplo sobre organizacin de datos de serie temporal aplicada a las estadsticas de negocios de corto plazo de la produccin industrial (STS, Short-Term Business Statistics), ilustra los elementos presentes en su relacionada definicin de estructura de datos (Data Structure Definition). En el contexto de este ejemplo, se presta atencin especial a cuestiones de agrupamiento. El dibujo 5 inferior - Esquema de estructura de datos (Data Structure Scheme) de STS, se prolonga mediante casillas grises que contienen los conceptos STS relacionados (ej.: STS_Indicator) y las representaciones del valor codificado para los conceptos codificados (Coded Concepts) (ej: CL_STS_INDICATOR, la lista de cdigos relacionada con el concepto STS_INDICATOR).

Dibujo 5 Esquema de estructura de datos (Data Structure Scheme) de STSLas estructuras de datos de serie temporal (Time-series Data Structures) como la del ejemplo STS superior admiten los siguientes niveles de asociacin o niveles de agrupamiento:

NIVELIDENTIFICACIN

Conjunto de datosNivel superior; el conjunto de datos completo;

Clave de grupoIdentificada por un valor para cada una de las dimensiones que forman la clave de grupo, por ejemplo, una clave de grupo formada por FREQUENCY, ADJUSTMENT, STS_ACTIVITY, STS_INDICATOR, STS_INSTITUTION y STS_BASE_YEAR;

Clave de serieIdentificada por un valor para cada una de las dimensiones de la clave, por ejemplo, FREQUENCY, ADJUSTMENT, REF_AREA, STS_ACTIVITY, STS_INDICATOR, STS_INSTITUTION & STS_BASE_YEAR;

Observacin Identificada por un valor para cada una de las dimensiones de la clave adems del valor tiempo, por ejemplo, FREQUENCY, ADJUSTMENT, REF_AREA, STS_ACTIVITY, STS_INDICATOR, STS_INSTITUTION y STS_BASE_YEAR, y TIME_PERIOD.

Tabla 8 Niveles de asociacinEl grupo ms comn que se usa es el SiblingGroup, en el que se incluyen todas las dimensiones, excepto la frecuencia del informe. Este grupo se defina habitualmente en el pasado, porque la mayora de atributos que no se encuentran directamente vinculados a la observacin particular, no varan en cuanto a sus valores referidos de frecuencia. Por tanto, resultara un tanto redundante el repetir valores de atributos para las series donde solo la frecuencia cambia. En consecuencia, estos atributos podan adjuntarse en el nivel SiblingGroup.Teniendo en cuenta el ejemplo STS de arriba, un grupo sibling puede definirse con la siguiente combinacin de valores de clave:

REF_AREA="BE"

ADJUSTMENT="N"

STS_INDICATOR="TOTV"

STS_ACTIVITY="NS0080"

STS_INSTITUTION="1"

STS_BASE_YEAR="2005"

Las series correspondientes se muestran en la tabla 9 para dos frecuencias diferentes (mensual y trimestral):

ndice de Facturacin Industrial Total Actividad = NS0080 (Solo para fines ilustrativos datos ficticios)

MensualndiceTrimestralndice

2008M0195.19

2008M0287.13

2008M0397.092008Q0194.24

2008M04111.45

2008M05121.23

2008M06137.762008Q02122.79

2008M07108.19

2008M08112.15

2008M09103.092008Q03107.24

2008M1099.65

2008M11101.23

2008M1297.762008Q0498.29

Tabla 9 Datos del grupo sibling en forma de tablaAl agrupar no existe ningn requisito por el que se deba tener una nica dimensin omitida de una clave parcial (Partial Key); puede ser cualquier subconjunto del conjunto de dimensiones ordenadas (esto es, todas las dimensiones excepto la dimensin tiempo, que nunca puede ser declarada como perteneciente a la clave de grupo o parcial (Group/Partial Key)). Todos los grupos declarados en la definicin de estructura de datos (Data Structure Definition) han de ser nicos, esto quiere decir que no se pueden tener claves parciales duplicadas. En SDMX, los datos se pueden agrupar para que funcionen como un paquete de informacin til. Por tanto, para datos STS es posible un agrupamiento del rea de referencia (REF_AREA) o STS_ACTIVITY, adems de otras dimensiones de clave (Key Dimensions).Debajo, se ilustra el ejemplo de un grupo "REF_AREA". Este grupo se declara porque no existe ninguna variacin para los atributos de pases diferentes. Esto es para todas las dimensiones excepto la dimensin REF_AREA que forma la clave parcial (o clave de grupo). Por tanto, la dimensin REF_AREA , que no es parte de un grupo, tiene un valor que vara dentro del nivel de serie (para la organizacin de datos de serie temporal STS).En el ejemplo se toman dos conjuntos de valores de claves parciales (claves de grupo) para organizar los datos (grupo 1 y grupo 2). Los grupos se diferencian entre s solamente en las claves por valor de actividad. En cada grupo, imaginamos dos conjuntos de claves que identifican las series temporales (serie 1 y serie 2) cuyos valores de clave se diferencian solo por el rea de referencia. Una vez que se ha definido un agrupamiento, los atributos relevantes se adjuntan a los grupos (ej.: los atributos de nivel de grupo en el ejemplo: ttulo y decimales).Ejemplo del grupo "REF_AREA":El conjunto de datos STS se representa como serie temporal en formato CSV:

M;BE;N;TOTV;NS0080;1;2005;2008-04;95.19;E;F

M;BG;N;TOTV;NS0080;1;2005;2008-04;138.05;A;F

M;BE;N;TOTV;NS0080;1;2005;2008-05;87.13;E;F

M;BG;N;TOTV;NS0080;1;2005;2008-05;137.76;A;F

M;BE;N;TOTV;NS0060;1;2005;2008-04;101.24;E;F

M;BG;N;TOTV;NS0060;1;2005;2008-04;165.59;A;F

M;BE;N;TOTV;NS0060;1;2005;2008-05;86.59;E;F

M;BG;N;TOTV;NS0060;1;2005;2008-05;168.55;A;F

Estructura de datos STS (STS Data Structure): Las dimensiones son: frequency; reference area; adjustment; indicator; activity; institution; base_year; time_period. Los atributos son: obs_status; confidentiality; decimals y title

Por favor tngase en cuenta que la clave de grupo ha de mostrarse en las series de las que dependan stas para establecer el vnculo, ya que las series vinculadas no pueden estar integradas en los grupos para los datos de SDMX-ML compacto

Grupo 1: Frequency = M; adjustment =N; indicator = TOTV; activity = NS0080; institution = 1; base_year = 2005; Title = ndice de Facturacin Industrial Total de bienes de consumo no duraderos; Decimals = 2.

Grupo 2: Frequency = M; adjustment =N; indicator = TOTV; activity = NS0060; institution = 1; base_year = 2000; Title = ndice de Facturacin Industrial Total de bienes de consumo duraderos; Decimals = 2.

Serie 1: Frequency = M; adjustment =N; indicator = TOTV; activity =NS0080; institution = 1; base_year = 2005, reference area =BEObservacionestime_period = 2008-04; observation value =95.19; status =E; confidentiality = F

time_period = 2008-05; observation value =87.13; status =E; confidentiality = F

Serie 2: Frequency = M; adjustment =N; indicator = TOTV; activity =NS0080; institution = 1; base_year = 2005, reference area =BG Observacionestime_period = 2008-04; observation value =138.05; status = A; confidentiality = F

time_period = 2008-05; observation value =137.76; status = A; confidentiality = F

Serie 1: Frequency = M; adjustment =N; indicator = TOTV; activity =NS0060; institution = 1; base_year = 2000, reference area =BE

Observacionestime_period = 2008-04; observation value =101.24; status =E; confidentiality = F

time_period = 2008-05; observation value =86.59; status =E; confidentiality = F

Serie 2: Frequency = M; adjustment =N; indicator = TOTV; activity =NS0060; institution = 1; base_year = 2005, reference area =BG Observacionestime_period = 2008-04; observation value =165.59; status = A; confidentiality = F

time_period = 2008-05; observation value =168.55; status = A; confidentiality = F

ndice de Facturacin Industrial Total (IFIT)

datos mensuales (2005 = 100)

No ajustadas estacionalmente o por das de trabajo

ActividadNS0080NS0060

Bienes de consumoBienes de consumo duraderos

rea de referenciaTiempo2008-042008-052008-042008-05

BlgicaBE95.19e87.13e101.24e86.59e

BulgariaBG138.05137.76165.59168.55

e: Estimaciones de Eurostat

Tabla 10 - STS ndice de facturacin industrial total (tabla multidimensional)

Pos. en claveDimensin o nombre de atributoIdentificadorLista de cdigosNivel de asociacin

DIMENSIONES

1FrecuenciaFREQCL_FREQ

2rea de referenciaREF_AREACL_REF_AREA

3AjusteADJUSTMENTCL_ADJUSTMENT

4Tipo de ndiceSTS_INDICATORCL_STS _INDICATOR

5ActividadSTS_ACTIVITYCL_STS _ACTIVITY

6Tipo de institucinSTS_INSTITUTIONCL_STS_INSTITUTION

7Ao baseSTS_BASE_YEARCL_STS_BASE_YEAR

Perodo de referenciaTIME_PERIOD

MEDIDAS

ndice de facturacinOBS_VALUE

ATRIBUTOS

Estado de observacinOBS_STATUSCL_OBS_STATUSObservacin

ConfidencialidadOBS_CONFCL_OBS_CONFObservacin

Formato de tiempoTIME_FORMATCL_TIME_FORMATSerie

TtuloTITLEGrupo

DecimalesDECIMALSCL_DECIMALSGrupo

Tabla 11 Conceptos de estructura de datos (Data Structure Concepts) del ejemplo en serie temporal (Time series)4.5 Conjunto de Datos (Dataset)El conjunto de datos contiene datos y metadatos relacionados cuyo contenido se ajusta a la especificacin de una definicin de estructura de datos (Data Structure Definition).

Segn se ilustra en el dibujo 6, la definicin de estructura de datos (Data Structure Definition) puede vincularse con una definicin de flujo de datos. El flujo de datos (ver seccin 4.8) define aquellos metadatos relacionados con un flujo de datos que se recoge o difunde. Tales metadatos contienen, por ejemplo, la periodicidad de los informes y qu organizaciones presentan un determinado conjunto de datos.

Dibujo 6: Vista general de un conjunto de datos (Dataset)4.5.1 Conjunto de datos de serie temporal (Time series Dataset)El conjunto de datos de serie temporal comprende: las claves de serie temporal (Time series Keys), cada una de las cuales define la clave de una serie temporal que, cuando se combina con un perodo de tiempo, identifica exclusivamente a una observacin; opcionalmente las claves de grupo (Group Keys), que (conceptualmente) comprenden un conjunto de claves de serie temporal (Time series Keys) para el cual pueden presentar valores de atributo; valores de atributo, que se presentan para un objeto especfico como puede ser el de un conjunto de datos (Dataset), clave de grupo (Group Keys), clave de serie temporal (Time series Key) o observacin.La estructura principal de un conjunto de datos (Dataset) es un conjunto de claves y claves de grupo (Group Keys). Cada clave comprende un conjunto de valores de clave; un valor para cada una de las dimensiones definidas en la definicin de estructura de datos. En el caso de la serie temporal (Time series), para cada clave puede haber uno o ms valores de observacin en diferentes momentos dentro de un perodo de tiempo. Los valores de atributo pueden presentarse, y cada uno de estos valores pueden adjuntarse al nivel apropiado: conjunto de datos (Dataset), clave de series (Series Key), clave de grupo (Group Key) o directamente un valor de observacin.

El conjunto de datos (Dataset) puede incluir una referencia al flujo de datos, el cual por su parte, se encuentra vinculado (obligatoriamente) a la definicin de una estructura de datos (Data Structure Definition). Una aplicacin puede entonces usar el flujo de datos para recuperar la DSD (Data Structure Definition) y as procesar o validar el conjunto de datos (Dataset).4.5.2 Conjunto de Datos Transversal (Cross-sectional)Los datos transversales (cross-sectional) son aquellos tipos de datos estadsticos que no se encuentran organizados como lo suelen estar los de serie temporal. Estos datos se organizan entorno a otra dimensin no temporal del cubo de datos estadsticos.

Las representaciones transversales (cross-sectional) de los datos pueden obtenerse de la misma definicin de estructura de datos (Data Structure Definition) de la que obtienen su estructura las representaciones de serie temporal, siempre que se aporten los metadatos estructurales adicionales que sean necesarios.

Esta funcionalidad permite a mltiples medidas (denominadas medidas transversales - Cross-sectional Measures) ser declaradas en una definicin de estructura de datos (Data Structure Definition), asociada con los valores de representacin de una dimensin. Cuando los datos se estructuran para representar a un conjunto de mltiples observaciones en un momento concreto de tiempo, la seccin (una o ms observaciones para cada medida declarada) reemplaza a las series en la estructura de datos.

Cada medida lleva al menos una dimensin de la clave (la dimensin de medida) (Measure Dimension) en el nivel de observacin, mientras que el perodo de tiempo se adjunta en un nivel ms alto dentro de la estructura de datos (el nivel de grupo, que se detalla ms abajo). El resto de la clave se encuentra en el nivel de seccin (o ms arriba), de la misma manera en que se adjunta al nivel de serie para estructuras de datos de serie temporal.

Por ejemplo, si la dimensin ACTIVIDAD (ACTIVITY Dimension) se declara como dimensin de medida en la definicin de estructura de datos STS (tabla 12), entonces definimos varias secciones que corresponden a varios posibles valores de la dimensin, digamos NS0080, NS0060, y NS0050.

Los conceptos que describen las tres medidas transversales (cross-sectional) tienen que definirse para declararse luego en la definicin de estructura de datos (Data Structure Definition). Por ejemplo:

Nombre de conceptoValor correspondiente de la dimensin de medida ACTIVIDAD

CONGINDNS0080

MIGDCGNS0060

MIGCDINS0050

Tabla 12 Conceptos de la dimensin de medida ACTIVIDADEn tal situacin, la definicin de los conceptos de los datos STS se ve enriquecida con tres nuevas medidas:Pos. en claveDimensin o nombre de atributoIdentificadorLista de cdigosNivel de asociacin

DIMENSIONES

1FrecuenciaFREQCL_FREQSeccin

2rea de referenciaREF_AREACL_REF_AREASeccin

3AjusteADJUSTMENTCL_ADJUSTMENTSeccin

4Tipo de ndiceSTS_INDICATORCL_STS_INDICATORSeccin

5Dimensin Actividad / MedidaSTS_ACTIVITYCL_STS_ACTIVITYObservacin

6Tipo de institucinSTS_INSTITUTIONCL_STS_INSTITUTIONSeccin

7Ao baseSTS_BASE_YEARCL_STS_BASE_YEARSeccin

Perodo de referenciaTIME_PERIODGrupo

MEDIDAS (de la Dimensin de Medida de Actividad)

Industria de bienes de consumoCONGIND

Industria de bienes de consumo duraderosMIGDCG

Industria de bienes de capitalMIGCDI

ATRIBUTOS

Estado de observacinOBS_STATUSCL_OBS_STATUSObservacin

ConfidencialidadOBS_CONFCL_OBS_CONFObservacin

Formato de tiempoTIME_FORMATCL_TIME_FORMATSeccin

TtuloTITLEGrupo

DecimalesDECIMALSCL_DECIMALSGrupo

Tabla 13 Conceptos de estructura de datos (Data Structure Concepts) del ejemplo con medidas transversales (Cross-sectional Measures)Las siguientes tablas ilustran las dos representaciones de datos: serie temporal y transversal:ndice de Facturacin Industrial Total (IFIT) Serie Temporal

REF_AREA_REF: ItaliaINDICATOR: IFITBASE YEAR: 2005

IndicadorNS0080Bienes de consumoNS0060Bienes de consumo duraderoNS0050Industria de bienes de capital

Tiempo

2007M01100.882.493.7

2007M02106.597.1106.8

2007M03121.2121.3134.9

2007M0497.7104.4106.4

2007M05111.9121.8134.5

2007M06116120.3136.6

ndice de Facturacin Industrial Total (IFIT) Transversal

TIME: 2007M01INDICATOR: IFITBASE YEAR: 2005

IndicadorNS0080Bienes de consumoNS0060Bienes de consumo duraderoNS0050Industria de bienes de capital

Pas

ES99.6104.6108.4

FR102.392.893.4

IT100.882.493.7

Tabla 14 Tabla de serie temporal y transversal4.6 Definicin de Estructura de Metadatos (MSD: Metadata Structure Definition)

Una definicin de estructura de metadatos (Metadata Structure Definition) define el contenido vlido de un conjunto de metadatos (Metadata Set) (ver 4.7) en trminos de los conceptos que comprenden la estructura del conjunto de metadatos (Metadata Set), cmo se relacionan los conceptos en trminos de su papel en el conjunto de metadatos (Metadata Set), y el contenido vlido de cada uno de los conceptos cuando se usan en un conjunto de metadatos (Metadata Set).

Las definiciones de estructuras de metadatos (Metadata Structure Definition) se estructuran de una manera bastante simple, porque los metadatos de referencia estn menos estructurados que los datos estadsticos agregados. La estructura ms simple de estos consiste en una lista plana o una jerarqua.

Una MSD (Metadata Structure Definition) lleva una serie de conceptos (que pueden tener como origen esquemas de concepto (Concept Schemes) distintos) y los organiza, por ejemplo, en una jerarqua. Adems, tambin seala para cada concepto si su informe es necesario u opcional, y asigna una representacin de un concepto (listas de cdigos (Code List), formato de texto, etc.). Adems, identifica el tema(s) (denominado identificador de objetivo target identifier) de los metadatos publicados, siempre en relacin con qu datos los metadatos de referencia se estn presentando.4.7 Conjuntos de Metadatos

Dibujo 7 Conjunto de metadatosUn conjunto de metadatos de referencia (Reference Metadata Set) se presenta para un flujo de metadatos dado que ha de ajustarse a una definicin de estructura de metadatos (Metadata Structure Definition). Las claves de objetivo (target keys) identifican los datos de objetivo o el objeto de metadatos para el que se declaran los atributos de metadatos (con sus valores particulares). El hecho de que el conjunto de metadatos incluya una referencia al flujo de metadatos, que se encuentra estrictamente vinculado a la definicin de estructura de metadatos (Metadata Structure Definition), permite que una aplicacin recupere la MSD (Metadata Structure Definition) para que la presentacin de los metadatos pueda procesarse, y validarse, si as se requiere.Un conjunto de metadatos de referencia (Reference Metadata Set) alberga informacin sobre casi cualquier objeto dentro de la visin SDMX formal de intercambios estadsticos, y puede describir:

los que mantienen los datos o definiciones estructurales; la planificacin para la publicacin de datos; el flujo de un nico tipo de datos en un espacio de tiempo; la calidad de los datos (segn lo estipulado en un marco de calidad de datos).Los conjuntos de metadatos (Metadata Set) generalmente comprenden mltiples informes de metadatos, y cada informe define a su vez:

un objeto nico, al que los metadatos de referencia se vinculan; los valores presentados de los atributos de metadatos (como se especifica en la MSD (Metadata Structure Definition)) que son los que forman la estructura especfica de la declaracin.4.8 Definicin de Flujo de Datos (Dataflow) y Metadatos (Metadata Flow)En SDMX, los conjuntos de datos se presentan o difunden segn una definicin de flujo de datos. La definicin de flujo de datos se vincula a la definicin de estructura de datos (Data Structure Definition) y puede asociarse con uno o ms dominios de temas. Esto facilita la bsqueda de datos segn un esquema de materia organizado (llamado esquema de categora en el modelo) ya que estos proporcionan una manera de clasificar datos para su recogida, presentacin o publicacin. Flujos de datos definidos para STS

DSDSDMX

GESMES

ESTAT+STS+2.0.xml

EUROSTAT_STS_TS.gsm

Flujos de datosSDMX2GESMES

Produccin en industria SSTSIND_PROD_MSTSIND_PROD_M, _Q

Facturacin en industria, total, nacional, internacional, reparto de la internacional en la zona euro y fuera de la zona euroSTSIND_FACT_M, _Q

Nuevos pedidos recibidos en industria, total, nacional, no nacional, reparto de la no nacional en la zona euro y fuera de la zona euroSSTSIND_PED_MSTSIND_PED_M, _Q

Nmero de personas empleadas, nmero de empleadores en la industriaSTSIND_EMPL_M, _Q

Horas trabajadas en industriaSTSIND_HORA_M, _Q

Sueldos y salarios brutos en industriaSTSIND_GANA_M, _Q

Precios de produccin en industria, total, mercado nacional, mercado internacional, reparto del internacional en la zona euro y fuera de la zona euro, precios de importacin (total, zona euro, fuera de la zona euro)SSTSIND_PREC_MSTSIND_PREC_M

Produccin de construccin, total, construccin de edificios, ingeniera civilSSTSCONS_PROD_M, _QSTSCONS_PROD_M, _Q

Nuevos pedidos recibidos en construccin, total, construccin de edificios e ingeniera civil STSCONS_ORD_M, _Q

Nmero de personas empleadas, nmero de empleadores, en construccinSTSCONS_EMPL_M, _Q

Horas trabajadas en construccinSTSCONS_HORA_M, _Q

Sueldos y salarios brutos en construccinSTSCONS_GANA_M, _Q

Precios de produccin en construccin, costes de construccin, costes materiales, costes laboralesSTSCONS_PREC_M, _Q

Permisos de construccin, nmero de residencias o metros cuadrados de superficie de suelo tilSTSCONS_PERM_M, _Q

Facturacin del comercio al por menor, valor apreciado o deflactadoSSTSRTD_FACT_MSTSRTD_FACT_M

Nmero de personas empleadas, nmero de empleadores en el comercio al por menorSTSRTD_EMPL_M, _Q

Facturacin en reparaciones y otros servicios, valor apreciado o deflactadoSSTSSERV_FACT_M, _QSTSSERV_FACT_M, _Q

Precios de produccin en otros serviciosSTSSERV_PREC_QSTSSERV_PREC_Q

Nmero de personas empleadas, nmero de empleadores en reparaciones y otros serviciosSTSSERV_EMPL_QSTSSERV_EMPL_M, _Q

Cualquier otro indicador no mencionado en la lista superiorSTSOTRO_OTRO_M, _Q

Tabla 15 STS - DSD y flujos de datos (SDMX & GESMES)Un flujo de datos se puede ver como la publicacin constante de un conjunto de datos, ya que se van aadiendo nuevas observaciones a las ya existentes, o como subsecuencias de conjuntos de datos que se van publicando con el mismo tema y estructura. Los flujos de datos pueden entenderse como conjuntos de datos que no estn limitados en el tiempo.

Las estructuras de datos y los flujos de datos (Data flows) son propiedad de las agencias, y estn mantenidos por las mismas. En un entorno de recogida de datos, tanto las estructuras de datos como los flujos de datos (Data flows) sern mantenidos por la agencia encargada de recoger los datos.

El diagrama inferior describe las caractersticas esenciales que ofrece el modelo de informacin SDMX (SDMX Information Model) para la presentacin o publicacin de datos y metadatos. El pivote de este diagrama es el flujo de datos o metadatos (Data or Metadata flow).

Dibujo 8 Definicin de flujo de datos y metadatos (Data and Metadata flow)El flujo de datos (Data flow) o metadatos (Metadata flow) es mantenido por la organizacin que recoge o cosecha los datos o metadatos para su uso o publicacin. El flujo de datos (Data flow) se vincula a una definicin de estructura de datos (Data Structure Definition) (definicin de estructura en el diagrama), pero por el contrario, una DSD (Data Structure Definition) puede servir como base para ms de un flujo de datos (Data flow). Igualmente, el flujo de metadatos (Metadata flow) se vincula a la definicin de estructura de metadatos (Metadata Structure Definition). Los conjuntos de datos (Data set) o metadatos (Metadata set) de un flujo de datos o metadatos de referencia pueden ser proporcionados por muchos proveedores de datos (Data providers) y cualquier proveedor de datos (Data provider) puede presentar o publicar conjuntos de datos (Data sets) o metadatos (Metadata sets) para muchos flujos de datos (Data flows) o metadatos (Metadata flows). Habitualmente un proveedor de datos (Data provider) puede aportar conjuntos de datos (Data sets) o metadatos (Metadata sets) para muchos temas o categoras de datos estadsticos.

El modelo de informacin SDMX (SDMX Information Model) permite que se adjunten restricciones a la definicin de flujo de datos. Las restricciones pueden tener que ver con la periodicidad de la publicacin o un subconjunto de posibles dimensiones de clave que se permiten en un conjunto de datos (Data set). Las restricciones se tratan en un prrafo inferior dedicado a las mismas.

Una definicin de flujo de metadatos es muy similar a una definicin de flujo de datos, pero tambin describe, categoriza y restringe a conjuntos de metadatos (Metadata set). En un conjunto de metadatos (Metadata set) slo hace falta una referencia a la definicin del flujo de metadatos, ya que esto habilita a una aplicacin a poder identificar la definicin de estructura de metadatos (Metadata Structure Definition) relevante que a su vez la habilitar para validar y procesar los metadatos.

4.9 Proveedor de Datos (Data Provider)En SDMX, un proveedor de datos (Data provider) es una organizacin que produce datos o metadatos de referencia disponibles para otras organizaciones. Los proveedores de datos (Data providers) pueden proporcionar conjuntos de datos (Data set) a muchos flujos de datos (Data flows) diferentes. Los flujos de datos (Data flows) pueden incorporar datos provenientes de ms de un proveedor de datos (Data provider). Con el fin de gestionar este proceso, el proveedor de datos (Data provider) se vincula a la definicin de flujo de datos o definicin de flujo de metadatos mediante un acuerdo de provisin (Provision Agreement): objetos que nos dicen qu proveedores de datos (Data providers) estn aportando qu datos a qu flujos de datos (Data flows). Lo mismo se cumple para los flujos de metadatos (Metadata flows).4.10 Acuerdo de Provisin (Provision Agreement)Un "acuerdo de nivel de servicio" es inherente a cualquier intercambio de estadsticas. incluso aunque este acuerdo no se formalice o se haga explcito. SDMX incorpora esta idea en objetos denominados "acuerdos de provisin" (Provision Agreement).Esta informacin describe la manera en la que los conjuntos de datos (Data sets) y los conjuntos de metadatos (Metadata sets) son proporcionados por un proveedor de datos (Data provider). Un acuerdo de provisin (Provision Agreement) puede restringirse en trminos de subconjuntos de claves (Keys) o valores de cdigo (Codes value) de la misma manera que con una definicin de flujo de datos o metadatos.

Por tanto, un proveedor de datos (Data Provider) puede expresar el hecho de que proporciona un flujo de datos (Data flow) particular que cubre un conjunto especfico de pases y temas, con una planificacin particular de la publicacin (calendario de publicacin).

4.11 Restricciones (Constraints)El trmino "restricciones" (constraints) en el modelo de informacin SDMX lleva integrada una serie de informacin: temas especficos sobre qu datos o metadatos se presentan dentro de un conjunto de datos (Data set) tericamente posibles (tal como son descritos por una definicin de estructura de datos o definicin de estructura de metadatos de referencia (Data Structure Definition or reference Metadata Structure Definition)), y el perodo de tiempo cubierto por los datos y metadatos estadsticos.

Las restricciones (constraints) se asocian:

con flujos de datos (Data flows), que habitualmente describen los temas que se cubren (= restricciones relacionadas con contenido); con el acuerdo de provisin (provision agreement), que aporta una descripcin completa de restricciones temporales (Time-related Constraints) y restricciones de contenido.Restricciones temporales (Time-related Constraints):Las restricciones temporales (Time-related Constraints) se definen generalmente en el acuerdo de provisin (provision agreement). La provisin de datos puede restringirse por un proveedor de datos (data provider) en lo referido a los perodos que se presentan. Por ejemplo, datos que solo se proporcionan desde el ao 2000 porque existen problemas de datos incompletos y fiabilidad con datos ms antiguos.Otra restriccin temporal (Time-related Constraint) podra suponer que un proveedor de datos (data provider) restringiera la provisin de datos a conjuntos de datos (Data sets) anuales solamente para un indicador estadstico, mientras que la mayora de los otros proveedores de datos (data providers) presentasen conjuntos de datos (Data sets) trimestrales y anuales para el mismo indicador.Restricciones de contenido:

El proveedor de datos o metadatos (Data or Metadata Provider) puede aplicar restricciones (constraints) al mbito de los datos o metadatos que suministra, en trminos de rangos de claves (Keys ranges) o conjuntos de claves (Keys sets) completas. Estas restricciones de contenido de una provisin de datos pueden especificarse para una definicin de flujo de datos, una definicin de flujo de metadatos, y un acuerdo de provisin (provision agreement). stas restringen el uso de una definicin de estructura correspondiente a un conjunto de datos/metadatos (Data/Metadata sets) en relacin a la definicin de flujo de datos o acuerdo de provisin (provision agreement) (restricciones de aprovisionamiento). Por tanto, el conjunto de datos (Data set) o conjunto de metadatos (Metadata set) resultante, en base a una DSD (Data Structure Definition) o MSD (Metadata Structure Definition), puede restringirse al:

especificar uno o ms conjuntos de claves (Key sets) tomadas de un conjunto terico que podra crearse de las dimensiones (a menudo llamado "producto cartesiano") que pueden incluirse o excluirse de un conjunto completo de claves usadas en la definicin de estructura de datos (Data Structure Definition) (o definicin de estructura de metadatos (Metadata Structure Definition)). El conjunto completo de claves representa todas las posibles combinaciones de valores de las dimensiones de clave. Un proveedor de datos (data provider) podra suministrar datos para un subconjunto de valores codificados en una de las dimensiones que comprenden la clave;Ejemplo:

Un proveedor de datos (data provider) podra presentar solo un conjunto limitado de indicadores (ej.: en STS, solo las actividades del ejemplo anterior: NS0080, NS0060 y NS0050) o limitar el informe de tablas de comercio a importaciones y exportaciones con pases socios especficos (ej.: proporcionar solamente datos de comercio con estados miembros de la UE).

Por tanto en ambos casos la provisin de datos se encuentra restringida, ya que una parte de los valores de las dimensiones de clave est excluida del intercambio de datos.

especificar una o ms regiones de cubos, cada una de las cuales comprende un conjunto de selecciones especficas que, juntas, pueden ser incluidas o excluidas del conjunto de valores que son vlidos para una dimensin, atributo o medida. Cada seleccin especifica la lista restringida de valores que son vlidos. Esta lista ha de ser: bien un conjunto completo o subconjunto de la representacin completa especificada para la dimensin, atributo o medida relevantes en la definicin de estructura de datos;

Ejemplo:

Un proveedor de datos (data provider) podra suprimir la presentacin de varios productos confidenciales presentes en datos de comercio exterior, donde el valor por unidad excediera una cantidad especfica (ej.: 10 millones de euros).

o bien un conjunto o subconjunto de la lista de valores vlidos (lista de cdigos (Code List)) especificada para un componente de identificador.

Ejemplo:

Un proveedor de datos (data provider) podra suprimir la presentacin de varios productos confidenciales presentes en datos de comercio exterior (como maquinara especial o armas). En consecuencia, los respectivos valores codificados (coded values) de la lista de cdigos (Code List) del productor se excluiran del informe.

4.12 Esquema de Categora (Category Scheme)Las listas de categoras (Category list) se mantienen a travs de agencias de mantenimiento. Un esquema de categora (Category Scheme) proporciona una manera de clasificar los datos para su recogida, informe, o publicacin. ste est constituido por una simple jerarqua de categoras (una categora puede tener una o ms categoras hijo), que en SDMX pueden incluir cualquier tipo de clasificacin til para la organizacin de datos y metadatos.

Con el fin de ofrecer la posibilidad de hallar datos y metadatos, la definicin de flujo de datos y la definicin de flujo de metadatos pueden tambin vincularse a una o ms categoras dentro de uno o ms esquemas de categora, como por ejemplo, un esquema de dominios de temas o categoras de informe. Los esquemas de categora (Category Schemes) ms habituales pueden comprender muchas categoras de alto nivel como finanzas, economa, salud, turismo, transporte, y demografa de una organizacin. Cada una de stas podra segmentarse a su vez en categoras de bajo nivel formando as una jerarqua de categoras.

El descender por la jerarqua nos llevar finalmente a la categora de ms bajo nivel, donde los flujos de datos (Data flows) y metadatos (Metadata flows) se encuentran vinculados. Estos flujos identifican a los conjuntos de datos (Data sets) y metadatos (Metadata sets) que los pblica (proveedores de datos (data providers)).

En el ejemplo ficticio de la tabla 16, este patrn se muestra de forma desgranada para la primera categora ENCP, en concreto para STS_IND y STS_CONS. Como consecuencia, un flujo de datos SDMX (SDMX Dataflow) asumido (STS_IND_PROD_M) se vinculara a la categora STS_IND_PROD.Esquema de Categora (Categoras SDMX ficticias para fines ilustrativos)

CATEGORYSCHEME_IDDescripcin

INDU_TRADE_SRV_SCHEMEUn esquema de categora para industria, comercio y servicios

CATEGORY_IDDescripcin

ICTSIndustria, Comercio y Servicios

STSEstadsticas de Negocios a Corto Plazo (ENCP)

STS_INDENCP Industria

STS_IND_PRODENCP ndice de Produccin Industrial

STS_IND_TOVTENCP ndice de Facturacin Industrial

STS_CONSENCP Construccin

STS_CONS_PROENCP ndice de Produccin de Construccin

STS_CONS_LABENCP ndice de Mano de Obra de Construccin

STS_TSENCP Comercio y Servicios

SBSEstadsticas de Negocios Estructurales (ENE)

SBS_NAENE Indicadores Principales

SBS_IND_COENE Industria y Construccin

SBS_DTENE Comercio

SBS_SERVENE Servicios

TOUREstadsticas de Turismo

PROMEstadsticas de Produccin de Bienes Manufacturados

ISCOEstadsticas de Sociedad de Informacin

Tabla 16 Ejemplo: Esquema de categora (Category Scheme) - Industria, comercio y servicios5 GlosarioLa tabla 17 presenta una lista de conceptos y acrnimos con sus definiciones.

ConceptoDefinicin

DSDDefinicin de Estructura de Datos (Data Structure Definition)

ESMSEstructura de Metadatos Euro SDMX (Euro SDMX Metadata Structure)

GESMESMensaje de intercambio de datos GESMES (Generic Statistical Message)

IDIdentificador (Identifier)

ITTecnologas de la Informacin (Information Technology)

MSDDefinicin de Estructura de Metadatos (Metadata Structure Definition)

NUTSNomenclatura de las Unidades Territoriales Estadsticas (Nomenclature of Territorial Units for Statistics)

SBSEstadstica de Negocios Estructurales (Structural Business Statistics)

SDMXIntercambio de Datos y Metadatos Estadsticos (Statistical Data and Metadata eXchange)

SDMX-IMModelo de Informacin SDMX (SDMX Information Model)

SDMX-MLLenguaje de Marcas SDMX formato XML para el intercambio de datos y metadatos estructurados en SDMX (SDMX Markup Language)

SODIIntercambio de Datos Abiertos SDMX (SDMX Open Data Interchange)

STSEstadsticas de negocios a Corto Plazo (Short Term Business Statistics)

XMLLenguaje de Marcas Extensible (EXtensible Markup Language)

Tabla 17 - Glosario

Measure

Medida

2009

-

02

TI

20 years

20 aos

Dimensin

Dimensin

Dimensin

Pas

Periodo

Ages

Edad

24.7

24.7

Ejemplo:

Se definen cuatro categoras para estadsticas de negocios a corto plazo (STS-Short-Term Business Statistics) dentro del proyecto Intercambio de Datos Abiertos SDMX (SDMX Open Data Interchange (SODI)):

SSTSCONS SODI Estadsticas a corto plazo sobre construccin;

SSTSIND SODI Estadsticas a corto plazo sobre industria;

SSTSRTD SODI Estadsticas a corto plazo sobre comercio al por menor;

SSTSSERV SODI Estadsticas a corto plazo sobre servicios.

Cada uno de estos se vincula con uno o ms flujos de datos. En el caso de SSTSCONS, por ejemplo, los siguientes flujos de datos se definen para los datos que se recogen:

SSTSCONS_PROD_M (Produccin en construccin total, construccin de edificios, ingeniera civil mensual);

SSTSCONS_PROD_Q (Produccin en construccin total, construccin de edificios, ingeniera civil trimestral);

Los flujos de datos como SSTIND_PROD_M se vinculan a una nica definicin de estructura de datos (ej.: ESTAT+STS+2.1.xml).

Un acuerdo de provisin representa el marco o acuerdo entre el proveedor de datos y un receptor que regula como se intercambia un conjunto de datos o metadatos (por ejemplo, SSTSCONS_PROD_M_DE1.xml Proveedor de Datos: Oficina Federal de Estadstica, Alemania; Receptor: Eurostat).

La MSD (Metadata Structure Definition) y los conjuntos de metadatos se describen con ms detalle en el libro del estudiante 5 Definicin de Estructura de Metadatos (Metadata Structure Definition)

DSD (Data Structure Definition) y flujos de datos tomados del proyecto SDMX OPEN DATA INTERCHANGE (SODI) de Eurostat

1/34