para la publicaciÓn de...

31
1 Buenas prácticas para la publicación de datos BUENAS PRÁCTICAS PARA LA PUBLICACIÓN DE DATOS La IDE de Bogotá

Upload: others

Post on 21-Aug-2020

4 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: PARA LA PUBLICACIÓN DE DATOSideca.gov.co/.../files/documentacion/buenaspracticaspublicaciondat… · La obtención de datos la realiza cada entidad en el desarrollo de sus actividades

1 Buenas praacutecticas para la publicacioacuten de datos

BUENAS PRAacuteCTICAS

PARA LA PUBLICACIOacuteN

DE DATOS

La IDE de Bogotaacute

2 Buenas praacutecticas para la publicacioacuten de datos

Tiacutetulo del documento Buenas praacutecticas para la publicacioacuten de datos

Fecha de actualizacioacuten septiembre de 2018 Web httpwwwidecagovco E-mail idecacatastrobogotagovco Licencia Attribution 40 International (CC BY 40)

Autores Martha Elisabeth Melo Beltraacuten - IDECA

3 Buenas praacutecticas para la publicacioacuten de datos

CONTENIDO

INTRODUCCIOacuteN 4

OBJETIVO 5

AUDIENCIA 5

ALCANCE 5

BUENAS PRAacuteCTICAS PARA LA PUBLICACIOacuteN DE DATOS 6

1 Proporcionar metadatos asociados con los datos publicados Estos metadatos

permitiraacuten conocer las caracteriacutesticas de los datos y deberaacuten ser interpretables tanto por

usuarios como por aplicaciones informaacuteticas 6

2 Proporcionar una licencia en donde se especifiquen las limitaciones yo restricciones

de acceso y uso de los datos 9

3 Utilizar vocabularios estandarizados y reutilizables en la estructuracioacuten y publicacioacuten

tanto de datos 12

4 Anonimizar los datos de caraacutecter personal informacioacuten estadiacutestica informacioacuten

indirectamente identificable e informacioacuten sensible o confidencial 15

5 Publicar los datos en formatos estaacutendar reutilizables y legibles por aplicaciones

informaacuteticas 17

6 Proporcionar un diccionario de datos que facilite el uso e interpretacioacuten de los datos

publicados 19

7 Acompantildear la publicacioacuten de los datos con enlaces a otros recursos 21

8 Depurar sus datos antes de publicarlos para garantizar su calidad y aumentar su

confianza 23

9 Incorporar el componente geograacutefico en los datos publicados para optimizar su

comprensioacuten uso re-uso y visualizacioacuten 26

10 Asignar un identificador uacutenico que permita aumentar la consulta uso e

interoperabilidad del dato publicado 28

OBTENGA EL MAacuteS ALTO NIVEL EN PUBLICACIOacuteN DE DATOS 30

REFERENCIAS 31

4 Buenas praacutecticas para la publicacioacuten de datos

INTRODUCCIOacuteN

La Infraestructura de Datos Espaciales del Distrito Capital - IDECA es el instrumento que

permite a las autoridades del Distrito identificar de manera constante la condicioacuten movilidad

dinaacutemica expansioacuten proceso proyectos y necesidades de la ciudad de Bogotaacute a traveacutes de la

obtencioacuten uso y disposicioacuten de informacioacuten georreferenciada para atender a la ciudadaniacutea y

conseguir la maacutes acertada toma de decisiones en beneficio de la ciudad y de sus habitantes

La obtencioacuten de datos la realiza cada entidad en el desarrollo de sus actividades misionales y el

uso de los datos producidos dependeraacute del propoacutesito del dato de la finalidad especiacutefica del

usuario y de coacutemo y cuando esteacuten disponibles los datos

IDECA gestiona la disposicioacuten de los datos por eso busca que los datos publicados por las

entidades pertenecientes a la Administracioacuten Distrital sin importar la plataforma de publicacioacuten

cuenten con altos estaacutendares de calidad interoperabilidad y documentacioacuten que promuevan y

faciliten el acceso comprensioacuten uso y re-uso de estos por cualquier usuario

Para encontrar y acceder los datos disponibles en el entorno Web los usuarios no

especializados tienen algunas dificultades ya que encuentran contenidos duplicados

desactualizados e inconsistentes lo que ha generado para los publicadores el reto de

garantizar el descubrimiento acceso calidad e interoperabilidad de sus datos

Es importante mencionar que si se publican datos uacutetiles novedosos actualizados y de calidad

no solo aumenta el nuacutemero de usuarios que los reutilicen y distribuyan sino que aumenta la

credibilidad y confianza en los datos Adicionalmente se disminuyen los costos y tiempos en la

generacioacuten de los datos y se reducen los usos indebidos de los mismos

Esta guiacutea pretende que las entidades o responsables de publicar y disponer los datos lo hagan

con altos estaacutendares de calidad debidamente documentados en formatos interoperables y

que satisfagan necesidades reales de los usuarios para que estos uacuteltimos puedan encontrarlos

accederlos comprenderlos y reutilizarlos

IDECA ha plasmado en este documento las mejores praacutecticas de publicacioacuten de datos en la

Web que cubren aspectos como el formato el acceso la calidad los metadatos el

licenciamiento y el origen de los datos

Se invita al lector a navegar faacutecilmente en el documento ya que este presenta sin un orden

determinado las mejores praacutecticas de publicacioacuten de datos explicadas en

iquestQueacute logro Los beneficios que se obtienen al aplicar la buena praacutectica

iexclRecomendaciones Las herramientas baacutesicas para conseguir el objetivo de la buena praacutectica

Ejemplos Utilizando conjuntos de datos reales de las entidades oficiales del Distrito Capital se visualiza la aplicacioacuten de la buena praacutectica

5 Buenas praacutecticas para la publicacioacuten de datos

OBJETIVO

Promover en las entidades de la Administracioacuten Distrital y sus responsables la apropiacioacuten y

adopcioacuten de las mejores praacutecticas de publicacioacuten de datos con el fin de aumentar el valor en la

informacioacuten producida dentro de su quehacer institucional

AUDIENCIA

Este documento estaacute dirigido a las entidades y personas responsables de la Administracioacuten

Distrital que publican o desean publicar datos oficiales de Bogotaacute a traveacutes de cualquier

plataforma de datos

ALCANCE

Las mejores praacutecticas expuestas en este documento estaacuten encaminadas a que los datos

publicados a traveacutes de plataformas oficiales cumplan con unos requisitos miacutenimos de calidad

documentacioacuten interoperabilidad y licenciamiento dentro del proceso de publicacioacuten

Buscamos con esta guiacutea de buenas praacutecticas garantizar la apropiacioacuten de cuatro principios

Que los datos sean descubiertos es decir que cualquier usuario en el entorno Web los

pueda encontrar faacutecilmente

Que los datos sean accesibles quiere decir que no presenten restricciones de acceso ni

que se encuentren cifrados

Que los datos sean interoperables en otras palabras que sean publicados en formatos

estandarizados que permitan ser procesados por cualquier software

Que los datos sean reutilizables es decir que estos sean utilizados en la mayor cantidad

de productos servicios y mercados

Debe tenerse en cuenta que IDECA expone en este documento las mejores praacutecticas de

publicacioacuten de datos identificadas con base a la experiencia adquirida en la disposicioacuten datos

de los uacuteltimos antildeos sin embargo existe una amplia gama de otras buenas praacutecticas de

publicacioacuten que no han sido incluidas en el presente texto y en consecuencia se invita al lector

a apropiarse de las praacutecticas expuestas y a dejar abierta la posibilidad de complementar la

informacioacuten presentada con otras fuentes

6 Buenas praacutecticas para la publicacioacuten de datos

BUENAS PRAacuteCTICAS PARA LA PUBLICACIOacuteN DE DATOS

1 Proporcionar metadatos asociados con los datos publicados Estos metadatos permitiraacuten conocer las caracteriacutesticas de los datos y deberaacuten ser interpretables tanto por usuarios como por aplicaciones informaacuteticas

Un metadato entendido como la informacioacuten acerca de un recurso1 es un dato con muchos

elementos que le permiten al usuario conocer desde la visioacuten del productor las caracteriacutesticas

propias de los datos publicados tales como las fechas de creacioacuten y actualizacioacuten el canal de

acceso la calidad del dato las condiciones de uso quieacuten lo produjo quieacuten lo distribuye etc

esto quiere decir que el metadato explica el dato en eacutel estaacute contenida toda la informacioacuten

relevante del dato

En la vida cotidiana la ceacutedula de ciudadaniacutea es el documento que contiene la informacioacuten

miacutenima de las personas (nombre sexo fecha de nacimiento GS RH estatura lugar de

nacimiento) esta informacioacuten permite que el ciudadano se identifique en cualquier lugar del

territorio nacional ante otras personas o autoridades que requieran conocerlo

Con los datos el tratamiento es similar el dato corresponde a la persona y el metadato

corresponde a la ceacutedula de ciudadaniacutea Asiacute como en Colombia todo ciudadano debe portar su

documento de identificacioacuten en el entorno Web todo dato debe portar su metadato en otras

palabras el metadato es parte integral del dato y existe entre ambos un viacutenculo inseparable

Los datos siempre deberaacuten publicarse con su respectivo metadato este uacuteltimo deberaacute contar

con informacioacuten completa y estandarizada que garantice que los usuarios encuentren

conozcan y utilicen los datos que producimos

Recuerde que la publicacioacuten del metadato es igual de importante que la publicacioacuten del

dato

iquestQueacute logro

Al publicar datos en conjunto con su metadato obtengo

Que mis datos sean encontrados y utilizados por maacutes usuarios Que los usuarios logren una correcta interpretacioacuten de la naturaleza calidad y

distribucioacuten de mis datos

Que mis datos sean entendidos evaluados y retroalimentados por maacutes usuarios

Que mis datos puedan ser compartidos e intercambiados entre sistemas

Que los motores de buacutesqueda encuentren mis datos publicados

Que las aplicaciones informaacuteticas procesen mejor y en mayor cantidad mis datos

1 ISO 19115-12014 410

7 Buenas praacutecticas para la publicacioacuten de datos

iexclRecomendaciones

Disponga metadatos suficientes que permitan a los usuarios tener la informacioacuten

correcta para decidir si el dato publicado satisface o no sus necesidades

Incluya en sus metadatos la ubicacioacuten del dato a traveacutes de la descripcioacuten del lugar

(localidad parque riacuteo etc) o a traveacutes de localizacioacuten por coordenadas geograacuteficas x e

y

Publique sus metadatos como una paacutegina Web HTML (HyperText Markup Language) o

simplemente como un archivo de texto separado

Disponga sus metadatos en el formato baacutesico de intercambio XML (Extensible Markup

Language) o en formatos estaacutendar maacutes sofisticados como JSON (JavaScript Object

Notation)

Al igual que los datos puede publicar los metadatos en muacuteltiples formatos desde la

misma URL

Tenga en cuenta que IDECA a partir de estaacutendares internacionales ha definido los

elementos miacutenimos que debe contener el metadato y que estos pueden ser utilizados

en la publicacioacuten de sus metadatos para facilitar el intercambio de estos

Figura 1 Secciones del Perfil de Metadatos IDECA

Para maacutes informacioacuten consulte la Cartilla para la creacioacuten de metadatos geograacuteficos en

Bogotaacute Distrito Capital

8 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo 1

En la siguiente URL se observa un metadato dispuesto para que los usuarios puedan consultar

faacutecilmente la informacioacuten asociada al dato publicado (Desarrollo Econoacutemico Rural Bogotaacute

DC)

httpmetadatosidecagovcogeoportalcatalogsearchresourcedetailspageuuid=A8AB6E

7A-55FB-40DA-85E1-0AA6B4FE6CE3

Ejemplo 2

En la siguiente URL estaacute disponible el metadato de un nivel de informacioacuten dispuesto por la

Unidad Administrativa Especial de Catastro Distrital ndash UAECD ndash en formato XML (legible por

aplicaciones informaacuteticas

httpmetadatosidecagovcogeoportalrestdocumentid=7BBE5F9AEE-1FBC-4C13-822F-

F2CE44AFDD7E7D

9 Buenas praacutecticas para la publicacioacuten de datos

2 Proporcionar una licencia en donde se especifiquen las limitaciones yo restricciones de acceso y uso de los datos

Una licencia entendida como las condiciones legales bajo las cuales estaacute disponible la obra2 es

un instrumento mediante el cual el propietario del dato autoriza o no a los usuarios para que

accedan a su contenido y tambieacuten lo faculta para su utilizacioacuten Existen diferentes tipos de

licencia para la distribucioacuten y explotacioacuten de obras y cuyo propoacutesito es regular las condiciones

de acceso y uso de los datos

Dependiendo el acceso autorizado a los datos las licencias pueden clasificarse en

Privativas o restrictivas Aquellas licencias conocidas como cerradas o no libres donde la mayoriacutea de las veces solo el autor puede usar la obra o en caso contrario se definen condiciones especiacuteficas que se deben cumplir para hacer uso de la informacioacuten

Semilibres Aquellas licencias que requieren autorizaciones para que los usuarios utilicen copien distribuyan o modifiquen su contenido

Libres o abiertas Aquellas licencias que en teacuterminos generales permiten usar distribuir y compartir los datos con muy pocas restricciones

Cuando un dato se publica acompantildeado de su licencia el usuario conoce las condiciones de

acceso uso y distribucioacuten de los datos que estaacute consumiendo de esta forma se garantiza que

los datos se distribuyan seguacuten los intereses de la entidad que los produce y se minimizan los

usos indebidos de los datos por parte de los usuarios

Ahora bien definir la licencia adecuada para cada dato dependeraacute de las condiciones que

establezca la entidad productora de este Revise los ejemplos y defina la licencia maacutes adecuada

para sus datos

Para maacutes informacioacuten consulte el Instructivo para la definicioacuten de licencias de datos

iquestQueacute logro

Que el usuario evaluacutee si puede o no usar mis datos

Que el usuario conozca las condiciones de acceso uso y manejo sobre los datos

disponibles

Dar claridad y potenciar el uso de los datos disponibles

Que el usuario de los reconocimientos respectivos a la entidad productora de los datos

Que se genere valor agregado sobre los datos disponibles en caso de asignar una

licencia abierta

2 Recuperado de httpsopendefinitionorgod21es

10 Buenas praacutecticas para la publicacioacuten de datos

iexclRecomendaciones

Identifique la licencia que mejor se acomode a su modelo de negocio Recuerde que

mediante la Ley 1712 de 2014 se reguloacute el derecho de acceso a la informacioacuten puacuteblica

y se incluyeron los principios de facilitacioacuten gratuidad y divulgacioacuten proactiva de la

informacioacuten

Disponga una licencia para su conjunto de datos a traveacutes de un enlace una copia

incorporada o dentro del metadato

Prefiera el uso de licencias abiertas de este modo sus datos seraacuten utilizados en una

mayor cantidad de productos servicios y mercados

Ejemplo 1

Mundialmente conocidas las licencias Creative Commons3 tienen como objetivo fortalecer a los

creadores para que sean quienes definan los teacuterminos en que sus obras pueden ser usadas queacute

derechos desean entregar y en queacute condiciones lo haraacuten A continuacioacuten encontraraacute los

enlaces de acceso para conocer las condiciones de cada una de las licencias disponibles

CC0 10 httpscreativecommonsorgpublicdomainzero10deedes

CC BY 40 httpscreativecommonsorglicensesby40

CC BY-SA 40 httpscreativecommonsorglicensesby-sa40

CC BY-ND 40 httpscreativecommonsorglicensesby-nd40

CC BY-NC 40 httpscreativecommonsorglicensesby-nc40

CC BY-NC-SA 40

httpscreativecommonsorglicensesby-nc-sa40

Ejemplo 2

Tambieacuten existen las licencias abiertas para datos Open Data Commons4 proporcionadas por la

mundialmente conocida red Open Knowledge Foundation Network ndash OKFN5 puede consultar

las condiciones ingresando a los siguientes enlaces

ODbL 10 httpsopendatacommonsorglicensesodblsummary

PDDL 10 httpsopendatacommonsorglicensespddlsummary

ODC-BY 10 httpsopendatacommonsorglicensesbysummary

3 httpcreativecommonsorg 4 httpopendatacommonsorg 5 httpsokfnorg

11 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo 3

El Mapa de referencia para Bogotaacute estaacute publicado en

httpswwwidecagovcoesserviciosmapa-de-referencia bajo las condiciones descritas en la

ldquoLICENCIA ABIERTA O CONDICIONES DE USO PARA DATOS ABIERTOS DE LA INFRAESTRUCTURA

INTEGRADA DE DATOS ESPACIALES PARA EL DISTRITO CAPITAL (IDECA)rdquo

httpswwwidecagovcoeslicenciaabierta

12 Buenas praacutecticas para la publicacioacuten de datos

3 Utilizar vocabularios estandarizados y reutilizables en la estructuracioacuten y publicacioacuten de los datos

Un vocabulario define los conceptos y las relaciones que se utilizan para describir y representar

un aacuterea de intereacutes6 Cuando se publican datos en la Web los vocabularios permiten integrar

datos cuando existen ambiguumledades en los teacuterminos utilizados en los diferentes conjuntos de

datos En la praacutectica un vocabulario es un conjunto de palabras que permiten a dos usuarios

comunicarse entre siacute La efectividad de dicha comunicacioacuten radica en que el significado de una

palabra para el usuario emisor sea el mismo que para el usuario receptor independientemente

de si utilizaron el mismo teacutermino

Cuando se habla de interoperabilidad de datos lo que se espera es que tanto los usuarios

como las aplicaciones informaacuteticas entiendan y comprendan la mayor cantidad de informacioacuten

que estaacuten consumiendo Para conseguir esto las comunidades de datos han identificado

vocablos palabras o teacuterminos de uso comuacuten los cuales cuentan con significados apropiados y

que actualmente se encuentran integrados y estructurados en diferentes estaacutendares

internacionales

Se recomienda utilizar vocabularios de este tipo para estandarizar los datos contenidos en la

informacioacuten publicada

iquestQueacute logro

Que mis datos sean consultados utilizados y reutilizados por maacutes usuarios Que se reduzca la ambiguumledad en la interpretacioacuten de mis datos Que mis datos sean interoperables Que mis datos sean procesados en entornos nacionales e internacionales Que mis datos puedan ser compartidos e intercambiados entre sistemas Que mis datos sean maacutes confiables

iexclRecomendaciones

Consulte normas locales o vocabularios internacionales para la estructuracioacuten7 de sus

datos

Apropie los vocabularios consultados y adapte sus datos a estos en los casos en que sea

posible

Incluya vocabularios ya definidos y reconocidos internacionalmente cuando vaya a

producir nuevos datos

6 httpswwww3orgstandardssemanticwebontology 7 Estructurar significa ajustar los datos a un esquema fijo

13 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo 1

A continuacioacuten se presentan algunos vocabularios internacionales que puede consultar y

apropiar para optimizar el intercambio de sus datos

Data Catalog Vocabulary (DCAT) httpswwww3orgTRvocab-dcatclass-catalog

FOAF Vocabulary Specification httpxmlnscomfoaf01

ISOTC 211 Geographic informationGeomatics Terminology

httpwwwisotc211orgTerminologyhtm

The RDF Data Cube Vocabulary httpswwww3orgTR2014REC-vocab-data-cube-20140116

ODRL Vocabulary amp Expression 22

httpswwww3orgTR2018REC-odrl-vocab-20180215

HTTP Vocabulary in RDF 10 httpswwww3orgTR2017NOTE-HTTP-in-RDF10-20170202

vCard Ontology - for describing People and Organizations

httpswwww3orgTRvcard-rdf

Ejemplo 2

En el contexto Nacional el Ministerio de Tecnologiacuteas de la Informacioacuten y las Comunicaciones ha

establecido el Lenguaje Comuacuten de Intercambio de como un instrumento de consulta que

contiene la definicioacuten de los elementos de datos conceptualizados por las entidades del

estado La consulta la puede realizar en httplenguajeminticgovco

14 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo 3

La especificacioacuten vCard disponible en httpswwww3orgTRvcard-rdf promueve un

vocabulario especiacutefico para describir personas y organizaciones

Uno de los vocablos que describe esta especificacioacuten es la ldquodireccioacuten de entregardquo llamado

dentro del vocabulario como ADR y definido como ldquola direccioacuten del objeto representado en

partes estructuradasrdquo

Ahora bien este vocabulario especifica los componentes de la direccioacuten de entrega para el

objeto asiacute el nombre del paiacutes la localidad el coacutedigo postal la regioacuten y la direccioacuten dada por

viacuteas (calles y carreras en el caso colombiano) Esto quiere decir que cualquiera de los

componentes descritos puede usarse como direccioacuten de entrega vaacutelida ya que son equivalentes

entre siacute

Aunque en el vocabulario la direccioacuten de entrega se llame ADR el usuario de la informacioacuten

entenderaacute que un nombre de paiacutes o un coacutedigo postal pueden interpretarse como ADR

15 Buenas praacutecticas para la publicacioacuten de datos

4 Anonimizar los datos de caraacutecter personal informacioacuten estadiacutestica informacioacuten indirectamente identificable e informacioacuten sensible o confidencial

Anonimizar es el proceso que impide la identificacioacuten de las unidades de estudio que son fuente

para los registros individuales de un conjunto8 de datos o maacutes claro es la aplicacioacuten de teacutecnicas

que permitan expresar un dato relativo a personas eliminando la referencia a su identidad9

Baacutesicamente lo que se busca es reducir los riesgos en el uso y procesamiento de datos

personales evitar la extraccioacuten de registros que identifican a una persona reducir la

combinacioacuten de dos o maacutes registros en una o varias bases de datos para identificar a una

persona y minimizar la deduccioacuten de datos personales partir de uno o varios datos publicados

iquestQueacute informacioacuten debo prioritariamente anonimizar

Datos personales Informacioacuten numeacuterica alfabeacutetica graacutefica fotograacutefica acuacutestica o

cualquier otro tipo susceptible de recogida registro tratamiento y transmisioacuten

concerniente a personas fiacutesicas identificadas o identificables (tales como nombre

apellidos estado civil sexo edad domicilio identificacioacuten personal nuacutemero de

teleacutefono etc)10

Informacioacuten sensible Informacioacuten considerada como estrictamente confidencial

Informacioacuten y caracteriacutesticas referentes a la edad procedencia salud raza religioacuten

ideologiacutea afiliacioacuten finanzas etc se consideran de caraacutecter sensible y requieren de

una proteccioacuten especial11

iquestQueacute logro

Garantizar que mis datos publicados cuentan con medidas de proteccioacuten de datos

personales

Eliminar de manera efectiva el riesgo de re-identificacioacuten

Evitar que el procesamiento de mis datos tenga consecuencias negativas para alguna

persona

Disponer muchos maacutes datos sin invadir la informacioacuten personal

iexclRecomendaciones

Implemente actividades de proteccioacuten de la privacidad de los datos personales antes

de publicarlos

Elimine cualquier identificador directo de la persona (nombre documento de

identidad etc)

8 httpswwwdanegovcofilessenlineamientosDSO_020_LIN_08pdf 9 httpdleraeesid=2jjMiRi 10 httpswwwdanegovcofilessenlineamientosDSO_020_LIN_08pdf 11 Ibidem

16 Buenas praacutecticas para la publicacioacuten de datos

Reemplace los identificadores directos por coacutedigos de referencia pseudoacutenimos

(algoritmos AES12 o un hash cifrado HMAC13) coacutedigos arbitrarios o aleatorios

Si reemplazando el identificador directo auacuten es faacutecil identificar a la persona elimine el

dato

Clasifique yo categorice los datos

Redondee los datos numeacutericos hacia arriba o hacia abajo

Evaluacutee antes durante y despueacutes de publicados los datos si la anonimizacioacuten de sus

datos es suficiente y evaluacutee regularmente los riesgos existentes

Para maacutes informacioacuten consulte los Lineamientos para la Anonimizacioacuten de micro datos

Ejemplo 1

Antes de publicar sus datos retire el identificador directo de la persona En este caso

reemplace en nuacutemero de documento que identifica al usuario y reemplaacutecelo por un

consecutivo

Usuario Beneficio Usuario Beneficio

80123456 Subsidio de vivienda Usuario 1 Subsidio de vivienda

51123456 Subsidio de alimentacioacuten Usuario 2 Subsidio de alimentacioacuten

19123456 Subsidio al adulto mayor Usuario 3 Subsidio al adulto mayor

53123456 Subsidio de desempleo Usuario 4 Subsidio de desempleo

Ejemplo 2

Clasifique o categorice sus datos En este ejemplo asigne rangos a la edad de manera tal que el

titular del registro no sea identificable por este dato

Usuario Edad Usuario Rango de edad

Usuario 1 11 antildeos Usuario 1 Entre 10 y 15 antildeos

Usuario 2 22 antildeos Usuario 2 Entre 20 y 25 antildeos

Usuario 3 36 antildeos Usuario 3 Entre 35 y 40 antildeos

Usuario 4 63 antildeos Usuario 4 Entre 60 y 65 antildeos

12 Advanced Encryption Standard puede consultar como ha sido implementado este algoritmo en httpsrevistasudistritaleducoojsindexphpTecnuraarticleview72368892 13 Hash-based Message Authentication Code puede consultar como se crea este cifrado en httpsdocsoraclecomcdE19253-01819-7804wanboottasks2-51indexhtml

17 Buenas praacutecticas para la publicacioacuten de datos

5 Publicar los datos en formatos estaacutendar reutilizables y legibles por aplicaciones informaacuteticas

Un formato puede ser definido como la estructura de un disco dividido en campos y pistas

seguacuten un determinado sistema operativo lo que permite almacenar en eacutel informacioacuten14

baacutesicamente es la forma en que se codifican los datos en un archivo informaacutetico

Actualmente conocemos formatos comunes de almacenamiento como el doc una extensioacuten

de Word que almacena texto y cuyo propietario es la compantildeiacutea Microsoft Pero iquestqueacute pasa si un

usuario quiere abrir un documento doc en un procesador de texto diferente a Word

difiacutecilmente va a poder conocer el contenido de dicho documento sin tener esta licencia

Lo que queremos lograr con la implementacioacuten de esta praacutectica es que todos los usuarios que

encuentren mis datos puedan accederlos sin necesidad de contar con un software o aplicacioacuten

informaacutetica especiacutefica

iquestQueacute logro

Que mis datos sean consultados utilizados y reutilizados por maacutes usuarios

Que mis datos sean maacutes interoperables y maacutes procesados

Que mis datos puedan ser extraiacutedos transformados y procesados por aplicaciones

informaacuteticas

Que mis datos puedan ser compartidos e intercambiados entre sistemas

Disminuir los costos y los tiempos en el uso y la transformacioacuten de mis datos

iexclRecomendaciones

Prefiera publicar su conjunto de datos en formatos abiertos o no propietario ya que

estos facilitan el uso re-uso y distribucioacuten de estos Se busca que un mayor nuacutemero de

aplicaciones informaacuteticas pueda extraer leer y transformar los datos generando mayor

uso y re-uso por los usuarios

Disponga sus datos en muacuteltiples formatos con el fin de incrementar el acceso a los

mismos Se busca que el mayor nuacutemero de usuarios pueda utilizar los datos sin tener

que transformarlos primero en su formato preferido

Utilice Web Services para mejorar el intercambio e interoperabilidad de los datos

publicados

14 httpdleraeessrvsearchm=30ampw=formato

18 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo 1

A continuacioacuten encontraraacute extensiones de formato propietario y no propietario prefiera para

la publicacioacuten de sus datos las extensiones de la derecha

FORMATO PROPIETARIO FORMATO NO PROPIETARIO

DOC GDB TXT ASCII Grid KML RDF

XLS DWG CSV GeoJSON DXF XML

PPT SHP JSON GML ODF

Ejemplo 2

Si no fue posible utilizar una extensioacuten de formato no propietario publique sus datos en una

variedad de formatos que le permita al usuario acceder a los datos desde diferentes

aplicaciones informaacuteticas

Ejemplo 3

Para publicar sus datos conozca diferentes tipos de Web Services que viajan en la red utilizando extensiones XML

SOAP httpswwww3orgTRsoap

REST httprestelksteinorg

WMS httpwwwopengeospatialorgstandardswms

WFS httpwwwopengeospatialorgstandardswfs

WCS httpwwwopengeospatialorgstandardswcs

19 Buenas praacutecticas para la publicacioacuten de datos

6 Proporcionar un diccionario de datos que facilite el uso e interpretacioacuten de los datos publicados

Un diccionario estaacute definido como un repertorio en forma de libro o en soporte electroacutenico en el

que se recogen seguacuten un orden determinado las palabras o expresiones de una o maacutes lenguas

o de una materia concreta acompantildeadas de su definicioacuten equivalencia o explicacioacuten15

especiacuteficamente en un diccionario de datos se encuentran los conceptos de los datos y sus

propiedades (atributos dominios asociaciones y operaciones) acompantildeados de una definicioacuten

en donde se identifica el propoacutesito alcance y campo de aplicacioacuten del dato publicado

Lograr que los usuarios de mis datos entiendan la informacioacuten que estaacute publicada le permitiraacute

decidir si satisfacen o no su necesidad y le facilitaraacute la decisioacuten para explotar lo datos

Para maacutes informacioacuten consulte el Instructivo Diccionario de Datos

iquestQueacute logro

Que mis datos sean consultados utilizados y reutilizados por maacutes usuarios

Que se eviten ambiguumledades en la interpretacioacuten de mis datos

Que mis datos publicados esteacuten unificados y consistentes

Que los usuarios comprendan mejor y dispongan de claridad sobre los conceptos de

mis datos

iexclRecomendaciones

Publique como miacutenimo un diccionario de datos que contenga la caracterizacioacuten del

conjunto de datos producidos por su entidad

Cree el diccionario de datos teniendo en cuenta como miacutenimo la siguiente informacioacuten

Nombre del atributo Nombre que identifica de manera clara un atributo

Definicioacuten Descripcioacuten del atributo

Tipo de dato Tipo de valor del atributo

Unidad de medida Expresa la unidad de medida del atributo

Dominio Determina si el atributo tiene asociado un dominio

15 httpdleraeesw=diccionario

20 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo

Para el conjunto de datos ldquoEstablecimientos Educativos en Bogotaacuterdquo publicariacuteamos un

diccionario de datos similar al siguiente

Nombre del atributo Definicioacuten Tipo de dato

Unidad de Medida

Dominio

Coacutedigo del establecimiento

Coacutedigo DANE asignado al Institucioacuten Educativa Decimal

Nombre del establecimiento

Nombre de la Institucioacuten Educativa Cadena de Caracteres

Aacuterea construida del establecimiento

Aacuterea construida de la Institucioacuten Educativa Decimal Metros

cuadrados

Sector

Clasificacioacuten asignada seguacuten la naturaleza juriacutedica la cual define las principales caracteriacutesticas que desde lo juriacutedico - administrativo y tiene que ver con el origen de su creacioacuten

Entero

EESector

No podriacuteamos olvidar detallar el dominio asociado

Atributo Nombre del Dominio Coacutedigo Definicioacuten

EESector

Oficial 1

Es una institucioacuten donde su naturaleza de servicio puacuteblico cultural y su funcioacuten social le es inherente cumpliendo con las disposiciones legales y estatutarias que las rigen donde sus rentas se conservan y se aplican debidamente

Privado 2

Es una institucioacuten constituida como persona juriacutedica de utilidad comuacuten donde sus rentas se conservan y se aplican debidamente y que en todo lo esencial se cumple con la voluntad de sus fundadores

21 Buenas praacutecticas para la publicacioacuten de datos

7 Acompantildear la publicacioacuten de los datos con enlaces a otros recursos

Un enlace es definido como una secuencia de caracteres que se utiliza como direccioacuten para

acceder a informacioacuten adicional16 maacutes sencillo puede definirse como una expresioacuten que

conecta una cierta informacioacuten con otra17Ahora bien un recurso se puede entender como

cualquier medio que satisfaga una necesidad por ejemplo datos servicios documentos o

software

En teacuterminos generales se sugiere que para facilitar al usuario la comprensioacuten de los datos

publicados se proporcionen recursos o documentos adicionales que puedan ser consultados

yo descargados traveacutes de enlaces o links de otro sitio Web

Dentro de los recursos adicionales que pueden publicarse para acompantildear el dato estaacuten los

procedimientos de captura del dato los cataacutelogos de objetos las especificaciones teacutecnicas los

documentos normativos los cataacutelogos de simbologiacutea los reportes de evaluacioacuten de calidad

entre otros

iquestQueacute logro

Mejorar la consulta utilizacioacuten y reutilizacioacuten de mis datos

Que los usuarios comprendan mejor mis datos

Que mis datos sean compartidos e intercambiados por un mayor nuacutemero de usuarios

iexclRecomendaciones

Disponga informacioacuten adicional de sus datos que le permita a los usuarios ampliar el

horizonte de las aplicaciones y funcionalidades en las que pueda utilizar y explotar del

dato

No olvide vincular o registrar esta informacioacuten en el metadato

16 httpdleraeesid=FTVRKyj 17 httpssistemascomenlacephp

22 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo 1

El ldquoMapa de Referencia para Bogotaacuterdquo publicado en httpswwwidecagovcoesserviciosmapa-de-referencia tiene publicados varios enlaces a otros recursos

Especificacioacuten teacutecnica para la elaboracioacuten del Mapa de Referencia para Bogotaacute DC V0318

Cataacutelogo de Objetos del Mapa de Referencia de Bogotaacute DC V 57

Cataacutelogo de Representacioacuten del Mapa de Referencia de Bogotaacute DC V30

Reporte de evaluacioacuten de calidad generado al Mapa de Referencia del Distrito Capital V1217

Ejemplo 2

La informacioacuten de los ldquohumedales de Bogotaacuterdquo publicada en

httpambientebogotagovcowebsdahumedales tiene publicados enlaces a otros recursos

o Gestioacuten de los humedales

o Poliacutetica de Humedales del Distrito Capital

o Normatividad

o Planes de Manejo Ambiental

o Comiteacute distrital de humedales documentos de consulta normatividad

23 Buenas praacutecticas para la publicacioacuten de datos

8 Depurar sus datos antes de publicarlos para garantizar su calidad y aumentar su confianza

La calidad estaacute definida como el conjunto de propiedades inherentes a algo que permiten

juzgar su valor18 para el caso que nos concierne este algo hace referencia al dato publicado

Ahora bien la calidad tambieacuten es entendida como la capacidad del dato publicado para

satisfacer los requerimientos y las necesidades de los usuarios respetando una serie de normas

y especificaciones establecidas

Actualmente existen muacuteltiples elementos de calidad de los datos que identifican las cualidades

de estos sin embargo en este aparte citaremos los elementos principales que usted o su

entidad deben tener en cuenta para publicar sus datos con un estaacutendar miacutenimo de calidad

Para maacutes informacioacuten consulte el Procedimiento para evaluar y reportar la calidad de

los datos espaciales

iquestQueacute logro

Que mis datos sean consultados utilizados y reutilizados por maacutes usuarios

Que los usuarios hablen bien de mis datos

Que mis datos sean maacutes interoperables y maacutes procesados

Que mis datos sean maacutes compartidos

Que mis datos sean maacutes confiables

Recomendacioacuten 1

Establezca si dentro de su conjunto de datos existen capos vaciacuteos o nulos con informacioacuten

descontextualizada sobrante o duplicada Si existen compleacutetelos o elimiacutenelos seguacuten

corresponda antes de la publicacioacuten El elemento de calidad asociado se denomina ldquototalidadrdquo

Localidad Atendidos Localidad Atendidos

Suba 200 Suba 200

Suba 200 Tunjuelito 500

Ameacutericas 100

850

Tunjuelito 500

18 httpdleraeesid=6nVpk8P|6nXVL1Z

Campo duplicado

Campo inconsistente

Campo vaciacuteo

24 Buenas praacutecticas para la publicacioacuten de datos

Recomendacioacuten 2

Identifique y transforme si es necesario los datos que hayan sido registrados en un formato

diferente al establecido para su conjunto de datos Es decir estandarice el formato de salida

del dato que va a publicar El elemento de calidad asociado se denomina ldquoconsistencia de

formatordquo

Localidad Atendidos Localidad Atendidos

Suba 200 Suba 200

Tunjuelito 5008 Tunjuelito 500

Fontiboacuten 40 Fontiboacuten 430

Tunjuelito 500 Tunjuelito 500

Recomendacioacuten 3

Si sus datos tienen alguacuten tipo de clasificacioacuten o rangos previo a la publicacioacuten valide que estos

se hayan registrado correctamente El elemento de calidad asociado se denomina ldquoexactitud de

clasificacioacutenrdquo

Geacutenero Edad Rango de Edad Geacutenero Edad Rango de Edad

Femenino 5 0 lt Edad le 10 Femenino 5 0 lt Edad le 10

Masculino 15 0 lt Edad le 10 Masculino 15 10 lt Edad le 20

Femenino 35 40 lt Edad le 50 Femenino 35 30 lt Edad le 40

Recomendacioacuten 4

Si sus datos representan atributos cuantitativos verifique antes de la publicacioacuten que estos

correspondan a valores conocidos como verdaderos El elemento de calidad asociado se

denomina ldquoexactitud de atributos cuantitativosrdquo

Localidad Mes Temperatura Localidad Mes Temperatura

Chapinero Enero 7degC Chapinero Enero 7degC

Suba Agosto -15degC Suba Agosto 15degC

Tunjuelito Abril 60degC Tunjuelito Abril 16degC

Clasificacioacuten inconsistente

Formato inconsistente

Valor inconsistente

25 Buenas praacutecticas para la publicacioacuten de datos

Recomendacioacuten 5

Si los datos a publicar tienen asociadas fechas de captura o recoleccioacuten de informacioacuten (Por

ejemplo registro de incidentes registro de vacunacioacuten conteo de vehiacuteculos etc) valide que

las fechas registradas coincidan con la fecha del evento capturado El elemento de calidad

asociado se denomina ldquoexactitud de la medicioacuten del tiempordquo

Precipitacioacuten (mm) Fecha de registro Precipitacioacuten (mm) Fecha de registro

00 20580101 00 20180101

01 20180102 01 20180102

126 20510403 126 20180103

20 20180104 20 20180104

Recomendacioacuten 6

Cuando sus datos reflejen informacioacuten determinada por un orden de eventos garantice antes

de la publicacioacuten que este orden sea el adecuado El elemento de calidad asociado se

denomina ldquoconsistencia temporalrdquo

Usuario Escolaridad Periodo de Estudio Usuario Escolaridad Periodo de Estudio

Usuario 1 Preescolar 20030101 ndash 20051231 Usuario 1 Preescolar 20030101 ndash 20051231

Usuario 1 Primaria 20030101 ndash 20101231 Usuario 1 Primaria 20060101 ndash 20101231

Usuario 1 Secundaria 20060101 ndash 20163112 Usuario 1 Secundaria 20110101 ndash 20143112

Usuario 1 Media 20150101 - 20163112 Usuario 1 Media 20150101 - 20163112

Recomendacioacuten 7

Si sus datos incluyen alguna ubicacioacuten (direccioacuten lugar coordenadas) verifique que esta

corresponda a la ubicacioacuten real El elemento de calidad asociado se denomina ldquoexactitud

posicionalrdquo

Eventos Deportivos Lugar Eventos Deportivos Lugar

Evento 1 AK 30 25 90 Evento 1 AK 30 25 90

Evento 2 AC 63 215 20 Evento 2 Parque La Florida

Evento 3 Parque Simoacuten Boliacutevar Evento 3 Parque Simoacuten Boliacutevar

Fecha

inconsistente

Fechas no secuenciales

Lugar inexistente

26 Buenas praacutecticas para la publicacioacuten de datos

9 Incorporar el componente geograacutefico en los datos publicados para optimizar su comprensioacuten uso re-uso y visualizacioacuten

El espacio geograacutefico es un punto de la superficie terrestre que se vea afectado o que afecte de

alguna manera a la humanidad19 Este punto de la superficie puede ser la direccioacuten de una

institucioacuten educativa la ubicacioacuten de un centro de vacunacioacuten el lugar donde se miden las

variaciones de traacutensito en la ciudad los parques de Bogotaacute el edificio en donde se llevan a

cabo los traacutemites de una entidad etc

Los datos que usted captura o recolecta en su quehacer misional siempre estaacuten asociados a un

espacio geograacutefico por lo tanto este componente deberiacutea ser incluido en los datos publicados

Tenga en cuenta que el componente geograacutefico lo puede incorporar incluyendo una ubicacioacuten

asociada a una direccioacuten a un lugar a una localidad a un barrio al nombre de un

establecimiento puacuteblicamente reconocido o a cualquier punto que permita al usuario

identificar la localizacioacuten del dato publicado

iquestQueacute logro

Ampliar el espectro de usuarios que consultan utilizan y reutilizan mis datos

Que mis datos sean maacutes interoperables y maacutes procesados

Que mis datos sean puedan compartir en maacutes plataformas

Que los usuarios puedan visualizar mis datos en un mapa

iexclRecomendaciones

Disponga sus datos agregando un atributo de ubicacioacuten como direcciones coordenadas o

lugares geograacuteficos

Ejemplo 1

Incluya direcciones que permitan localizar espacialmente sus datos

Programa Direccioacuten

Registro de atencioacuten a la ciudadaniacutea CL 138 108 16

Centro de autocuidado KR 18 D 77 A 11 SUR

Familias con un nintildeo en cupos cofinanciados CL 70 A SUR 20 46

Centro de autocuidado KR 18 D 73 A 33 SUR

19 httpenciclopediabanrepculturalorgindexphptitle=Espacio_geogrC3A1fico

27 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo 2

Utilice coordenadas para indicar la ubicacioacuten de sus datos

EPS Coordenada X Coordenada Y

EPS Convida 9087496334 1051342164

Capital Salud EPS 986321006 954875808

EPS Famisanar 9742508812 8837031501

Aliansalud EPS 9716943356 9659706891

Salud Total EPS 9215624975 9625189518

Tenga en cuenta que para publicar datos con coordenadas tendraacute que incluir dentro

de su metadato el Sistema de referencia empleado

MAGNA ndash SIRGAS EPSG 4686 httpsepsgio4686

MAGNA ndash SIRGAS EPSG 3116 httpsepsgio3116

MAGNA ndash BOGOTAacute SR-ORG 7458 httpspatialreferenceorgrefsr-org7458

Ejemplo 3

Tambieacuten puede incluir lugares geograacuteficos descriptivos asiacute

Usuario Vacunado Lugar de Vacunacioacuten

Usuario 1 BOSQUE IZQUIERDO

Usuario 2 LAGUNITAS URBANO

Usuario 3 LA CAPUCHINA

Usuario 4 SAN JOSE SUR

Usuario 5 VENECIA

28 Buenas praacutecticas para la publicacioacuten de datos

10 Asignar un identificador uacutenico que permita aumentar la consulta uso e interoperabilidad del dato publicado

Considere un identificador uacutenico como un texto que permite identificar inequiacutevocamente el

dato publicado Si usted va a publicar un dato buscando que este sea reutilizado por los

usuarios y por su propia entidad asignar un identificador facilitaraacute el descubrimiento y la

citacioacuten del dato a traveacutes del tiempo independientemente del estado la disponibilidad o el

formato de este

En la vida cotidiana mediante la ceacutedula de ciudadaniacutea se asigna a cada ciudadano un nuacutemero

de identificacioacuten uacutenico y a traveacutes de este identificador el ciudadano es reconocido a lo largo de

su vida e incluso despueacutes de su muerte por otras personas yo autoridades En el mundo de la

informacioacuten cada dato deberiacutea viajar con un identificador uacutenico que le permita ser encontrado

y reconocido faacutecilmente entre los demaacutes datos

Ahora bien si usted o su entidad publican continuamente datos establecer un sistema de

identificacioacuten comuacuten le permitiraacute identificar raacutepidamente los datos y los haraacute comparables por

cualquier usuario de manera confiable Esta condicioacuten es previa para lograr una correcta

gestioacuten y reutilizacioacuten de sus datos

iquestQueacute logro

Ampliar el espectro de usuarios que consultan utilizan y reutilizan mis datos

Que mis datos sean maacutes interoperables y maacutes procesados

Que mis datos sean compartidos en maacutes plataformas

Que mis datos puedan vincularse a otros datos en el entorno Web

Que mis datos sean encontrados usados y citados inequiacutevocamente

Garantizar y monitorear la reutilizacioacuten de mis datos

Reducir del uso erroacuteneo de mis datos

iexclRecomendaciones

Establezca un sistema de identificacioacuten comuacuten para los datos que va a publicar

Utilice siempre el identificador asignado para publicar sus datos

29 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo

IDECA ha dispuesto el Sistema de Registro de Iacutetems geograacuteficos

httpgeoitemsidecagovcogeoitemsano una herramienta web desarrollada para la

creacioacuten aprobacioacuten publicacioacuten y mantenimiento de iacutetems geograacuteficos que permite la

asignacioacuten concertada de identificadores y significados uacutenicos que contribuyen a la definicioacuten

de un lenguaje comuacuten para el desarrollo de nuevos sistema de informacioacuten en el Distrito

garantizando con ello su fiabilidad e interoperabilidad Adicionalmente permite almacenar

descripciones de la informacioacuten oficial producida e identificar su respectivo custodio jugando

asiacute un papel importante en el control y seguimiento de la produccioacuten de informacioacuten

geograacutefica

Este sistema asigna un identificador uacutenico a cada uno de los iacutetems creados Dentro de los iacutetems

publicados se reconoce el ID 65 como unidad de planeamiento y siempre que se hace

referencia a este objeto es suficiente nombrarlo asiacute para entender que se habla de ldquoUnidades

territoriales de anaacutelisis planeamiento y gestioacuten que tienen como propoacutesito definir y precisar el

planeamiento del suelo urbano de expansioacuten y ruralrdquo

30 Buenas praacutecticas para la publicacioacuten de datos

OBTENGA EL MAacuteS ALTO NIVEL EN PUBLICACIOacuteN DE DATOS

Hasta aquiacute hemos publicado las que consideramos como mejores praacutecticas de publicacioacuten de datos Ahora usted como publicador o como entidad debe evaluar si sus datos se estaacuten disponiendo con los maacutes altos y mejores estaacutendares de publicacioacuten

Lo invitamos a que valide en queacute nivel de publicacioacuten se encuentra su entidad teniendo en cuenta el siguiente listado

Nivel Baacutesico

En este nivel se encuentran aquellas entidades que publican sus datos en formatos estaacutendar y reutilizables (praacutectica 5) que integran a la publicacioacuten sus respectivos metadatos (praacutectica 1) y que acompantildean la publicacioacuten con una licencia asociada (praacutectica 2)

Nivel Intermedio

Este nivel lo alcanzan las entidades que superando el nivel baacutesico disponen un mayor volumen de informacioacuten gracias a que anonimizan sus datos (praacutectica 4) implementan medidas de calidad que aumentan la confianza en sus datos (praacutectica 8) incorporan el componente geograacutefico proporcionando valor agregado a sus datos (praacutectica 9) y publican un diccionario de datos que facilita la interpretacioacuten de los datos publicados (praacutectica 6)

Nivel Avanzado

Las entidades que superando el nivel intermedio utilizan vocabularios estandarizados en sus nuevas publicaciones (praacutectica 3) acompantildean la publicacioacuten de sus datos con enlaces a otros recursos (praacutectica 7) y asignan un identificador uacutenico para dato logrando asiacute aumentar su descubrimiento y reutilizacioacuten (praacutectica 10)

31 Buenas praacutecticas para la publicacioacuten de datos

REFERENCIAS

Bernadette Farias Loacutescio Caroline Burle Newton Calegari W3C Data on the Web Best

Practices 31 de enero de 2017 W3C Recommendation URL httpswwww3orgTRdwbp

Bernadette Hyland Ghislain Auguste Atemezing Boris Villazoacuten-Terrazas W3C Best Practices

for Publishing Linked Data 9 de enero de 2014 W3C Note URL httpswwww3orgTRld-bp

Dan Brickley Libby Miller FOAF project FOAF Vocabulary Specification 099 (Paddington

Edition) 14 de enero de 2014 URL httpxmlnscomfoafspec

Dublin Core metadata initiative DCMI Metadata Terms 14 de junio de 2012 DCMI

Recommendation URL httpdublincoreorgdocumentsdcmi-terms

Fadi Maali John Erickson W3C Data Catalog Vocabulary (DCAT) 16 de enero de 2014 W3C

Recommendation URL httpswwww3orgTRvocab-dcat

ISO 19115-12014 (E) Geographic information ndash Metadata Part1 Fundamentals 01 de abril de

2014 International Standard

ISO 191262009 (E) Geographic information -- Feature concept dictionaries and registers

noviembre de 2009 International Standard

ISO 191572013 (E) Geographic information ndash Data quality 15 de diciembre de 2013

International Standard

Jeremy Tandy Payam Barnaghi Linda van den Brink W3C Spatial Data on the Web Best

Practices 5 de enero 2017 W3C Note URL httpswwww3orgTRsdw-bp

T Berners-Lee R Fielding L Masinter IETF Uniform Resource Identifier (URI) Generic Syntax

Enero de 2005 Internet Standard URL httpstoolsietforghtmlrfc3986

World Wide Web Foundation Open Data Barometer URL httpopendatabarometerorg

W3C OWL Working Group W3C OWL 2 Web Ontology Language Document Overview (Second

Edition) 11 de diciembre de 2012 W3C Recommendation URL httpswwww3orgTRowl2-

overview

W3org Semantic Web - W3C URL httpswwww3orgstandardssemanticweb Consultado

el 12 de septiembre de 2018

Page 2: PARA LA PUBLICACIÓN DE DATOSideca.gov.co/.../files/documentacion/buenaspracticaspublicaciondat… · La obtención de datos la realiza cada entidad en el desarrollo de sus actividades

2 Buenas praacutecticas para la publicacioacuten de datos

Tiacutetulo del documento Buenas praacutecticas para la publicacioacuten de datos

Fecha de actualizacioacuten septiembre de 2018 Web httpwwwidecagovco E-mail idecacatastrobogotagovco Licencia Attribution 40 International (CC BY 40)

Autores Martha Elisabeth Melo Beltraacuten - IDECA

3 Buenas praacutecticas para la publicacioacuten de datos

CONTENIDO

INTRODUCCIOacuteN 4

OBJETIVO 5

AUDIENCIA 5

ALCANCE 5

BUENAS PRAacuteCTICAS PARA LA PUBLICACIOacuteN DE DATOS 6

1 Proporcionar metadatos asociados con los datos publicados Estos metadatos

permitiraacuten conocer las caracteriacutesticas de los datos y deberaacuten ser interpretables tanto por

usuarios como por aplicaciones informaacuteticas 6

2 Proporcionar una licencia en donde se especifiquen las limitaciones yo restricciones

de acceso y uso de los datos 9

3 Utilizar vocabularios estandarizados y reutilizables en la estructuracioacuten y publicacioacuten

tanto de datos 12

4 Anonimizar los datos de caraacutecter personal informacioacuten estadiacutestica informacioacuten

indirectamente identificable e informacioacuten sensible o confidencial 15

5 Publicar los datos en formatos estaacutendar reutilizables y legibles por aplicaciones

informaacuteticas 17

6 Proporcionar un diccionario de datos que facilite el uso e interpretacioacuten de los datos

publicados 19

7 Acompantildear la publicacioacuten de los datos con enlaces a otros recursos 21

8 Depurar sus datos antes de publicarlos para garantizar su calidad y aumentar su

confianza 23

9 Incorporar el componente geograacutefico en los datos publicados para optimizar su

comprensioacuten uso re-uso y visualizacioacuten 26

10 Asignar un identificador uacutenico que permita aumentar la consulta uso e

interoperabilidad del dato publicado 28

OBTENGA EL MAacuteS ALTO NIVEL EN PUBLICACIOacuteN DE DATOS 30

REFERENCIAS 31

4 Buenas praacutecticas para la publicacioacuten de datos

INTRODUCCIOacuteN

La Infraestructura de Datos Espaciales del Distrito Capital - IDECA es el instrumento que

permite a las autoridades del Distrito identificar de manera constante la condicioacuten movilidad

dinaacutemica expansioacuten proceso proyectos y necesidades de la ciudad de Bogotaacute a traveacutes de la

obtencioacuten uso y disposicioacuten de informacioacuten georreferenciada para atender a la ciudadaniacutea y

conseguir la maacutes acertada toma de decisiones en beneficio de la ciudad y de sus habitantes

La obtencioacuten de datos la realiza cada entidad en el desarrollo de sus actividades misionales y el

uso de los datos producidos dependeraacute del propoacutesito del dato de la finalidad especiacutefica del

usuario y de coacutemo y cuando esteacuten disponibles los datos

IDECA gestiona la disposicioacuten de los datos por eso busca que los datos publicados por las

entidades pertenecientes a la Administracioacuten Distrital sin importar la plataforma de publicacioacuten

cuenten con altos estaacutendares de calidad interoperabilidad y documentacioacuten que promuevan y

faciliten el acceso comprensioacuten uso y re-uso de estos por cualquier usuario

Para encontrar y acceder los datos disponibles en el entorno Web los usuarios no

especializados tienen algunas dificultades ya que encuentran contenidos duplicados

desactualizados e inconsistentes lo que ha generado para los publicadores el reto de

garantizar el descubrimiento acceso calidad e interoperabilidad de sus datos

Es importante mencionar que si se publican datos uacutetiles novedosos actualizados y de calidad

no solo aumenta el nuacutemero de usuarios que los reutilicen y distribuyan sino que aumenta la

credibilidad y confianza en los datos Adicionalmente se disminuyen los costos y tiempos en la

generacioacuten de los datos y se reducen los usos indebidos de los mismos

Esta guiacutea pretende que las entidades o responsables de publicar y disponer los datos lo hagan

con altos estaacutendares de calidad debidamente documentados en formatos interoperables y

que satisfagan necesidades reales de los usuarios para que estos uacuteltimos puedan encontrarlos

accederlos comprenderlos y reutilizarlos

IDECA ha plasmado en este documento las mejores praacutecticas de publicacioacuten de datos en la

Web que cubren aspectos como el formato el acceso la calidad los metadatos el

licenciamiento y el origen de los datos

Se invita al lector a navegar faacutecilmente en el documento ya que este presenta sin un orden

determinado las mejores praacutecticas de publicacioacuten de datos explicadas en

iquestQueacute logro Los beneficios que se obtienen al aplicar la buena praacutectica

iexclRecomendaciones Las herramientas baacutesicas para conseguir el objetivo de la buena praacutectica

Ejemplos Utilizando conjuntos de datos reales de las entidades oficiales del Distrito Capital se visualiza la aplicacioacuten de la buena praacutectica

5 Buenas praacutecticas para la publicacioacuten de datos

OBJETIVO

Promover en las entidades de la Administracioacuten Distrital y sus responsables la apropiacioacuten y

adopcioacuten de las mejores praacutecticas de publicacioacuten de datos con el fin de aumentar el valor en la

informacioacuten producida dentro de su quehacer institucional

AUDIENCIA

Este documento estaacute dirigido a las entidades y personas responsables de la Administracioacuten

Distrital que publican o desean publicar datos oficiales de Bogotaacute a traveacutes de cualquier

plataforma de datos

ALCANCE

Las mejores praacutecticas expuestas en este documento estaacuten encaminadas a que los datos

publicados a traveacutes de plataformas oficiales cumplan con unos requisitos miacutenimos de calidad

documentacioacuten interoperabilidad y licenciamiento dentro del proceso de publicacioacuten

Buscamos con esta guiacutea de buenas praacutecticas garantizar la apropiacioacuten de cuatro principios

Que los datos sean descubiertos es decir que cualquier usuario en el entorno Web los

pueda encontrar faacutecilmente

Que los datos sean accesibles quiere decir que no presenten restricciones de acceso ni

que se encuentren cifrados

Que los datos sean interoperables en otras palabras que sean publicados en formatos

estandarizados que permitan ser procesados por cualquier software

Que los datos sean reutilizables es decir que estos sean utilizados en la mayor cantidad

de productos servicios y mercados

Debe tenerse en cuenta que IDECA expone en este documento las mejores praacutecticas de

publicacioacuten de datos identificadas con base a la experiencia adquirida en la disposicioacuten datos

de los uacuteltimos antildeos sin embargo existe una amplia gama de otras buenas praacutecticas de

publicacioacuten que no han sido incluidas en el presente texto y en consecuencia se invita al lector

a apropiarse de las praacutecticas expuestas y a dejar abierta la posibilidad de complementar la

informacioacuten presentada con otras fuentes

6 Buenas praacutecticas para la publicacioacuten de datos

BUENAS PRAacuteCTICAS PARA LA PUBLICACIOacuteN DE DATOS

1 Proporcionar metadatos asociados con los datos publicados Estos metadatos permitiraacuten conocer las caracteriacutesticas de los datos y deberaacuten ser interpretables tanto por usuarios como por aplicaciones informaacuteticas

Un metadato entendido como la informacioacuten acerca de un recurso1 es un dato con muchos

elementos que le permiten al usuario conocer desde la visioacuten del productor las caracteriacutesticas

propias de los datos publicados tales como las fechas de creacioacuten y actualizacioacuten el canal de

acceso la calidad del dato las condiciones de uso quieacuten lo produjo quieacuten lo distribuye etc

esto quiere decir que el metadato explica el dato en eacutel estaacute contenida toda la informacioacuten

relevante del dato

En la vida cotidiana la ceacutedula de ciudadaniacutea es el documento que contiene la informacioacuten

miacutenima de las personas (nombre sexo fecha de nacimiento GS RH estatura lugar de

nacimiento) esta informacioacuten permite que el ciudadano se identifique en cualquier lugar del

territorio nacional ante otras personas o autoridades que requieran conocerlo

Con los datos el tratamiento es similar el dato corresponde a la persona y el metadato

corresponde a la ceacutedula de ciudadaniacutea Asiacute como en Colombia todo ciudadano debe portar su

documento de identificacioacuten en el entorno Web todo dato debe portar su metadato en otras

palabras el metadato es parte integral del dato y existe entre ambos un viacutenculo inseparable

Los datos siempre deberaacuten publicarse con su respectivo metadato este uacuteltimo deberaacute contar

con informacioacuten completa y estandarizada que garantice que los usuarios encuentren

conozcan y utilicen los datos que producimos

Recuerde que la publicacioacuten del metadato es igual de importante que la publicacioacuten del

dato

iquestQueacute logro

Al publicar datos en conjunto con su metadato obtengo

Que mis datos sean encontrados y utilizados por maacutes usuarios Que los usuarios logren una correcta interpretacioacuten de la naturaleza calidad y

distribucioacuten de mis datos

Que mis datos sean entendidos evaluados y retroalimentados por maacutes usuarios

Que mis datos puedan ser compartidos e intercambiados entre sistemas

Que los motores de buacutesqueda encuentren mis datos publicados

Que las aplicaciones informaacuteticas procesen mejor y en mayor cantidad mis datos

1 ISO 19115-12014 410

7 Buenas praacutecticas para la publicacioacuten de datos

iexclRecomendaciones

Disponga metadatos suficientes que permitan a los usuarios tener la informacioacuten

correcta para decidir si el dato publicado satisface o no sus necesidades

Incluya en sus metadatos la ubicacioacuten del dato a traveacutes de la descripcioacuten del lugar

(localidad parque riacuteo etc) o a traveacutes de localizacioacuten por coordenadas geograacuteficas x e

y

Publique sus metadatos como una paacutegina Web HTML (HyperText Markup Language) o

simplemente como un archivo de texto separado

Disponga sus metadatos en el formato baacutesico de intercambio XML (Extensible Markup

Language) o en formatos estaacutendar maacutes sofisticados como JSON (JavaScript Object

Notation)

Al igual que los datos puede publicar los metadatos en muacuteltiples formatos desde la

misma URL

Tenga en cuenta que IDECA a partir de estaacutendares internacionales ha definido los

elementos miacutenimos que debe contener el metadato y que estos pueden ser utilizados

en la publicacioacuten de sus metadatos para facilitar el intercambio de estos

Figura 1 Secciones del Perfil de Metadatos IDECA

Para maacutes informacioacuten consulte la Cartilla para la creacioacuten de metadatos geograacuteficos en

Bogotaacute Distrito Capital

8 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo 1

En la siguiente URL se observa un metadato dispuesto para que los usuarios puedan consultar

faacutecilmente la informacioacuten asociada al dato publicado (Desarrollo Econoacutemico Rural Bogotaacute

DC)

httpmetadatosidecagovcogeoportalcatalogsearchresourcedetailspageuuid=A8AB6E

7A-55FB-40DA-85E1-0AA6B4FE6CE3

Ejemplo 2

En la siguiente URL estaacute disponible el metadato de un nivel de informacioacuten dispuesto por la

Unidad Administrativa Especial de Catastro Distrital ndash UAECD ndash en formato XML (legible por

aplicaciones informaacuteticas

httpmetadatosidecagovcogeoportalrestdocumentid=7BBE5F9AEE-1FBC-4C13-822F-

F2CE44AFDD7E7D

9 Buenas praacutecticas para la publicacioacuten de datos

2 Proporcionar una licencia en donde se especifiquen las limitaciones yo restricciones de acceso y uso de los datos

Una licencia entendida como las condiciones legales bajo las cuales estaacute disponible la obra2 es

un instrumento mediante el cual el propietario del dato autoriza o no a los usuarios para que

accedan a su contenido y tambieacuten lo faculta para su utilizacioacuten Existen diferentes tipos de

licencia para la distribucioacuten y explotacioacuten de obras y cuyo propoacutesito es regular las condiciones

de acceso y uso de los datos

Dependiendo el acceso autorizado a los datos las licencias pueden clasificarse en

Privativas o restrictivas Aquellas licencias conocidas como cerradas o no libres donde la mayoriacutea de las veces solo el autor puede usar la obra o en caso contrario se definen condiciones especiacuteficas que se deben cumplir para hacer uso de la informacioacuten

Semilibres Aquellas licencias que requieren autorizaciones para que los usuarios utilicen copien distribuyan o modifiquen su contenido

Libres o abiertas Aquellas licencias que en teacuterminos generales permiten usar distribuir y compartir los datos con muy pocas restricciones

Cuando un dato se publica acompantildeado de su licencia el usuario conoce las condiciones de

acceso uso y distribucioacuten de los datos que estaacute consumiendo de esta forma se garantiza que

los datos se distribuyan seguacuten los intereses de la entidad que los produce y se minimizan los

usos indebidos de los datos por parte de los usuarios

Ahora bien definir la licencia adecuada para cada dato dependeraacute de las condiciones que

establezca la entidad productora de este Revise los ejemplos y defina la licencia maacutes adecuada

para sus datos

Para maacutes informacioacuten consulte el Instructivo para la definicioacuten de licencias de datos

iquestQueacute logro

Que el usuario evaluacutee si puede o no usar mis datos

Que el usuario conozca las condiciones de acceso uso y manejo sobre los datos

disponibles

Dar claridad y potenciar el uso de los datos disponibles

Que el usuario de los reconocimientos respectivos a la entidad productora de los datos

Que se genere valor agregado sobre los datos disponibles en caso de asignar una

licencia abierta

2 Recuperado de httpsopendefinitionorgod21es

10 Buenas praacutecticas para la publicacioacuten de datos

iexclRecomendaciones

Identifique la licencia que mejor se acomode a su modelo de negocio Recuerde que

mediante la Ley 1712 de 2014 se reguloacute el derecho de acceso a la informacioacuten puacuteblica

y se incluyeron los principios de facilitacioacuten gratuidad y divulgacioacuten proactiva de la

informacioacuten

Disponga una licencia para su conjunto de datos a traveacutes de un enlace una copia

incorporada o dentro del metadato

Prefiera el uso de licencias abiertas de este modo sus datos seraacuten utilizados en una

mayor cantidad de productos servicios y mercados

Ejemplo 1

Mundialmente conocidas las licencias Creative Commons3 tienen como objetivo fortalecer a los

creadores para que sean quienes definan los teacuterminos en que sus obras pueden ser usadas queacute

derechos desean entregar y en queacute condiciones lo haraacuten A continuacioacuten encontraraacute los

enlaces de acceso para conocer las condiciones de cada una de las licencias disponibles

CC0 10 httpscreativecommonsorgpublicdomainzero10deedes

CC BY 40 httpscreativecommonsorglicensesby40

CC BY-SA 40 httpscreativecommonsorglicensesby-sa40

CC BY-ND 40 httpscreativecommonsorglicensesby-nd40

CC BY-NC 40 httpscreativecommonsorglicensesby-nc40

CC BY-NC-SA 40

httpscreativecommonsorglicensesby-nc-sa40

Ejemplo 2

Tambieacuten existen las licencias abiertas para datos Open Data Commons4 proporcionadas por la

mundialmente conocida red Open Knowledge Foundation Network ndash OKFN5 puede consultar

las condiciones ingresando a los siguientes enlaces

ODbL 10 httpsopendatacommonsorglicensesodblsummary

PDDL 10 httpsopendatacommonsorglicensespddlsummary

ODC-BY 10 httpsopendatacommonsorglicensesbysummary

3 httpcreativecommonsorg 4 httpopendatacommonsorg 5 httpsokfnorg

11 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo 3

El Mapa de referencia para Bogotaacute estaacute publicado en

httpswwwidecagovcoesserviciosmapa-de-referencia bajo las condiciones descritas en la

ldquoLICENCIA ABIERTA O CONDICIONES DE USO PARA DATOS ABIERTOS DE LA INFRAESTRUCTURA

INTEGRADA DE DATOS ESPACIALES PARA EL DISTRITO CAPITAL (IDECA)rdquo

httpswwwidecagovcoeslicenciaabierta

12 Buenas praacutecticas para la publicacioacuten de datos

3 Utilizar vocabularios estandarizados y reutilizables en la estructuracioacuten y publicacioacuten de los datos

Un vocabulario define los conceptos y las relaciones que se utilizan para describir y representar

un aacuterea de intereacutes6 Cuando se publican datos en la Web los vocabularios permiten integrar

datos cuando existen ambiguumledades en los teacuterminos utilizados en los diferentes conjuntos de

datos En la praacutectica un vocabulario es un conjunto de palabras que permiten a dos usuarios

comunicarse entre siacute La efectividad de dicha comunicacioacuten radica en que el significado de una

palabra para el usuario emisor sea el mismo que para el usuario receptor independientemente

de si utilizaron el mismo teacutermino

Cuando se habla de interoperabilidad de datos lo que se espera es que tanto los usuarios

como las aplicaciones informaacuteticas entiendan y comprendan la mayor cantidad de informacioacuten

que estaacuten consumiendo Para conseguir esto las comunidades de datos han identificado

vocablos palabras o teacuterminos de uso comuacuten los cuales cuentan con significados apropiados y

que actualmente se encuentran integrados y estructurados en diferentes estaacutendares

internacionales

Se recomienda utilizar vocabularios de este tipo para estandarizar los datos contenidos en la

informacioacuten publicada

iquestQueacute logro

Que mis datos sean consultados utilizados y reutilizados por maacutes usuarios Que se reduzca la ambiguumledad en la interpretacioacuten de mis datos Que mis datos sean interoperables Que mis datos sean procesados en entornos nacionales e internacionales Que mis datos puedan ser compartidos e intercambiados entre sistemas Que mis datos sean maacutes confiables

iexclRecomendaciones

Consulte normas locales o vocabularios internacionales para la estructuracioacuten7 de sus

datos

Apropie los vocabularios consultados y adapte sus datos a estos en los casos en que sea

posible

Incluya vocabularios ya definidos y reconocidos internacionalmente cuando vaya a

producir nuevos datos

6 httpswwww3orgstandardssemanticwebontology 7 Estructurar significa ajustar los datos a un esquema fijo

13 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo 1

A continuacioacuten se presentan algunos vocabularios internacionales que puede consultar y

apropiar para optimizar el intercambio de sus datos

Data Catalog Vocabulary (DCAT) httpswwww3orgTRvocab-dcatclass-catalog

FOAF Vocabulary Specification httpxmlnscomfoaf01

ISOTC 211 Geographic informationGeomatics Terminology

httpwwwisotc211orgTerminologyhtm

The RDF Data Cube Vocabulary httpswwww3orgTR2014REC-vocab-data-cube-20140116

ODRL Vocabulary amp Expression 22

httpswwww3orgTR2018REC-odrl-vocab-20180215

HTTP Vocabulary in RDF 10 httpswwww3orgTR2017NOTE-HTTP-in-RDF10-20170202

vCard Ontology - for describing People and Organizations

httpswwww3orgTRvcard-rdf

Ejemplo 2

En el contexto Nacional el Ministerio de Tecnologiacuteas de la Informacioacuten y las Comunicaciones ha

establecido el Lenguaje Comuacuten de Intercambio de como un instrumento de consulta que

contiene la definicioacuten de los elementos de datos conceptualizados por las entidades del

estado La consulta la puede realizar en httplenguajeminticgovco

14 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo 3

La especificacioacuten vCard disponible en httpswwww3orgTRvcard-rdf promueve un

vocabulario especiacutefico para describir personas y organizaciones

Uno de los vocablos que describe esta especificacioacuten es la ldquodireccioacuten de entregardquo llamado

dentro del vocabulario como ADR y definido como ldquola direccioacuten del objeto representado en

partes estructuradasrdquo

Ahora bien este vocabulario especifica los componentes de la direccioacuten de entrega para el

objeto asiacute el nombre del paiacutes la localidad el coacutedigo postal la regioacuten y la direccioacuten dada por

viacuteas (calles y carreras en el caso colombiano) Esto quiere decir que cualquiera de los

componentes descritos puede usarse como direccioacuten de entrega vaacutelida ya que son equivalentes

entre siacute

Aunque en el vocabulario la direccioacuten de entrega se llame ADR el usuario de la informacioacuten

entenderaacute que un nombre de paiacutes o un coacutedigo postal pueden interpretarse como ADR

15 Buenas praacutecticas para la publicacioacuten de datos

4 Anonimizar los datos de caraacutecter personal informacioacuten estadiacutestica informacioacuten indirectamente identificable e informacioacuten sensible o confidencial

Anonimizar es el proceso que impide la identificacioacuten de las unidades de estudio que son fuente

para los registros individuales de un conjunto8 de datos o maacutes claro es la aplicacioacuten de teacutecnicas

que permitan expresar un dato relativo a personas eliminando la referencia a su identidad9

Baacutesicamente lo que se busca es reducir los riesgos en el uso y procesamiento de datos

personales evitar la extraccioacuten de registros que identifican a una persona reducir la

combinacioacuten de dos o maacutes registros en una o varias bases de datos para identificar a una

persona y minimizar la deduccioacuten de datos personales partir de uno o varios datos publicados

iquestQueacute informacioacuten debo prioritariamente anonimizar

Datos personales Informacioacuten numeacuterica alfabeacutetica graacutefica fotograacutefica acuacutestica o

cualquier otro tipo susceptible de recogida registro tratamiento y transmisioacuten

concerniente a personas fiacutesicas identificadas o identificables (tales como nombre

apellidos estado civil sexo edad domicilio identificacioacuten personal nuacutemero de

teleacutefono etc)10

Informacioacuten sensible Informacioacuten considerada como estrictamente confidencial

Informacioacuten y caracteriacutesticas referentes a la edad procedencia salud raza religioacuten

ideologiacutea afiliacioacuten finanzas etc se consideran de caraacutecter sensible y requieren de

una proteccioacuten especial11

iquestQueacute logro

Garantizar que mis datos publicados cuentan con medidas de proteccioacuten de datos

personales

Eliminar de manera efectiva el riesgo de re-identificacioacuten

Evitar que el procesamiento de mis datos tenga consecuencias negativas para alguna

persona

Disponer muchos maacutes datos sin invadir la informacioacuten personal

iexclRecomendaciones

Implemente actividades de proteccioacuten de la privacidad de los datos personales antes

de publicarlos

Elimine cualquier identificador directo de la persona (nombre documento de

identidad etc)

8 httpswwwdanegovcofilessenlineamientosDSO_020_LIN_08pdf 9 httpdleraeesid=2jjMiRi 10 httpswwwdanegovcofilessenlineamientosDSO_020_LIN_08pdf 11 Ibidem

16 Buenas praacutecticas para la publicacioacuten de datos

Reemplace los identificadores directos por coacutedigos de referencia pseudoacutenimos

(algoritmos AES12 o un hash cifrado HMAC13) coacutedigos arbitrarios o aleatorios

Si reemplazando el identificador directo auacuten es faacutecil identificar a la persona elimine el

dato

Clasifique yo categorice los datos

Redondee los datos numeacutericos hacia arriba o hacia abajo

Evaluacutee antes durante y despueacutes de publicados los datos si la anonimizacioacuten de sus

datos es suficiente y evaluacutee regularmente los riesgos existentes

Para maacutes informacioacuten consulte los Lineamientos para la Anonimizacioacuten de micro datos

Ejemplo 1

Antes de publicar sus datos retire el identificador directo de la persona En este caso

reemplace en nuacutemero de documento que identifica al usuario y reemplaacutecelo por un

consecutivo

Usuario Beneficio Usuario Beneficio

80123456 Subsidio de vivienda Usuario 1 Subsidio de vivienda

51123456 Subsidio de alimentacioacuten Usuario 2 Subsidio de alimentacioacuten

19123456 Subsidio al adulto mayor Usuario 3 Subsidio al adulto mayor

53123456 Subsidio de desempleo Usuario 4 Subsidio de desempleo

Ejemplo 2

Clasifique o categorice sus datos En este ejemplo asigne rangos a la edad de manera tal que el

titular del registro no sea identificable por este dato

Usuario Edad Usuario Rango de edad

Usuario 1 11 antildeos Usuario 1 Entre 10 y 15 antildeos

Usuario 2 22 antildeos Usuario 2 Entre 20 y 25 antildeos

Usuario 3 36 antildeos Usuario 3 Entre 35 y 40 antildeos

Usuario 4 63 antildeos Usuario 4 Entre 60 y 65 antildeos

12 Advanced Encryption Standard puede consultar como ha sido implementado este algoritmo en httpsrevistasudistritaleducoojsindexphpTecnuraarticleview72368892 13 Hash-based Message Authentication Code puede consultar como se crea este cifrado en httpsdocsoraclecomcdE19253-01819-7804wanboottasks2-51indexhtml

17 Buenas praacutecticas para la publicacioacuten de datos

5 Publicar los datos en formatos estaacutendar reutilizables y legibles por aplicaciones informaacuteticas

Un formato puede ser definido como la estructura de un disco dividido en campos y pistas

seguacuten un determinado sistema operativo lo que permite almacenar en eacutel informacioacuten14

baacutesicamente es la forma en que se codifican los datos en un archivo informaacutetico

Actualmente conocemos formatos comunes de almacenamiento como el doc una extensioacuten

de Word que almacena texto y cuyo propietario es la compantildeiacutea Microsoft Pero iquestqueacute pasa si un

usuario quiere abrir un documento doc en un procesador de texto diferente a Word

difiacutecilmente va a poder conocer el contenido de dicho documento sin tener esta licencia

Lo que queremos lograr con la implementacioacuten de esta praacutectica es que todos los usuarios que

encuentren mis datos puedan accederlos sin necesidad de contar con un software o aplicacioacuten

informaacutetica especiacutefica

iquestQueacute logro

Que mis datos sean consultados utilizados y reutilizados por maacutes usuarios

Que mis datos sean maacutes interoperables y maacutes procesados

Que mis datos puedan ser extraiacutedos transformados y procesados por aplicaciones

informaacuteticas

Que mis datos puedan ser compartidos e intercambiados entre sistemas

Disminuir los costos y los tiempos en el uso y la transformacioacuten de mis datos

iexclRecomendaciones

Prefiera publicar su conjunto de datos en formatos abiertos o no propietario ya que

estos facilitan el uso re-uso y distribucioacuten de estos Se busca que un mayor nuacutemero de

aplicaciones informaacuteticas pueda extraer leer y transformar los datos generando mayor

uso y re-uso por los usuarios

Disponga sus datos en muacuteltiples formatos con el fin de incrementar el acceso a los

mismos Se busca que el mayor nuacutemero de usuarios pueda utilizar los datos sin tener

que transformarlos primero en su formato preferido

Utilice Web Services para mejorar el intercambio e interoperabilidad de los datos

publicados

14 httpdleraeessrvsearchm=30ampw=formato

18 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo 1

A continuacioacuten encontraraacute extensiones de formato propietario y no propietario prefiera para

la publicacioacuten de sus datos las extensiones de la derecha

FORMATO PROPIETARIO FORMATO NO PROPIETARIO

DOC GDB TXT ASCII Grid KML RDF

XLS DWG CSV GeoJSON DXF XML

PPT SHP JSON GML ODF

Ejemplo 2

Si no fue posible utilizar una extensioacuten de formato no propietario publique sus datos en una

variedad de formatos que le permita al usuario acceder a los datos desde diferentes

aplicaciones informaacuteticas

Ejemplo 3

Para publicar sus datos conozca diferentes tipos de Web Services que viajan en la red utilizando extensiones XML

SOAP httpswwww3orgTRsoap

REST httprestelksteinorg

WMS httpwwwopengeospatialorgstandardswms

WFS httpwwwopengeospatialorgstandardswfs

WCS httpwwwopengeospatialorgstandardswcs

19 Buenas praacutecticas para la publicacioacuten de datos

6 Proporcionar un diccionario de datos que facilite el uso e interpretacioacuten de los datos publicados

Un diccionario estaacute definido como un repertorio en forma de libro o en soporte electroacutenico en el

que se recogen seguacuten un orden determinado las palabras o expresiones de una o maacutes lenguas

o de una materia concreta acompantildeadas de su definicioacuten equivalencia o explicacioacuten15

especiacuteficamente en un diccionario de datos se encuentran los conceptos de los datos y sus

propiedades (atributos dominios asociaciones y operaciones) acompantildeados de una definicioacuten

en donde se identifica el propoacutesito alcance y campo de aplicacioacuten del dato publicado

Lograr que los usuarios de mis datos entiendan la informacioacuten que estaacute publicada le permitiraacute

decidir si satisfacen o no su necesidad y le facilitaraacute la decisioacuten para explotar lo datos

Para maacutes informacioacuten consulte el Instructivo Diccionario de Datos

iquestQueacute logro

Que mis datos sean consultados utilizados y reutilizados por maacutes usuarios

Que se eviten ambiguumledades en la interpretacioacuten de mis datos

Que mis datos publicados esteacuten unificados y consistentes

Que los usuarios comprendan mejor y dispongan de claridad sobre los conceptos de

mis datos

iexclRecomendaciones

Publique como miacutenimo un diccionario de datos que contenga la caracterizacioacuten del

conjunto de datos producidos por su entidad

Cree el diccionario de datos teniendo en cuenta como miacutenimo la siguiente informacioacuten

Nombre del atributo Nombre que identifica de manera clara un atributo

Definicioacuten Descripcioacuten del atributo

Tipo de dato Tipo de valor del atributo

Unidad de medida Expresa la unidad de medida del atributo

Dominio Determina si el atributo tiene asociado un dominio

15 httpdleraeesw=diccionario

20 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo

Para el conjunto de datos ldquoEstablecimientos Educativos en Bogotaacuterdquo publicariacuteamos un

diccionario de datos similar al siguiente

Nombre del atributo Definicioacuten Tipo de dato

Unidad de Medida

Dominio

Coacutedigo del establecimiento

Coacutedigo DANE asignado al Institucioacuten Educativa Decimal

Nombre del establecimiento

Nombre de la Institucioacuten Educativa Cadena de Caracteres

Aacuterea construida del establecimiento

Aacuterea construida de la Institucioacuten Educativa Decimal Metros

cuadrados

Sector

Clasificacioacuten asignada seguacuten la naturaleza juriacutedica la cual define las principales caracteriacutesticas que desde lo juriacutedico - administrativo y tiene que ver con el origen de su creacioacuten

Entero

EESector

No podriacuteamos olvidar detallar el dominio asociado

Atributo Nombre del Dominio Coacutedigo Definicioacuten

EESector

Oficial 1

Es una institucioacuten donde su naturaleza de servicio puacuteblico cultural y su funcioacuten social le es inherente cumpliendo con las disposiciones legales y estatutarias que las rigen donde sus rentas se conservan y se aplican debidamente

Privado 2

Es una institucioacuten constituida como persona juriacutedica de utilidad comuacuten donde sus rentas se conservan y se aplican debidamente y que en todo lo esencial se cumple con la voluntad de sus fundadores

21 Buenas praacutecticas para la publicacioacuten de datos

7 Acompantildear la publicacioacuten de los datos con enlaces a otros recursos

Un enlace es definido como una secuencia de caracteres que se utiliza como direccioacuten para

acceder a informacioacuten adicional16 maacutes sencillo puede definirse como una expresioacuten que

conecta una cierta informacioacuten con otra17Ahora bien un recurso se puede entender como

cualquier medio que satisfaga una necesidad por ejemplo datos servicios documentos o

software

En teacuterminos generales se sugiere que para facilitar al usuario la comprensioacuten de los datos

publicados se proporcionen recursos o documentos adicionales que puedan ser consultados

yo descargados traveacutes de enlaces o links de otro sitio Web

Dentro de los recursos adicionales que pueden publicarse para acompantildear el dato estaacuten los

procedimientos de captura del dato los cataacutelogos de objetos las especificaciones teacutecnicas los

documentos normativos los cataacutelogos de simbologiacutea los reportes de evaluacioacuten de calidad

entre otros

iquestQueacute logro

Mejorar la consulta utilizacioacuten y reutilizacioacuten de mis datos

Que los usuarios comprendan mejor mis datos

Que mis datos sean compartidos e intercambiados por un mayor nuacutemero de usuarios

iexclRecomendaciones

Disponga informacioacuten adicional de sus datos que le permita a los usuarios ampliar el

horizonte de las aplicaciones y funcionalidades en las que pueda utilizar y explotar del

dato

No olvide vincular o registrar esta informacioacuten en el metadato

16 httpdleraeesid=FTVRKyj 17 httpssistemascomenlacephp

22 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo 1

El ldquoMapa de Referencia para Bogotaacuterdquo publicado en httpswwwidecagovcoesserviciosmapa-de-referencia tiene publicados varios enlaces a otros recursos

Especificacioacuten teacutecnica para la elaboracioacuten del Mapa de Referencia para Bogotaacute DC V0318

Cataacutelogo de Objetos del Mapa de Referencia de Bogotaacute DC V 57

Cataacutelogo de Representacioacuten del Mapa de Referencia de Bogotaacute DC V30

Reporte de evaluacioacuten de calidad generado al Mapa de Referencia del Distrito Capital V1217

Ejemplo 2

La informacioacuten de los ldquohumedales de Bogotaacuterdquo publicada en

httpambientebogotagovcowebsdahumedales tiene publicados enlaces a otros recursos

o Gestioacuten de los humedales

o Poliacutetica de Humedales del Distrito Capital

o Normatividad

o Planes de Manejo Ambiental

o Comiteacute distrital de humedales documentos de consulta normatividad

23 Buenas praacutecticas para la publicacioacuten de datos

8 Depurar sus datos antes de publicarlos para garantizar su calidad y aumentar su confianza

La calidad estaacute definida como el conjunto de propiedades inherentes a algo que permiten

juzgar su valor18 para el caso que nos concierne este algo hace referencia al dato publicado

Ahora bien la calidad tambieacuten es entendida como la capacidad del dato publicado para

satisfacer los requerimientos y las necesidades de los usuarios respetando una serie de normas

y especificaciones establecidas

Actualmente existen muacuteltiples elementos de calidad de los datos que identifican las cualidades

de estos sin embargo en este aparte citaremos los elementos principales que usted o su

entidad deben tener en cuenta para publicar sus datos con un estaacutendar miacutenimo de calidad

Para maacutes informacioacuten consulte el Procedimiento para evaluar y reportar la calidad de

los datos espaciales

iquestQueacute logro

Que mis datos sean consultados utilizados y reutilizados por maacutes usuarios

Que los usuarios hablen bien de mis datos

Que mis datos sean maacutes interoperables y maacutes procesados

Que mis datos sean maacutes compartidos

Que mis datos sean maacutes confiables

Recomendacioacuten 1

Establezca si dentro de su conjunto de datos existen capos vaciacuteos o nulos con informacioacuten

descontextualizada sobrante o duplicada Si existen compleacutetelos o elimiacutenelos seguacuten

corresponda antes de la publicacioacuten El elemento de calidad asociado se denomina ldquototalidadrdquo

Localidad Atendidos Localidad Atendidos

Suba 200 Suba 200

Suba 200 Tunjuelito 500

Ameacutericas 100

850

Tunjuelito 500

18 httpdleraeesid=6nVpk8P|6nXVL1Z

Campo duplicado

Campo inconsistente

Campo vaciacuteo

24 Buenas praacutecticas para la publicacioacuten de datos

Recomendacioacuten 2

Identifique y transforme si es necesario los datos que hayan sido registrados en un formato

diferente al establecido para su conjunto de datos Es decir estandarice el formato de salida

del dato que va a publicar El elemento de calidad asociado se denomina ldquoconsistencia de

formatordquo

Localidad Atendidos Localidad Atendidos

Suba 200 Suba 200

Tunjuelito 5008 Tunjuelito 500

Fontiboacuten 40 Fontiboacuten 430

Tunjuelito 500 Tunjuelito 500

Recomendacioacuten 3

Si sus datos tienen alguacuten tipo de clasificacioacuten o rangos previo a la publicacioacuten valide que estos

se hayan registrado correctamente El elemento de calidad asociado se denomina ldquoexactitud de

clasificacioacutenrdquo

Geacutenero Edad Rango de Edad Geacutenero Edad Rango de Edad

Femenino 5 0 lt Edad le 10 Femenino 5 0 lt Edad le 10

Masculino 15 0 lt Edad le 10 Masculino 15 10 lt Edad le 20

Femenino 35 40 lt Edad le 50 Femenino 35 30 lt Edad le 40

Recomendacioacuten 4

Si sus datos representan atributos cuantitativos verifique antes de la publicacioacuten que estos

correspondan a valores conocidos como verdaderos El elemento de calidad asociado se

denomina ldquoexactitud de atributos cuantitativosrdquo

Localidad Mes Temperatura Localidad Mes Temperatura

Chapinero Enero 7degC Chapinero Enero 7degC

Suba Agosto -15degC Suba Agosto 15degC

Tunjuelito Abril 60degC Tunjuelito Abril 16degC

Clasificacioacuten inconsistente

Formato inconsistente

Valor inconsistente

25 Buenas praacutecticas para la publicacioacuten de datos

Recomendacioacuten 5

Si los datos a publicar tienen asociadas fechas de captura o recoleccioacuten de informacioacuten (Por

ejemplo registro de incidentes registro de vacunacioacuten conteo de vehiacuteculos etc) valide que

las fechas registradas coincidan con la fecha del evento capturado El elemento de calidad

asociado se denomina ldquoexactitud de la medicioacuten del tiempordquo

Precipitacioacuten (mm) Fecha de registro Precipitacioacuten (mm) Fecha de registro

00 20580101 00 20180101

01 20180102 01 20180102

126 20510403 126 20180103

20 20180104 20 20180104

Recomendacioacuten 6

Cuando sus datos reflejen informacioacuten determinada por un orden de eventos garantice antes

de la publicacioacuten que este orden sea el adecuado El elemento de calidad asociado se

denomina ldquoconsistencia temporalrdquo

Usuario Escolaridad Periodo de Estudio Usuario Escolaridad Periodo de Estudio

Usuario 1 Preescolar 20030101 ndash 20051231 Usuario 1 Preescolar 20030101 ndash 20051231

Usuario 1 Primaria 20030101 ndash 20101231 Usuario 1 Primaria 20060101 ndash 20101231

Usuario 1 Secundaria 20060101 ndash 20163112 Usuario 1 Secundaria 20110101 ndash 20143112

Usuario 1 Media 20150101 - 20163112 Usuario 1 Media 20150101 - 20163112

Recomendacioacuten 7

Si sus datos incluyen alguna ubicacioacuten (direccioacuten lugar coordenadas) verifique que esta

corresponda a la ubicacioacuten real El elemento de calidad asociado se denomina ldquoexactitud

posicionalrdquo

Eventos Deportivos Lugar Eventos Deportivos Lugar

Evento 1 AK 30 25 90 Evento 1 AK 30 25 90

Evento 2 AC 63 215 20 Evento 2 Parque La Florida

Evento 3 Parque Simoacuten Boliacutevar Evento 3 Parque Simoacuten Boliacutevar

Fecha

inconsistente

Fechas no secuenciales

Lugar inexistente

26 Buenas praacutecticas para la publicacioacuten de datos

9 Incorporar el componente geograacutefico en los datos publicados para optimizar su comprensioacuten uso re-uso y visualizacioacuten

El espacio geograacutefico es un punto de la superficie terrestre que se vea afectado o que afecte de

alguna manera a la humanidad19 Este punto de la superficie puede ser la direccioacuten de una

institucioacuten educativa la ubicacioacuten de un centro de vacunacioacuten el lugar donde se miden las

variaciones de traacutensito en la ciudad los parques de Bogotaacute el edificio en donde se llevan a

cabo los traacutemites de una entidad etc

Los datos que usted captura o recolecta en su quehacer misional siempre estaacuten asociados a un

espacio geograacutefico por lo tanto este componente deberiacutea ser incluido en los datos publicados

Tenga en cuenta que el componente geograacutefico lo puede incorporar incluyendo una ubicacioacuten

asociada a una direccioacuten a un lugar a una localidad a un barrio al nombre de un

establecimiento puacuteblicamente reconocido o a cualquier punto que permita al usuario

identificar la localizacioacuten del dato publicado

iquestQueacute logro

Ampliar el espectro de usuarios que consultan utilizan y reutilizan mis datos

Que mis datos sean maacutes interoperables y maacutes procesados

Que mis datos sean puedan compartir en maacutes plataformas

Que los usuarios puedan visualizar mis datos en un mapa

iexclRecomendaciones

Disponga sus datos agregando un atributo de ubicacioacuten como direcciones coordenadas o

lugares geograacuteficos

Ejemplo 1

Incluya direcciones que permitan localizar espacialmente sus datos

Programa Direccioacuten

Registro de atencioacuten a la ciudadaniacutea CL 138 108 16

Centro de autocuidado KR 18 D 77 A 11 SUR

Familias con un nintildeo en cupos cofinanciados CL 70 A SUR 20 46

Centro de autocuidado KR 18 D 73 A 33 SUR

19 httpenciclopediabanrepculturalorgindexphptitle=Espacio_geogrC3A1fico

27 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo 2

Utilice coordenadas para indicar la ubicacioacuten de sus datos

EPS Coordenada X Coordenada Y

EPS Convida 9087496334 1051342164

Capital Salud EPS 986321006 954875808

EPS Famisanar 9742508812 8837031501

Aliansalud EPS 9716943356 9659706891

Salud Total EPS 9215624975 9625189518

Tenga en cuenta que para publicar datos con coordenadas tendraacute que incluir dentro

de su metadato el Sistema de referencia empleado

MAGNA ndash SIRGAS EPSG 4686 httpsepsgio4686

MAGNA ndash SIRGAS EPSG 3116 httpsepsgio3116

MAGNA ndash BOGOTAacute SR-ORG 7458 httpspatialreferenceorgrefsr-org7458

Ejemplo 3

Tambieacuten puede incluir lugares geograacuteficos descriptivos asiacute

Usuario Vacunado Lugar de Vacunacioacuten

Usuario 1 BOSQUE IZQUIERDO

Usuario 2 LAGUNITAS URBANO

Usuario 3 LA CAPUCHINA

Usuario 4 SAN JOSE SUR

Usuario 5 VENECIA

28 Buenas praacutecticas para la publicacioacuten de datos

10 Asignar un identificador uacutenico que permita aumentar la consulta uso e interoperabilidad del dato publicado

Considere un identificador uacutenico como un texto que permite identificar inequiacutevocamente el

dato publicado Si usted va a publicar un dato buscando que este sea reutilizado por los

usuarios y por su propia entidad asignar un identificador facilitaraacute el descubrimiento y la

citacioacuten del dato a traveacutes del tiempo independientemente del estado la disponibilidad o el

formato de este

En la vida cotidiana mediante la ceacutedula de ciudadaniacutea se asigna a cada ciudadano un nuacutemero

de identificacioacuten uacutenico y a traveacutes de este identificador el ciudadano es reconocido a lo largo de

su vida e incluso despueacutes de su muerte por otras personas yo autoridades En el mundo de la

informacioacuten cada dato deberiacutea viajar con un identificador uacutenico que le permita ser encontrado

y reconocido faacutecilmente entre los demaacutes datos

Ahora bien si usted o su entidad publican continuamente datos establecer un sistema de

identificacioacuten comuacuten le permitiraacute identificar raacutepidamente los datos y los haraacute comparables por

cualquier usuario de manera confiable Esta condicioacuten es previa para lograr una correcta

gestioacuten y reutilizacioacuten de sus datos

iquestQueacute logro

Ampliar el espectro de usuarios que consultan utilizan y reutilizan mis datos

Que mis datos sean maacutes interoperables y maacutes procesados

Que mis datos sean compartidos en maacutes plataformas

Que mis datos puedan vincularse a otros datos en el entorno Web

Que mis datos sean encontrados usados y citados inequiacutevocamente

Garantizar y monitorear la reutilizacioacuten de mis datos

Reducir del uso erroacuteneo de mis datos

iexclRecomendaciones

Establezca un sistema de identificacioacuten comuacuten para los datos que va a publicar

Utilice siempre el identificador asignado para publicar sus datos

29 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo

IDECA ha dispuesto el Sistema de Registro de Iacutetems geograacuteficos

httpgeoitemsidecagovcogeoitemsano una herramienta web desarrollada para la

creacioacuten aprobacioacuten publicacioacuten y mantenimiento de iacutetems geograacuteficos que permite la

asignacioacuten concertada de identificadores y significados uacutenicos que contribuyen a la definicioacuten

de un lenguaje comuacuten para el desarrollo de nuevos sistema de informacioacuten en el Distrito

garantizando con ello su fiabilidad e interoperabilidad Adicionalmente permite almacenar

descripciones de la informacioacuten oficial producida e identificar su respectivo custodio jugando

asiacute un papel importante en el control y seguimiento de la produccioacuten de informacioacuten

geograacutefica

Este sistema asigna un identificador uacutenico a cada uno de los iacutetems creados Dentro de los iacutetems

publicados se reconoce el ID 65 como unidad de planeamiento y siempre que se hace

referencia a este objeto es suficiente nombrarlo asiacute para entender que se habla de ldquoUnidades

territoriales de anaacutelisis planeamiento y gestioacuten que tienen como propoacutesito definir y precisar el

planeamiento del suelo urbano de expansioacuten y ruralrdquo

30 Buenas praacutecticas para la publicacioacuten de datos

OBTENGA EL MAacuteS ALTO NIVEL EN PUBLICACIOacuteN DE DATOS

Hasta aquiacute hemos publicado las que consideramos como mejores praacutecticas de publicacioacuten de datos Ahora usted como publicador o como entidad debe evaluar si sus datos se estaacuten disponiendo con los maacutes altos y mejores estaacutendares de publicacioacuten

Lo invitamos a que valide en queacute nivel de publicacioacuten se encuentra su entidad teniendo en cuenta el siguiente listado

Nivel Baacutesico

En este nivel se encuentran aquellas entidades que publican sus datos en formatos estaacutendar y reutilizables (praacutectica 5) que integran a la publicacioacuten sus respectivos metadatos (praacutectica 1) y que acompantildean la publicacioacuten con una licencia asociada (praacutectica 2)

Nivel Intermedio

Este nivel lo alcanzan las entidades que superando el nivel baacutesico disponen un mayor volumen de informacioacuten gracias a que anonimizan sus datos (praacutectica 4) implementan medidas de calidad que aumentan la confianza en sus datos (praacutectica 8) incorporan el componente geograacutefico proporcionando valor agregado a sus datos (praacutectica 9) y publican un diccionario de datos que facilita la interpretacioacuten de los datos publicados (praacutectica 6)

Nivel Avanzado

Las entidades que superando el nivel intermedio utilizan vocabularios estandarizados en sus nuevas publicaciones (praacutectica 3) acompantildean la publicacioacuten de sus datos con enlaces a otros recursos (praacutectica 7) y asignan un identificador uacutenico para dato logrando asiacute aumentar su descubrimiento y reutilizacioacuten (praacutectica 10)

31 Buenas praacutecticas para la publicacioacuten de datos

REFERENCIAS

Bernadette Farias Loacutescio Caroline Burle Newton Calegari W3C Data on the Web Best

Practices 31 de enero de 2017 W3C Recommendation URL httpswwww3orgTRdwbp

Bernadette Hyland Ghislain Auguste Atemezing Boris Villazoacuten-Terrazas W3C Best Practices

for Publishing Linked Data 9 de enero de 2014 W3C Note URL httpswwww3orgTRld-bp

Dan Brickley Libby Miller FOAF project FOAF Vocabulary Specification 099 (Paddington

Edition) 14 de enero de 2014 URL httpxmlnscomfoafspec

Dublin Core metadata initiative DCMI Metadata Terms 14 de junio de 2012 DCMI

Recommendation URL httpdublincoreorgdocumentsdcmi-terms

Fadi Maali John Erickson W3C Data Catalog Vocabulary (DCAT) 16 de enero de 2014 W3C

Recommendation URL httpswwww3orgTRvocab-dcat

ISO 19115-12014 (E) Geographic information ndash Metadata Part1 Fundamentals 01 de abril de

2014 International Standard

ISO 191262009 (E) Geographic information -- Feature concept dictionaries and registers

noviembre de 2009 International Standard

ISO 191572013 (E) Geographic information ndash Data quality 15 de diciembre de 2013

International Standard

Jeremy Tandy Payam Barnaghi Linda van den Brink W3C Spatial Data on the Web Best

Practices 5 de enero 2017 W3C Note URL httpswwww3orgTRsdw-bp

T Berners-Lee R Fielding L Masinter IETF Uniform Resource Identifier (URI) Generic Syntax

Enero de 2005 Internet Standard URL httpstoolsietforghtmlrfc3986

World Wide Web Foundation Open Data Barometer URL httpopendatabarometerorg

W3C OWL Working Group W3C OWL 2 Web Ontology Language Document Overview (Second

Edition) 11 de diciembre de 2012 W3C Recommendation URL httpswwww3orgTRowl2-

overview

W3org Semantic Web - W3C URL httpswwww3orgstandardssemanticweb Consultado

el 12 de septiembre de 2018

Page 3: PARA LA PUBLICACIÓN DE DATOSideca.gov.co/.../files/documentacion/buenaspracticaspublicaciondat… · La obtención de datos la realiza cada entidad en el desarrollo de sus actividades

3 Buenas praacutecticas para la publicacioacuten de datos

CONTENIDO

INTRODUCCIOacuteN 4

OBJETIVO 5

AUDIENCIA 5

ALCANCE 5

BUENAS PRAacuteCTICAS PARA LA PUBLICACIOacuteN DE DATOS 6

1 Proporcionar metadatos asociados con los datos publicados Estos metadatos

permitiraacuten conocer las caracteriacutesticas de los datos y deberaacuten ser interpretables tanto por

usuarios como por aplicaciones informaacuteticas 6

2 Proporcionar una licencia en donde se especifiquen las limitaciones yo restricciones

de acceso y uso de los datos 9

3 Utilizar vocabularios estandarizados y reutilizables en la estructuracioacuten y publicacioacuten

tanto de datos 12

4 Anonimizar los datos de caraacutecter personal informacioacuten estadiacutestica informacioacuten

indirectamente identificable e informacioacuten sensible o confidencial 15

5 Publicar los datos en formatos estaacutendar reutilizables y legibles por aplicaciones

informaacuteticas 17

6 Proporcionar un diccionario de datos que facilite el uso e interpretacioacuten de los datos

publicados 19

7 Acompantildear la publicacioacuten de los datos con enlaces a otros recursos 21

8 Depurar sus datos antes de publicarlos para garantizar su calidad y aumentar su

confianza 23

9 Incorporar el componente geograacutefico en los datos publicados para optimizar su

comprensioacuten uso re-uso y visualizacioacuten 26

10 Asignar un identificador uacutenico que permita aumentar la consulta uso e

interoperabilidad del dato publicado 28

OBTENGA EL MAacuteS ALTO NIVEL EN PUBLICACIOacuteN DE DATOS 30

REFERENCIAS 31

4 Buenas praacutecticas para la publicacioacuten de datos

INTRODUCCIOacuteN

La Infraestructura de Datos Espaciales del Distrito Capital - IDECA es el instrumento que

permite a las autoridades del Distrito identificar de manera constante la condicioacuten movilidad

dinaacutemica expansioacuten proceso proyectos y necesidades de la ciudad de Bogotaacute a traveacutes de la

obtencioacuten uso y disposicioacuten de informacioacuten georreferenciada para atender a la ciudadaniacutea y

conseguir la maacutes acertada toma de decisiones en beneficio de la ciudad y de sus habitantes

La obtencioacuten de datos la realiza cada entidad en el desarrollo de sus actividades misionales y el

uso de los datos producidos dependeraacute del propoacutesito del dato de la finalidad especiacutefica del

usuario y de coacutemo y cuando esteacuten disponibles los datos

IDECA gestiona la disposicioacuten de los datos por eso busca que los datos publicados por las

entidades pertenecientes a la Administracioacuten Distrital sin importar la plataforma de publicacioacuten

cuenten con altos estaacutendares de calidad interoperabilidad y documentacioacuten que promuevan y

faciliten el acceso comprensioacuten uso y re-uso de estos por cualquier usuario

Para encontrar y acceder los datos disponibles en el entorno Web los usuarios no

especializados tienen algunas dificultades ya que encuentran contenidos duplicados

desactualizados e inconsistentes lo que ha generado para los publicadores el reto de

garantizar el descubrimiento acceso calidad e interoperabilidad de sus datos

Es importante mencionar que si se publican datos uacutetiles novedosos actualizados y de calidad

no solo aumenta el nuacutemero de usuarios que los reutilicen y distribuyan sino que aumenta la

credibilidad y confianza en los datos Adicionalmente se disminuyen los costos y tiempos en la

generacioacuten de los datos y se reducen los usos indebidos de los mismos

Esta guiacutea pretende que las entidades o responsables de publicar y disponer los datos lo hagan

con altos estaacutendares de calidad debidamente documentados en formatos interoperables y

que satisfagan necesidades reales de los usuarios para que estos uacuteltimos puedan encontrarlos

accederlos comprenderlos y reutilizarlos

IDECA ha plasmado en este documento las mejores praacutecticas de publicacioacuten de datos en la

Web que cubren aspectos como el formato el acceso la calidad los metadatos el

licenciamiento y el origen de los datos

Se invita al lector a navegar faacutecilmente en el documento ya que este presenta sin un orden

determinado las mejores praacutecticas de publicacioacuten de datos explicadas en

iquestQueacute logro Los beneficios que se obtienen al aplicar la buena praacutectica

iexclRecomendaciones Las herramientas baacutesicas para conseguir el objetivo de la buena praacutectica

Ejemplos Utilizando conjuntos de datos reales de las entidades oficiales del Distrito Capital se visualiza la aplicacioacuten de la buena praacutectica

5 Buenas praacutecticas para la publicacioacuten de datos

OBJETIVO

Promover en las entidades de la Administracioacuten Distrital y sus responsables la apropiacioacuten y

adopcioacuten de las mejores praacutecticas de publicacioacuten de datos con el fin de aumentar el valor en la

informacioacuten producida dentro de su quehacer institucional

AUDIENCIA

Este documento estaacute dirigido a las entidades y personas responsables de la Administracioacuten

Distrital que publican o desean publicar datos oficiales de Bogotaacute a traveacutes de cualquier

plataforma de datos

ALCANCE

Las mejores praacutecticas expuestas en este documento estaacuten encaminadas a que los datos

publicados a traveacutes de plataformas oficiales cumplan con unos requisitos miacutenimos de calidad

documentacioacuten interoperabilidad y licenciamiento dentro del proceso de publicacioacuten

Buscamos con esta guiacutea de buenas praacutecticas garantizar la apropiacioacuten de cuatro principios

Que los datos sean descubiertos es decir que cualquier usuario en el entorno Web los

pueda encontrar faacutecilmente

Que los datos sean accesibles quiere decir que no presenten restricciones de acceso ni

que se encuentren cifrados

Que los datos sean interoperables en otras palabras que sean publicados en formatos

estandarizados que permitan ser procesados por cualquier software

Que los datos sean reutilizables es decir que estos sean utilizados en la mayor cantidad

de productos servicios y mercados

Debe tenerse en cuenta que IDECA expone en este documento las mejores praacutecticas de

publicacioacuten de datos identificadas con base a la experiencia adquirida en la disposicioacuten datos

de los uacuteltimos antildeos sin embargo existe una amplia gama de otras buenas praacutecticas de

publicacioacuten que no han sido incluidas en el presente texto y en consecuencia se invita al lector

a apropiarse de las praacutecticas expuestas y a dejar abierta la posibilidad de complementar la

informacioacuten presentada con otras fuentes

6 Buenas praacutecticas para la publicacioacuten de datos

BUENAS PRAacuteCTICAS PARA LA PUBLICACIOacuteN DE DATOS

1 Proporcionar metadatos asociados con los datos publicados Estos metadatos permitiraacuten conocer las caracteriacutesticas de los datos y deberaacuten ser interpretables tanto por usuarios como por aplicaciones informaacuteticas

Un metadato entendido como la informacioacuten acerca de un recurso1 es un dato con muchos

elementos que le permiten al usuario conocer desde la visioacuten del productor las caracteriacutesticas

propias de los datos publicados tales como las fechas de creacioacuten y actualizacioacuten el canal de

acceso la calidad del dato las condiciones de uso quieacuten lo produjo quieacuten lo distribuye etc

esto quiere decir que el metadato explica el dato en eacutel estaacute contenida toda la informacioacuten

relevante del dato

En la vida cotidiana la ceacutedula de ciudadaniacutea es el documento que contiene la informacioacuten

miacutenima de las personas (nombre sexo fecha de nacimiento GS RH estatura lugar de

nacimiento) esta informacioacuten permite que el ciudadano se identifique en cualquier lugar del

territorio nacional ante otras personas o autoridades que requieran conocerlo

Con los datos el tratamiento es similar el dato corresponde a la persona y el metadato

corresponde a la ceacutedula de ciudadaniacutea Asiacute como en Colombia todo ciudadano debe portar su

documento de identificacioacuten en el entorno Web todo dato debe portar su metadato en otras

palabras el metadato es parte integral del dato y existe entre ambos un viacutenculo inseparable

Los datos siempre deberaacuten publicarse con su respectivo metadato este uacuteltimo deberaacute contar

con informacioacuten completa y estandarizada que garantice que los usuarios encuentren

conozcan y utilicen los datos que producimos

Recuerde que la publicacioacuten del metadato es igual de importante que la publicacioacuten del

dato

iquestQueacute logro

Al publicar datos en conjunto con su metadato obtengo

Que mis datos sean encontrados y utilizados por maacutes usuarios Que los usuarios logren una correcta interpretacioacuten de la naturaleza calidad y

distribucioacuten de mis datos

Que mis datos sean entendidos evaluados y retroalimentados por maacutes usuarios

Que mis datos puedan ser compartidos e intercambiados entre sistemas

Que los motores de buacutesqueda encuentren mis datos publicados

Que las aplicaciones informaacuteticas procesen mejor y en mayor cantidad mis datos

1 ISO 19115-12014 410

7 Buenas praacutecticas para la publicacioacuten de datos

iexclRecomendaciones

Disponga metadatos suficientes que permitan a los usuarios tener la informacioacuten

correcta para decidir si el dato publicado satisface o no sus necesidades

Incluya en sus metadatos la ubicacioacuten del dato a traveacutes de la descripcioacuten del lugar

(localidad parque riacuteo etc) o a traveacutes de localizacioacuten por coordenadas geograacuteficas x e

y

Publique sus metadatos como una paacutegina Web HTML (HyperText Markup Language) o

simplemente como un archivo de texto separado

Disponga sus metadatos en el formato baacutesico de intercambio XML (Extensible Markup

Language) o en formatos estaacutendar maacutes sofisticados como JSON (JavaScript Object

Notation)

Al igual que los datos puede publicar los metadatos en muacuteltiples formatos desde la

misma URL

Tenga en cuenta que IDECA a partir de estaacutendares internacionales ha definido los

elementos miacutenimos que debe contener el metadato y que estos pueden ser utilizados

en la publicacioacuten de sus metadatos para facilitar el intercambio de estos

Figura 1 Secciones del Perfil de Metadatos IDECA

Para maacutes informacioacuten consulte la Cartilla para la creacioacuten de metadatos geograacuteficos en

Bogotaacute Distrito Capital

8 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo 1

En la siguiente URL se observa un metadato dispuesto para que los usuarios puedan consultar

faacutecilmente la informacioacuten asociada al dato publicado (Desarrollo Econoacutemico Rural Bogotaacute

DC)

httpmetadatosidecagovcogeoportalcatalogsearchresourcedetailspageuuid=A8AB6E

7A-55FB-40DA-85E1-0AA6B4FE6CE3

Ejemplo 2

En la siguiente URL estaacute disponible el metadato de un nivel de informacioacuten dispuesto por la

Unidad Administrativa Especial de Catastro Distrital ndash UAECD ndash en formato XML (legible por

aplicaciones informaacuteticas

httpmetadatosidecagovcogeoportalrestdocumentid=7BBE5F9AEE-1FBC-4C13-822F-

F2CE44AFDD7E7D

9 Buenas praacutecticas para la publicacioacuten de datos

2 Proporcionar una licencia en donde se especifiquen las limitaciones yo restricciones de acceso y uso de los datos

Una licencia entendida como las condiciones legales bajo las cuales estaacute disponible la obra2 es

un instrumento mediante el cual el propietario del dato autoriza o no a los usuarios para que

accedan a su contenido y tambieacuten lo faculta para su utilizacioacuten Existen diferentes tipos de

licencia para la distribucioacuten y explotacioacuten de obras y cuyo propoacutesito es regular las condiciones

de acceso y uso de los datos

Dependiendo el acceso autorizado a los datos las licencias pueden clasificarse en

Privativas o restrictivas Aquellas licencias conocidas como cerradas o no libres donde la mayoriacutea de las veces solo el autor puede usar la obra o en caso contrario se definen condiciones especiacuteficas que se deben cumplir para hacer uso de la informacioacuten

Semilibres Aquellas licencias que requieren autorizaciones para que los usuarios utilicen copien distribuyan o modifiquen su contenido

Libres o abiertas Aquellas licencias que en teacuterminos generales permiten usar distribuir y compartir los datos con muy pocas restricciones

Cuando un dato se publica acompantildeado de su licencia el usuario conoce las condiciones de

acceso uso y distribucioacuten de los datos que estaacute consumiendo de esta forma se garantiza que

los datos se distribuyan seguacuten los intereses de la entidad que los produce y se minimizan los

usos indebidos de los datos por parte de los usuarios

Ahora bien definir la licencia adecuada para cada dato dependeraacute de las condiciones que

establezca la entidad productora de este Revise los ejemplos y defina la licencia maacutes adecuada

para sus datos

Para maacutes informacioacuten consulte el Instructivo para la definicioacuten de licencias de datos

iquestQueacute logro

Que el usuario evaluacutee si puede o no usar mis datos

Que el usuario conozca las condiciones de acceso uso y manejo sobre los datos

disponibles

Dar claridad y potenciar el uso de los datos disponibles

Que el usuario de los reconocimientos respectivos a la entidad productora de los datos

Que se genere valor agregado sobre los datos disponibles en caso de asignar una

licencia abierta

2 Recuperado de httpsopendefinitionorgod21es

10 Buenas praacutecticas para la publicacioacuten de datos

iexclRecomendaciones

Identifique la licencia que mejor se acomode a su modelo de negocio Recuerde que

mediante la Ley 1712 de 2014 se reguloacute el derecho de acceso a la informacioacuten puacuteblica

y se incluyeron los principios de facilitacioacuten gratuidad y divulgacioacuten proactiva de la

informacioacuten

Disponga una licencia para su conjunto de datos a traveacutes de un enlace una copia

incorporada o dentro del metadato

Prefiera el uso de licencias abiertas de este modo sus datos seraacuten utilizados en una

mayor cantidad de productos servicios y mercados

Ejemplo 1

Mundialmente conocidas las licencias Creative Commons3 tienen como objetivo fortalecer a los

creadores para que sean quienes definan los teacuterminos en que sus obras pueden ser usadas queacute

derechos desean entregar y en queacute condiciones lo haraacuten A continuacioacuten encontraraacute los

enlaces de acceso para conocer las condiciones de cada una de las licencias disponibles

CC0 10 httpscreativecommonsorgpublicdomainzero10deedes

CC BY 40 httpscreativecommonsorglicensesby40

CC BY-SA 40 httpscreativecommonsorglicensesby-sa40

CC BY-ND 40 httpscreativecommonsorglicensesby-nd40

CC BY-NC 40 httpscreativecommonsorglicensesby-nc40

CC BY-NC-SA 40

httpscreativecommonsorglicensesby-nc-sa40

Ejemplo 2

Tambieacuten existen las licencias abiertas para datos Open Data Commons4 proporcionadas por la

mundialmente conocida red Open Knowledge Foundation Network ndash OKFN5 puede consultar

las condiciones ingresando a los siguientes enlaces

ODbL 10 httpsopendatacommonsorglicensesodblsummary

PDDL 10 httpsopendatacommonsorglicensespddlsummary

ODC-BY 10 httpsopendatacommonsorglicensesbysummary

3 httpcreativecommonsorg 4 httpopendatacommonsorg 5 httpsokfnorg

11 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo 3

El Mapa de referencia para Bogotaacute estaacute publicado en

httpswwwidecagovcoesserviciosmapa-de-referencia bajo las condiciones descritas en la

ldquoLICENCIA ABIERTA O CONDICIONES DE USO PARA DATOS ABIERTOS DE LA INFRAESTRUCTURA

INTEGRADA DE DATOS ESPACIALES PARA EL DISTRITO CAPITAL (IDECA)rdquo

httpswwwidecagovcoeslicenciaabierta

12 Buenas praacutecticas para la publicacioacuten de datos

3 Utilizar vocabularios estandarizados y reutilizables en la estructuracioacuten y publicacioacuten de los datos

Un vocabulario define los conceptos y las relaciones que se utilizan para describir y representar

un aacuterea de intereacutes6 Cuando se publican datos en la Web los vocabularios permiten integrar

datos cuando existen ambiguumledades en los teacuterminos utilizados en los diferentes conjuntos de

datos En la praacutectica un vocabulario es un conjunto de palabras que permiten a dos usuarios

comunicarse entre siacute La efectividad de dicha comunicacioacuten radica en que el significado de una

palabra para el usuario emisor sea el mismo que para el usuario receptor independientemente

de si utilizaron el mismo teacutermino

Cuando se habla de interoperabilidad de datos lo que se espera es que tanto los usuarios

como las aplicaciones informaacuteticas entiendan y comprendan la mayor cantidad de informacioacuten

que estaacuten consumiendo Para conseguir esto las comunidades de datos han identificado

vocablos palabras o teacuterminos de uso comuacuten los cuales cuentan con significados apropiados y

que actualmente se encuentran integrados y estructurados en diferentes estaacutendares

internacionales

Se recomienda utilizar vocabularios de este tipo para estandarizar los datos contenidos en la

informacioacuten publicada

iquestQueacute logro

Que mis datos sean consultados utilizados y reutilizados por maacutes usuarios Que se reduzca la ambiguumledad en la interpretacioacuten de mis datos Que mis datos sean interoperables Que mis datos sean procesados en entornos nacionales e internacionales Que mis datos puedan ser compartidos e intercambiados entre sistemas Que mis datos sean maacutes confiables

iexclRecomendaciones

Consulte normas locales o vocabularios internacionales para la estructuracioacuten7 de sus

datos

Apropie los vocabularios consultados y adapte sus datos a estos en los casos en que sea

posible

Incluya vocabularios ya definidos y reconocidos internacionalmente cuando vaya a

producir nuevos datos

6 httpswwww3orgstandardssemanticwebontology 7 Estructurar significa ajustar los datos a un esquema fijo

13 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo 1

A continuacioacuten se presentan algunos vocabularios internacionales que puede consultar y

apropiar para optimizar el intercambio de sus datos

Data Catalog Vocabulary (DCAT) httpswwww3orgTRvocab-dcatclass-catalog

FOAF Vocabulary Specification httpxmlnscomfoaf01

ISOTC 211 Geographic informationGeomatics Terminology

httpwwwisotc211orgTerminologyhtm

The RDF Data Cube Vocabulary httpswwww3orgTR2014REC-vocab-data-cube-20140116

ODRL Vocabulary amp Expression 22

httpswwww3orgTR2018REC-odrl-vocab-20180215

HTTP Vocabulary in RDF 10 httpswwww3orgTR2017NOTE-HTTP-in-RDF10-20170202

vCard Ontology - for describing People and Organizations

httpswwww3orgTRvcard-rdf

Ejemplo 2

En el contexto Nacional el Ministerio de Tecnologiacuteas de la Informacioacuten y las Comunicaciones ha

establecido el Lenguaje Comuacuten de Intercambio de como un instrumento de consulta que

contiene la definicioacuten de los elementos de datos conceptualizados por las entidades del

estado La consulta la puede realizar en httplenguajeminticgovco

14 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo 3

La especificacioacuten vCard disponible en httpswwww3orgTRvcard-rdf promueve un

vocabulario especiacutefico para describir personas y organizaciones

Uno de los vocablos que describe esta especificacioacuten es la ldquodireccioacuten de entregardquo llamado

dentro del vocabulario como ADR y definido como ldquola direccioacuten del objeto representado en

partes estructuradasrdquo

Ahora bien este vocabulario especifica los componentes de la direccioacuten de entrega para el

objeto asiacute el nombre del paiacutes la localidad el coacutedigo postal la regioacuten y la direccioacuten dada por

viacuteas (calles y carreras en el caso colombiano) Esto quiere decir que cualquiera de los

componentes descritos puede usarse como direccioacuten de entrega vaacutelida ya que son equivalentes

entre siacute

Aunque en el vocabulario la direccioacuten de entrega se llame ADR el usuario de la informacioacuten

entenderaacute que un nombre de paiacutes o un coacutedigo postal pueden interpretarse como ADR

15 Buenas praacutecticas para la publicacioacuten de datos

4 Anonimizar los datos de caraacutecter personal informacioacuten estadiacutestica informacioacuten indirectamente identificable e informacioacuten sensible o confidencial

Anonimizar es el proceso que impide la identificacioacuten de las unidades de estudio que son fuente

para los registros individuales de un conjunto8 de datos o maacutes claro es la aplicacioacuten de teacutecnicas

que permitan expresar un dato relativo a personas eliminando la referencia a su identidad9

Baacutesicamente lo que se busca es reducir los riesgos en el uso y procesamiento de datos

personales evitar la extraccioacuten de registros que identifican a una persona reducir la

combinacioacuten de dos o maacutes registros en una o varias bases de datos para identificar a una

persona y minimizar la deduccioacuten de datos personales partir de uno o varios datos publicados

iquestQueacute informacioacuten debo prioritariamente anonimizar

Datos personales Informacioacuten numeacuterica alfabeacutetica graacutefica fotograacutefica acuacutestica o

cualquier otro tipo susceptible de recogida registro tratamiento y transmisioacuten

concerniente a personas fiacutesicas identificadas o identificables (tales como nombre

apellidos estado civil sexo edad domicilio identificacioacuten personal nuacutemero de

teleacutefono etc)10

Informacioacuten sensible Informacioacuten considerada como estrictamente confidencial

Informacioacuten y caracteriacutesticas referentes a la edad procedencia salud raza religioacuten

ideologiacutea afiliacioacuten finanzas etc se consideran de caraacutecter sensible y requieren de

una proteccioacuten especial11

iquestQueacute logro

Garantizar que mis datos publicados cuentan con medidas de proteccioacuten de datos

personales

Eliminar de manera efectiva el riesgo de re-identificacioacuten

Evitar que el procesamiento de mis datos tenga consecuencias negativas para alguna

persona

Disponer muchos maacutes datos sin invadir la informacioacuten personal

iexclRecomendaciones

Implemente actividades de proteccioacuten de la privacidad de los datos personales antes

de publicarlos

Elimine cualquier identificador directo de la persona (nombre documento de

identidad etc)

8 httpswwwdanegovcofilessenlineamientosDSO_020_LIN_08pdf 9 httpdleraeesid=2jjMiRi 10 httpswwwdanegovcofilessenlineamientosDSO_020_LIN_08pdf 11 Ibidem

16 Buenas praacutecticas para la publicacioacuten de datos

Reemplace los identificadores directos por coacutedigos de referencia pseudoacutenimos

(algoritmos AES12 o un hash cifrado HMAC13) coacutedigos arbitrarios o aleatorios

Si reemplazando el identificador directo auacuten es faacutecil identificar a la persona elimine el

dato

Clasifique yo categorice los datos

Redondee los datos numeacutericos hacia arriba o hacia abajo

Evaluacutee antes durante y despueacutes de publicados los datos si la anonimizacioacuten de sus

datos es suficiente y evaluacutee regularmente los riesgos existentes

Para maacutes informacioacuten consulte los Lineamientos para la Anonimizacioacuten de micro datos

Ejemplo 1

Antes de publicar sus datos retire el identificador directo de la persona En este caso

reemplace en nuacutemero de documento que identifica al usuario y reemplaacutecelo por un

consecutivo

Usuario Beneficio Usuario Beneficio

80123456 Subsidio de vivienda Usuario 1 Subsidio de vivienda

51123456 Subsidio de alimentacioacuten Usuario 2 Subsidio de alimentacioacuten

19123456 Subsidio al adulto mayor Usuario 3 Subsidio al adulto mayor

53123456 Subsidio de desempleo Usuario 4 Subsidio de desempleo

Ejemplo 2

Clasifique o categorice sus datos En este ejemplo asigne rangos a la edad de manera tal que el

titular del registro no sea identificable por este dato

Usuario Edad Usuario Rango de edad

Usuario 1 11 antildeos Usuario 1 Entre 10 y 15 antildeos

Usuario 2 22 antildeos Usuario 2 Entre 20 y 25 antildeos

Usuario 3 36 antildeos Usuario 3 Entre 35 y 40 antildeos

Usuario 4 63 antildeos Usuario 4 Entre 60 y 65 antildeos

12 Advanced Encryption Standard puede consultar como ha sido implementado este algoritmo en httpsrevistasudistritaleducoojsindexphpTecnuraarticleview72368892 13 Hash-based Message Authentication Code puede consultar como se crea este cifrado en httpsdocsoraclecomcdE19253-01819-7804wanboottasks2-51indexhtml

17 Buenas praacutecticas para la publicacioacuten de datos

5 Publicar los datos en formatos estaacutendar reutilizables y legibles por aplicaciones informaacuteticas

Un formato puede ser definido como la estructura de un disco dividido en campos y pistas

seguacuten un determinado sistema operativo lo que permite almacenar en eacutel informacioacuten14

baacutesicamente es la forma en que se codifican los datos en un archivo informaacutetico

Actualmente conocemos formatos comunes de almacenamiento como el doc una extensioacuten

de Word que almacena texto y cuyo propietario es la compantildeiacutea Microsoft Pero iquestqueacute pasa si un

usuario quiere abrir un documento doc en un procesador de texto diferente a Word

difiacutecilmente va a poder conocer el contenido de dicho documento sin tener esta licencia

Lo que queremos lograr con la implementacioacuten de esta praacutectica es que todos los usuarios que

encuentren mis datos puedan accederlos sin necesidad de contar con un software o aplicacioacuten

informaacutetica especiacutefica

iquestQueacute logro

Que mis datos sean consultados utilizados y reutilizados por maacutes usuarios

Que mis datos sean maacutes interoperables y maacutes procesados

Que mis datos puedan ser extraiacutedos transformados y procesados por aplicaciones

informaacuteticas

Que mis datos puedan ser compartidos e intercambiados entre sistemas

Disminuir los costos y los tiempos en el uso y la transformacioacuten de mis datos

iexclRecomendaciones

Prefiera publicar su conjunto de datos en formatos abiertos o no propietario ya que

estos facilitan el uso re-uso y distribucioacuten de estos Se busca que un mayor nuacutemero de

aplicaciones informaacuteticas pueda extraer leer y transformar los datos generando mayor

uso y re-uso por los usuarios

Disponga sus datos en muacuteltiples formatos con el fin de incrementar el acceso a los

mismos Se busca que el mayor nuacutemero de usuarios pueda utilizar los datos sin tener

que transformarlos primero en su formato preferido

Utilice Web Services para mejorar el intercambio e interoperabilidad de los datos

publicados

14 httpdleraeessrvsearchm=30ampw=formato

18 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo 1

A continuacioacuten encontraraacute extensiones de formato propietario y no propietario prefiera para

la publicacioacuten de sus datos las extensiones de la derecha

FORMATO PROPIETARIO FORMATO NO PROPIETARIO

DOC GDB TXT ASCII Grid KML RDF

XLS DWG CSV GeoJSON DXF XML

PPT SHP JSON GML ODF

Ejemplo 2

Si no fue posible utilizar una extensioacuten de formato no propietario publique sus datos en una

variedad de formatos que le permita al usuario acceder a los datos desde diferentes

aplicaciones informaacuteticas

Ejemplo 3

Para publicar sus datos conozca diferentes tipos de Web Services que viajan en la red utilizando extensiones XML

SOAP httpswwww3orgTRsoap

REST httprestelksteinorg

WMS httpwwwopengeospatialorgstandardswms

WFS httpwwwopengeospatialorgstandardswfs

WCS httpwwwopengeospatialorgstandardswcs

19 Buenas praacutecticas para la publicacioacuten de datos

6 Proporcionar un diccionario de datos que facilite el uso e interpretacioacuten de los datos publicados

Un diccionario estaacute definido como un repertorio en forma de libro o en soporte electroacutenico en el

que se recogen seguacuten un orden determinado las palabras o expresiones de una o maacutes lenguas

o de una materia concreta acompantildeadas de su definicioacuten equivalencia o explicacioacuten15

especiacuteficamente en un diccionario de datos se encuentran los conceptos de los datos y sus

propiedades (atributos dominios asociaciones y operaciones) acompantildeados de una definicioacuten

en donde se identifica el propoacutesito alcance y campo de aplicacioacuten del dato publicado

Lograr que los usuarios de mis datos entiendan la informacioacuten que estaacute publicada le permitiraacute

decidir si satisfacen o no su necesidad y le facilitaraacute la decisioacuten para explotar lo datos

Para maacutes informacioacuten consulte el Instructivo Diccionario de Datos

iquestQueacute logro

Que mis datos sean consultados utilizados y reutilizados por maacutes usuarios

Que se eviten ambiguumledades en la interpretacioacuten de mis datos

Que mis datos publicados esteacuten unificados y consistentes

Que los usuarios comprendan mejor y dispongan de claridad sobre los conceptos de

mis datos

iexclRecomendaciones

Publique como miacutenimo un diccionario de datos que contenga la caracterizacioacuten del

conjunto de datos producidos por su entidad

Cree el diccionario de datos teniendo en cuenta como miacutenimo la siguiente informacioacuten

Nombre del atributo Nombre que identifica de manera clara un atributo

Definicioacuten Descripcioacuten del atributo

Tipo de dato Tipo de valor del atributo

Unidad de medida Expresa la unidad de medida del atributo

Dominio Determina si el atributo tiene asociado un dominio

15 httpdleraeesw=diccionario

20 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo

Para el conjunto de datos ldquoEstablecimientos Educativos en Bogotaacuterdquo publicariacuteamos un

diccionario de datos similar al siguiente

Nombre del atributo Definicioacuten Tipo de dato

Unidad de Medida

Dominio

Coacutedigo del establecimiento

Coacutedigo DANE asignado al Institucioacuten Educativa Decimal

Nombre del establecimiento

Nombre de la Institucioacuten Educativa Cadena de Caracteres

Aacuterea construida del establecimiento

Aacuterea construida de la Institucioacuten Educativa Decimal Metros

cuadrados

Sector

Clasificacioacuten asignada seguacuten la naturaleza juriacutedica la cual define las principales caracteriacutesticas que desde lo juriacutedico - administrativo y tiene que ver con el origen de su creacioacuten

Entero

EESector

No podriacuteamos olvidar detallar el dominio asociado

Atributo Nombre del Dominio Coacutedigo Definicioacuten

EESector

Oficial 1

Es una institucioacuten donde su naturaleza de servicio puacuteblico cultural y su funcioacuten social le es inherente cumpliendo con las disposiciones legales y estatutarias que las rigen donde sus rentas se conservan y se aplican debidamente

Privado 2

Es una institucioacuten constituida como persona juriacutedica de utilidad comuacuten donde sus rentas se conservan y se aplican debidamente y que en todo lo esencial se cumple con la voluntad de sus fundadores

21 Buenas praacutecticas para la publicacioacuten de datos

7 Acompantildear la publicacioacuten de los datos con enlaces a otros recursos

Un enlace es definido como una secuencia de caracteres que se utiliza como direccioacuten para

acceder a informacioacuten adicional16 maacutes sencillo puede definirse como una expresioacuten que

conecta una cierta informacioacuten con otra17Ahora bien un recurso se puede entender como

cualquier medio que satisfaga una necesidad por ejemplo datos servicios documentos o

software

En teacuterminos generales se sugiere que para facilitar al usuario la comprensioacuten de los datos

publicados se proporcionen recursos o documentos adicionales que puedan ser consultados

yo descargados traveacutes de enlaces o links de otro sitio Web

Dentro de los recursos adicionales que pueden publicarse para acompantildear el dato estaacuten los

procedimientos de captura del dato los cataacutelogos de objetos las especificaciones teacutecnicas los

documentos normativos los cataacutelogos de simbologiacutea los reportes de evaluacioacuten de calidad

entre otros

iquestQueacute logro

Mejorar la consulta utilizacioacuten y reutilizacioacuten de mis datos

Que los usuarios comprendan mejor mis datos

Que mis datos sean compartidos e intercambiados por un mayor nuacutemero de usuarios

iexclRecomendaciones

Disponga informacioacuten adicional de sus datos que le permita a los usuarios ampliar el

horizonte de las aplicaciones y funcionalidades en las que pueda utilizar y explotar del

dato

No olvide vincular o registrar esta informacioacuten en el metadato

16 httpdleraeesid=FTVRKyj 17 httpssistemascomenlacephp

22 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo 1

El ldquoMapa de Referencia para Bogotaacuterdquo publicado en httpswwwidecagovcoesserviciosmapa-de-referencia tiene publicados varios enlaces a otros recursos

Especificacioacuten teacutecnica para la elaboracioacuten del Mapa de Referencia para Bogotaacute DC V0318

Cataacutelogo de Objetos del Mapa de Referencia de Bogotaacute DC V 57

Cataacutelogo de Representacioacuten del Mapa de Referencia de Bogotaacute DC V30

Reporte de evaluacioacuten de calidad generado al Mapa de Referencia del Distrito Capital V1217

Ejemplo 2

La informacioacuten de los ldquohumedales de Bogotaacuterdquo publicada en

httpambientebogotagovcowebsdahumedales tiene publicados enlaces a otros recursos

o Gestioacuten de los humedales

o Poliacutetica de Humedales del Distrito Capital

o Normatividad

o Planes de Manejo Ambiental

o Comiteacute distrital de humedales documentos de consulta normatividad

23 Buenas praacutecticas para la publicacioacuten de datos

8 Depurar sus datos antes de publicarlos para garantizar su calidad y aumentar su confianza

La calidad estaacute definida como el conjunto de propiedades inherentes a algo que permiten

juzgar su valor18 para el caso que nos concierne este algo hace referencia al dato publicado

Ahora bien la calidad tambieacuten es entendida como la capacidad del dato publicado para

satisfacer los requerimientos y las necesidades de los usuarios respetando una serie de normas

y especificaciones establecidas

Actualmente existen muacuteltiples elementos de calidad de los datos que identifican las cualidades

de estos sin embargo en este aparte citaremos los elementos principales que usted o su

entidad deben tener en cuenta para publicar sus datos con un estaacutendar miacutenimo de calidad

Para maacutes informacioacuten consulte el Procedimiento para evaluar y reportar la calidad de

los datos espaciales

iquestQueacute logro

Que mis datos sean consultados utilizados y reutilizados por maacutes usuarios

Que los usuarios hablen bien de mis datos

Que mis datos sean maacutes interoperables y maacutes procesados

Que mis datos sean maacutes compartidos

Que mis datos sean maacutes confiables

Recomendacioacuten 1

Establezca si dentro de su conjunto de datos existen capos vaciacuteos o nulos con informacioacuten

descontextualizada sobrante o duplicada Si existen compleacutetelos o elimiacutenelos seguacuten

corresponda antes de la publicacioacuten El elemento de calidad asociado se denomina ldquototalidadrdquo

Localidad Atendidos Localidad Atendidos

Suba 200 Suba 200

Suba 200 Tunjuelito 500

Ameacutericas 100

850

Tunjuelito 500

18 httpdleraeesid=6nVpk8P|6nXVL1Z

Campo duplicado

Campo inconsistente

Campo vaciacuteo

24 Buenas praacutecticas para la publicacioacuten de datos

Recomendacioacuten 2

Identifique y transforme si es necesario los datos que hayan sido registrados en un formato

diferente al establecido para su conjunto de datos Es decir estandarice el formato de salida

del dato que va a publicar El elemento de calidad asociado se denomina ldquoconsistencia de

formatordquo

Localidad Atendidos Localidad Atendidos

Suba 200 Suba 200

Tunjuelito 5008 Tunjuelito 500

Fontiboacuten 40 Fontiboacuten 430

Tunjuelito 500 Tunjuelito 500

Recomendacioacuten 3

Si sus datos tienen alguacuten tipo de clasificacioacuten o rangos previo a la publicacioacuten valide que estos

se hayan registrado correctamente El elemento de calidad asociado se denomina ldquoexactitud de

clasificacioacutenrdquo

Geacutenero Edad Rango de Edad Geacutenero Edad Rango de Edad

Femenino 5 0 lt Edad le 10 Femenino 5 0 lt Edad le 10

Masculino 15 0 lt Edad le 10 Masculino 15 10 lt Edad le 20

Femenino 35 40 lt Edad le 50 Femenino 35 30 lt Edad le 40

Recomendacioacuten 4

Si sus datos representan atributos cuantitativos verifique antes de la publicacioacuten que estos

correspondan a valores conocidos como verdaderos El elemento de calidad asociado se

denomina ldquoexactitud de atributos cuantitativosrdquo

Localidad Mes Temperatura Localidad Mes Temperatura

Chapinero Enero 7degC Chapinero Enero 7degC

Suba Agosto -15degC Suba Agosto 15degC

Tunjuelito Abril 60degC Tunjuelito Abril 16degC

Clasificacioacuten inconsistente

Formato inconsistente

Valor inconsistente

25 Buenas praacutecticas para la publicacioacuten de datos

Recomendacioacuten 5

Si los datos a publicar tienen asociadas fechas de captura o recoleccioacuten de informacioacuten (Por

ejemplo registro de incidentes registro de vacunacioacuten conteo de vehiacuteculos etc) valide que

las fechas registradas coincidan con la fecha del evento capturado El elemento de calidad

asociado se denomina ldquoexactitud de la medicioacuten del tiempordquo

Precipitacioacuten (mm) Fecha de registro Precipitacioacuten (mm) Fecha de registro

00 20580101 00 20180101

01 20180102 01 20180102

126 20510403 126 20180103

20 20180104 20 20180104

Recomendacioacuten 6

Cuando sus datos reflejen informacioacuten determinada por un orden de eventos garantice antes

de la publicacioacuten que este orden sea el adecuado El elemento de calidad asociado se

denomina ldquoconsistencia temporalrdquo

Usuario Escolaridad Periodo de Estudio Usuario Escolaridad Periodo de Estudio

Usuario 1 Preescolar 20030101 ndash 20051231 Usuario 1 Preescolar 20030101 ndash 20051231

Usuario 1 Primaria 20030101 ndash 20101231 Usuario 1 Primaria 20060101 ndash 20101231

Usuario 1 Secundaria 20060101 ndash 20163112 Usuario 1 Secundaria 20110101 ndash 20143112

Usuario 1 Media 20150101 - 20163112 Usuario 1 Media 20150101 - 20163112

Recomendacioacuten 7

Si sus datos incluyen alguna ubicacioacuten (direccioacuten lugar coordenadas) verifique que esta

corresponda a la ubicacioacuten real El elemento de calidad asociado se denomina ldquoexactitud

posicionalrdquo

Eventos Deportivos Lugar Eventos Deportivos Lugar

Evento 1 AK 30 25 90 Evento 1 AK 30 25 90

Evento 2 AC 63 215 20 Evento 2 Parque La Florida

Evento 3 Parque Simoacuten Boliacutevar Evento 3 Parque Simoacuten Boliacutevar

Fecha

inconsistente

Fechas no secuenciales

Lugar inexistente

26 Buenas praacutecticas para la publicacioacuten de datos

9 Incorporar el componente geograacutefico en los datos publicados para optimizar su comprensioacuten uso re-uso y visualizacioacuten

El espacio geograacutefico es un punto de la superficie terrestre que se vea afectado o que afecte de

alguna manera a la humanidad19 Este punto de la superficie puede ser la direccioacuten de una

institucioacuten educativa la ubicacioacuten de un centro de vacunacioacuten el lugar donde se miden las

variaciones de traacutensito en la ciudad los parques de Bogotaacute el edificio en donde se llevan a

cabo los traacutemites de una entidad etc

Los datos que usted captura o recolecta en su quehacer misional siempre estaacuten asociados a un

espacio geograacutefico por lo tanto este componente deberiacutea ser incluido en los datos publicados

Tenga en cuenta que el componente geograacutefico lo puede incorporar incluyendo una ubicacioacuten

asociada a una direccioacuten a un lugar a una localidad a un barrio al nombre de un

establecimiento puacuteblicamente reconocido o a cualquier punto que permita al usuario

identificar la localizacioacuten del dato publicado

iquestQueacute logro

Ampliar el espectro de usuarios que consultan utilizan y reutilizan mis datos

Que mis datos sean maacutes interoperables y maacutes procesados

Que mis datos sean puedan compartir en maacutes plataformas

Que los usuarios puedan visualizar mis datos en un mapa

iexclRecomendaciones

Disponga sus datos agregando un atributo de ubicacioacuten como direcciones coordenadas o

lugares geograacuteficos

Ejemplo 1

Incluya direcciones que permitan localizar espacialmente sus datos

Programa Direccioacuten

Registro de atencioacuten a la ciudadaniacutea CL 138 108 16

Centro de autocuidado KR 18 D 77 A 11 SUR

Familias con un nintildeo en cupos cofinanciados CL 70 A SUR 20 46

Centro de autocuidado KR 18 D 73 A 33 SUR

19 httpenciclopediabanrepculturalorgindexphptitle=Espacio_geogrC3A1fico

27 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo 2

Utilice coordenadas para indicar la ubicacioacuten de sus datos

EPS Coordenada X Coordenada Y

EPS Convida 9087496334 1051342164

Capital Salud EPS 986321006 954875808

EPS Famisanar 9742508812 8837031501

Aliansalud EPS 9716943356 9659706891

Salud Total EPS 9215624975 9625189518

Tenga en cuenta que para publicar datos con coordenadas tendraacute que incluir dentro

de su metadato el Sistema de referencia empleado

MAGNA ndash SIRGAS EPSG 4686 httpsepsgio4686

MAGNA ndash SIRGAS EPSG 3116 httpsepsgio3116

MAGNA ndash BOGOTAacute SR-ORG 7458 httpspatialreferenceorgrefsr-org7458

Ejemplo 3

Tambieacuten puede incluir lugares geograacuteficos descriptivos asiacute

Usuario Vacunado Lugar de Vacunacioacuten

Usuario 1 BOSQUE IZQUIERDO

Usuario 2 LAGUNITAS URBANO

Usuario 3 LA CAPUCHINA

Usuario 4 SAN JOSE SUR

Usuario 5 VENECIA

28 Buenas praacutecticas para la publicacioacuten de datos

10 Asignar un identificador uacutenico que permita aumentar la consulta uso e interoperabilidad del dato publicado

Considere un identificador uacutenico como un texto que permite identificar inequiacutevocamente el

dato publicado Si usted va a publicar un dato buscando que este sea reutilizado por los

usuarios y por su propia entidad asignar un identificador facilitaraacute el descubrimiento y la

citacioacuten del dato a traveacutes del tiempo independientemente del estado la disponibilidad o el

formato de este

En la vida cotidiana mediante la ceacutedula de ciudadaniacutea se asigna a cada ciudadano un nuacutemero

de identificacioacuten uacutenico y a traveacutes de este identificador el ciudadano es reconocido a lo largo de

su vida e incluso despueacutes de su muerte por otras personas yo autoridades En el mundo de la

informacioacuten cada dato deberiacutea viajar con un identificador uacutenico que le permita ser encontrado

y reconocido faacutecilmente entre los demaacutes datos

Ahora bien si usted o su entidad publican continuamente datos establecer un sistema de

identificacioacuten comuacuten le permitiraacute identificar raacutepidamente los datos y los haraacute comparables por

cualquier usuario de manera confiable Esta condicioacuten es previa para lograr una correcta

gestioacuten y reutilizacioacuten de sus datos

iquestQueacute logro

Ampliar el espectro de usuarios que consultan utilizan y reutilizan mis datos

Que mis datos sean maacutes interoperables y maacutes procesados

Que mis datos sean compartidos en maacutes plataformas

Que mis datos puedan vincularse a otros datos en el entorno Web

Que mis datos sean encontrados usados y citados inequiacutevocamente

Garantizar y monitorear la reutilizacioacuten de mis datos

Reducir del uso erroacuteneo de mis datos

iexclRecomendaciones

Establezca un sistema de identificacioacuten comuacuten para los datos que va a publicar

Utilice siempre el identificador asignado para publicar sus datos

29 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo

IDECA ha dispuesto el Sistema de Registro de Iacutetems geograacuteficos

httpgeoitemsidecagovcogeoitemsano una herramienta web desarrollada para la

creacioacuten aprobacioacuten publicacioacuten y mantenimiento de iacutetems geograacuteficos que permite la

asignacioacuten concertada de identificadores y significados uacutenicos que contribuyen a la definicioacuten

de un lenguaje comuacuten para el desarrollo de nuevos sistema de informacioacuten en el Distrito

garantizando con ello su fiabilidad e interoperabilidad Adicionalmente permite almacenar

descripciones de la informacioacuten oficial producida e identificar su respectivo custodio jugando

asiacute un papel importante en el control y seguimiento de la produccioacuten de informacioacuten

geograacutefica

Este sistema asigna un identificador uacutenico a cada uno de los iacutetems creados Dentro de los iacutetems

publicados se reconoce el ID 65 como unidad de planeamiento y siempre que se hace

referencia a este objeto es suficiente nombrarlo asiacute para entender que se habla de ldquoUnidades

territoriales de anaacutelisis planeamiento y gestioacuten que tienen como propoacutesito definir y precisar el

planeamiento del suelo urbano de expansioacuten y ruralrdquo

30 Buenas praacutecticas para la publicacioacuten de datos

OBTENGA EL MAacuteS ALTO NIVEL EN PUBLICACIOacuteN DE DATOS

Hasta aquiacute hemos publicado las que consideramos como mejores praacutecticas de publicacioacuten de datos Ahora usted como publicador o como entidad debe evaluar si sus datos se estaacuten disponiendo con los maacutes altos y mejores estaacutendares de publicacioacuten

Lo invitamos a que valide en queacute nivel de publicacioacuten se encuentra su entidad teniendo en cuenta el siguiente listado

Nivel Baacutesico

En este nivel se encuentran aquellas entidades que publican sus datos en formatos estaacutendar y reutilizables (praacutectica 5) que integran a la publicacioacuten sus respectivos metadatos (praacutectica 1) y que acompantildean la publicacioacuten con una licencia asociada (praacutectica 2)

Nivel Intermedio

Este nivel lo alcanzan las entidades que superando el nivel baacutesico disponen un mayor volumen de informacioacuten gracias a que anonimizan sus datos (praacutectica 4) implementan medidas de calidad que aumentan la confianza en sus datos (praacutectica 8) incorporan el componente geograacutefico proporcionando valor agregado a sus datos (praacutectica 9) y publican un diccionario de datos que facilita la interpretacioacuten de los datos publicados (praacutectica 6)

Nivel Avanzado

Las entidades que superando el nivel intermedio utilizan vocabularios estandarizados en sus nuevas publicaciones (praacutectica 3) acompantildean la publicacioacuten de sus datos con enlaces a otros recursos (praacutectica 7) y asignan un identificador uacutenico para dato logrando asiacute aumentar su descubrimiento y reutilizacioacuten (praacutectica 10)

31 Buenas praacutecticas para la publicacioacuten de datos

REFERENCIAS

Bernadette Farias Loacutescio Caroline Burle Newton Calegari W3C Data on the Web Best

Practices 31 de enero de 2017 W3C Recommendation URL httpswwww3orgTRdwbp

Bernadette Hyland Ghislain Auguste Atemezing Boris Villazoacuten-Terrazas W3C Best Practices

for Publishing Linked Data 9 de enero de 2014 W3C Note URL httpswwww3orgTRld-bp

Dan Brickley Libby Miller FOAF project FOAF Vocabulary Specification 099 (Paddington

Edition) 14 de enero de 2014 URL httpxmlnscomfoafspec

Dublin Core metadata initiative DCMI Metadata Terms 14 de junio de 2012 DCMI

Recommendation URL httpdublincoreorgdocumentsdcmi-terms

Fadi Maali John Erickson W3C Data Catalog Vocabulary (DCAT) 16 de enero de 2014 W3C

Recommendation URL httpswwww3orgTRvocab-dcat

ISO 19115-12014 (E) Geographic information ndash Metadata Part1 Fundamentals 01 de abril de

2014 International Standard

ISO 191262009 (E) Geographic information -- Feature concept dictionaries and registers

noviembre de 2009 International Standard

ISO 191572013 (E) Geographic information ndash Data quality 15 de diciembre de 2013

International Standard

Jeremy Tandy Payam Barnaghi Linda van den Brink W3C Spatial Data on the Web Best

Practices 5 de enero 2017 W3C Note URL httpswwww3orgTRsdw-bp

T Berners-Lee R Fielding L Masinter IETF Uniform Resource Identifier (URI) Generic Syntax

Enero de 2005 Internet Standard URL httpstoolsietforghtmlrfc3986

World Wide Web Foundation Open Data Barometer URL httpopendatabarometerorg

W3C OWL Working Group W3C OWL 2 Web Ontology Language Document Overview (Second

Edition) 11 de diciembre de 2012 W3C Recommendation URL httpswwww3orgTRowl2-

overview

W3org Semantic Web - W3C URL httpswwww3orgstandardssemanticweb Consultado

el 12 de septiembre de 2018

Page 4: PARA LA PUBLICACIÓN DE DATOSideca.gov.co/.../files/documentacion/buenaspracticaspublicaciondat… · La obtención de datos la realiza cada entidad en el desarrollo de sus actividades

4 Buenas praacutecticas para la publicacioacuten de datos

INTRODUCCIOacuteN

La Infraestructura de Datos Espaciales del Distrito Capital - IDECA es el instrumento que

permite a las autoridades del Distrito identificar de manera constante la condicioacuten movilidad

dinaacutemica expansioacuten proceso proyectos y necesidades de la ciudad de Bogotaacute a traveacutes de la

obtencioacuten uso y disposicioacuten de informacioacuten georreferenciada para atender a la ciudadaniacutea y

conseguir la maacutes acertada toma de decisiones en beneficio de la ciudad y de sus habitantes

La obtencioacuten de datos la realiza cada entidad en el desarrollo de sus actividades misionales y el

uso de los datos producidos dependeraacute del propoacutesito del dato de la finalidad especiacutefica del

usuario y de coacutemo y cuando esteacuten disponibles los datos

IDECA gestiona la disposicioacuten de los datos por eso busca que los datos publicados por las

entidades pertenecientes a la Administracioacuten Distrital sin importar la plataforma de publicacioacuten

cuenten con altos estaacutendares de calidad interoperabilidad y documentacioacuten que promuevan y

faciliten el acceso comprensioacuten uso y re-uso de estos por cualquier usuario

Para encontrar y acceder los datos disponibles en el entorno Web los usuarios no

especializados tienen algunas dificultades ya que encuentran contenidos duplicados

desactualizados e inconsistentes lo que ha generado para los publicadores el reto de

garantizar el descubrimiento acceso calidad e interoperabilidad de sus datos

Es importante mencionar que si se publican datos uacutetiles novedosos actualizados y de calidad

no solo aumenta el nuacutemero de usuarios que los reutilicen y distribuyan sino que aumenta la

credibilidad y confianza en los datos Adicionalmente se disminuyen los costos y tiempos en la

generacioacuten de los datos y se reducen los usos indebidos de los mismos

Esta guiacutea pretende que las entidades o responsables de publicar y disponer los datos lo hagan

con altos estaacutendares de calidad debidamente documentados en formatos interoperables y

que satisfagan necesidades reales de los usuarios para que estos uacuteltimos puedan encontrarlos

accederlos comprenderlos y reutilizarlos

IDECA ha plasmado en este documento las mejores praacutecticas de publicacioacuten de datos en la

Web que cubren aspectos como el formato el acceso la calidad los metadatos el

licenciamiento y el origen de los datos

Se invita al lector a navegar faacutecilmente en el documento ya que este presenta sin un orden

determinado las mejores praacutecticas de publicacioacuten de datos explicadas en

iquestQueacute logro Los beneficios que se obtienen al aplicar la buena praacutectica

iexclRecomendaciones Las herramientas baacutesicas para conseguir el objetivo de la buena praacutectica

Ejemplos Utilizando conjuntos de datos reales de las entidades oficiales del Distrito Capital se visualiza la aplicacioacuten de la buena praacutectica

5 Buenas praacutecticas para la publicacioacuten de datos

OBJETIVO

Promover en las entidades de la Administracioacuten Distrital y sus responsables la apropiacioacuten y

adopcioacuten de las mejores praacutecticas de publicacioacuten de datos con el fin de aumentar el valor en la

informacioacuten producida dentro de su quehacer institucional

AUDIENCIA

Este documento estaacute dirigido a las entidades y personas responsables de la Administracioacuten

Distrital que publican o desean publicar datos oficiales de Bogotaacute a traveacutes de cualquier

plataforma de datos

ALCANCE

Las mejores praacutecticas expuestas en este documento estaacuten encaminadas a que los datos

publicados a traveacutes de plataformas oficiales cumplan con unos requisitos miacutenimos de calidad

documentacioacuten interoperabilidad y licenciamiento dentro del proceso de publicacioacuten

Buscamos con esta guiacutea de buenas praacutecticas garantizar la apropiacioacuten de cuatro principios

Que los datos sean descubiertos es decir que cualquier usuario en el entorno Web los

pueda encontrar faacutecilmente

Que los datos sean accesibles quiere decir que no presenten restricciones de acceso ni

que se encuentren cifrados

Que los datos sean interoperables en otras palabras que sean publicados en formatos

estandarizados que permitan ser procesados por cualquier software

Que los datos sean reutilizables es decir que estos sean utilizados en la mayor cantidad

de productos servicios y mercados

Debe tenerse en cuenta que IDECA expone en este documento las mejores praacutecticas de

publicacioacuten de datos identificadas con base a la experiencia adquirida en la disposicioacuten datos

de los uacuteltimos antildeos sin embargo existe una amplia gama de otras buenas praacutecticas de

publicacioacuten que no han sido incluidas en el presente texto y en consecuencia se invita al lector

a apropiarse de las praacutecticas expuestas y a dejar abierta la posibilidad de complementar la

informacioacuten presentada con otras fuentes

6 Buenas praacutecticas para la publicacioacuten de datos

BUENAS PRAacuteCTICAS PARA LA PUBLICACIOacuteN DE DATOS

1 Proporcionar metadatos asociados con los datos publicados Estos metadatos permitiraacuten conocer las caracteriacutesticas de los datos y deberaacuten ser interpretables tanto por usuarios como por aplicaciones informaacuteticas

Un metadato entendido como la informacioacuten acerca de un recurso1 es un dato con muchos

elementos que le permiten al usuario conocer desde la visioacuten del productor las caracteriacutesticas

propias de los datos publicados tales como las fechas de creacioacuten y actualizacioacuten el canal de

acceso la calidad del dato las condiciones de uso quieacuten lo produjo quieacuten lo distribuye etc

esto quiere decir que el metadato explica el dato en eacutel estaacute contenida toda la informacioacuten

relevante del dato

En la vida cotidiana la ceacutedula de ciudadaniacutea es el documento que contiene la informacioacuten

miacutenima de las personas (nombre sexo fecha de nacimiento GS RH estatura lugar de

nacimiento) esta informacioacuten permite que el ciudadano se identifique en cualquier lugar del

territorio nacional ante otras personas o autoridades que requieran conocerlo

Con los datos el tratamiento es similar el dato corresponde a la persona y el metadato

corresponde a la ceacutedula de ciudadaniacutea Asiacute como en Colombia todo ciudadano debe portar su

documento de identificacioacuten en el entorno Web todo dato debe portar su metadato en otras

palabras el metadato es parte integral del dato y existe entre ambos un viacutenculo inseparable

Los datos siempre deberaacuten publicarse con su respectivo metadato este uacuteltimo deberaacute contar

con informacioacuten completa y estandarizada que garantice que los usuarios encuentren

conozcan y utilicen los datos que producimos

Recuerde que la publicacioacuten del metadato es igual de importante que la publicacioacuten del

dato

iquestQueacute logro

Al publicar datos en conjunto con su metadato obtengo

Que mis datos sean encontrados y utilizados por maacutes usuarios Que los usuarios logren una correcta interpretacioacuten de la naturaleza calidad y

distribucioacuten de mis datos

Que mis datos sean entendidos evaluados y retroalimentados por maacutes usuarios

Que mis datos puedan ser compartidos e intercambiados entre sistemas

Que los motores de buacutesqueda encuentren mis datos publicados

Que las aplicaciones informaacuteticas procesen mejor y en mayor cantidad mis datos

1 ISO 19115-12014 410

7 Buenas praacutecticas para la publicacioacuten de datos

iexclRecomendaciones

Disponga metadatos suficientes que permitan a los usuarios tener la informacioacuten

correcta para decidir si el dato publicado satisface o no sus necesidades

Incluya en sus metadatos la ubicacioacuten del dato a traveacutes de la descripcioacuten del lugar

(localidad parque riacuteo etc) o a traveacutes de localizacioacuten por coordenadas geograacuteficas x e

y

Publique sus metadatos como una paacutegina Web HTML (HyperText Markup Language) o

simplemente como un archivo de texto separado

Disponga sus metadatos en el formato baacutesico de intercambio XML (Extensible Markup

Language) o en formatos estaacutendar maacutes sofisticados como JSON (JavaScript Object

Notation)

Al igual que los datos puede publicar los metadatos en muacuteltiples formatos desde la

misma URL

Tenga en cuenta que IDECA a partir de estaacutendares internacionales ha definido los

elementos miacutenimos que debe contener el metadato y que estos pueden ser utilizados

en la publicacioacuten de sus metadatos para facilitar el intercambio de estos

Figura 1 Secciones del Perfil de Metadatos IDECA

Para maacutes informacioacuten consulte la Cartilla para la creacioacuten de metadatos geograacuteficos en

Bogotaacute Distrito Capital

8 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo 1

En la siguiente URL se observa un metadato dispuesto para que los usuarios puedan consultar

faacutecilmente la informacioacuten asociada al dato publicado (Desarrollo Econoacutemico Rural Bogotaacute

DC)

httpmetadatosidecagovcogeoportalcatalogsearchresourcedetailspageuuid=A8AB6E

7A-55FB-40DA-85E1-0AA6B4FE6CE3

Ejemplo 2

En la siguiente URL estaacute disponible el metadato de un nivel de informacioacuten dispuesto por la

Unidad Administrativa Especial de Catastro Distrital ndash UAECD ndash en formato XML (legible por

aplicaciones informaacuteticas

httpmetadatosidecagovcogeoportalrestdocumentid=7BBE5F9AEE-1FBC-4C13-822F-

F2CE44AFDD7E7D

9 Buenas praacutecticas para la publicacioacuten de datos

2 Proporcionar una licencia en donde se especifiquen las limitaciones yo restricciones de acceso y uso de los datos

Una licencia entendida como las condiciones legales bajo las cuales estaacute disponible la obra2 es

un instrumento mediante el cual el propietario del dato autoriza o no a los usuarios para que

accedan a su contenido y tambieacuten lo faculta para su utilizacioacuten Existen diferentes tipos de

licencia para la distribucioacuten y explotacioacuten de obras y cuyo propoacutesito es regular las condiciones

de acceso y uso de los datos

Dependiendo el acceso autorizado a los datos las licencias pueden clasificarse en

Privativas o restrictivas Aquellas licencias conocidas como cerradas o no libres donde la mayoriacutea de las veces solo el autor puede usar la obra o en caso contrario se definen condiciones especiacuteficas que se deben cumplir para hacer uso de la informacioacuten

Semilibres Aquellas licencias que requieren autorizaciones para que los usuarios utilicen copien distribuyan o modifiquen su contenido

Libres o abiertas Aquellas licencias que en teacuterminos generales permiten usar distribuir y compartir los datos con muy pocas restricciones

Cuando un dato se publica acompantildeado de su licencia el usuario conoce las condiciones de

acceso uso y distribucioacuten de los datos que estaacute consumiendo de esta forma se garantiza que

los datos se distribuyan seguacuten los intereses de la entidad que los produce y se minimizan los

usos indebidos de los datos por parte de los usuarios

Ahora bien definir la licencia adecuada para cada dato dependeraacute de las condiciones que

establezca la entidad productora de este Revise los ejemplos y defina la licencia maacutes adecuada

para sus datos

Para maacutes informacioacuten consulte el Instructivo para la definicioacuten de licencias de datos

iquestQueacute logro

Que el usuario evaluacutee si puede o no usar mis datos

Que el usuario conozca las condiciones de acceso uso y manejo sobre los datos

disponibles

Dar claridad y potenciar el uso de los datos disponibles

Que el usuario de los reconocimientos respectivos a la entidad productora de los datos

Que se genere valor agregado sobre los datos disponibles en caso de asignar una

licencia abierta

2 Recuperado de httpsopendefinitionorgod21es

10 Buenas praacutecticas para la publicacioacuten de datos

iexclRecomendaciones

Identifique la licencia que mejor se acomode a su modelo de negocio Recuerde que

mediante la Ley 1712 de 2014 se reguloacute el derecho de acceso a la informacioacuten puacuteblica

y se incluyeron los principios de facilitacioacuten gratuidad y divulgacioacuten proactiva de la

informacioacuten

Disponga una licencia para su conjunto de datos a traveacutes de un enlace una copia

incorporada o dentro del metadato

Prefiera el uso de licencias abiertas de este modo sus datos seraacuten utilizados en una

mayor cantidad de productos servicios y mercados

Ejemplo 1

Mundialmente conocidas las licencias Creative Commons3 tienen como objetivo fortalecer a los

creadores para que sean quienes definan los teacuterminos en que sus obras pueden ser usadas queacute

derechos desean entregar y en queacute condiciones lo haraacuten A continuacioacuten encontraraacute los

enlaces de acceso para conocer las condiciones de cada una de las licencias disponibles

CC0 10 httpscreativecommonsorgpublicdomainzero10deedes

CC BY 40 httpscreativecommonsorglicensesby40

CC BY-SA 40 httpscreativecommonsorglicensesby-sa40

CC BY-ND 40 httpscreativecommonsorglicensesby-nd40

CC BY-NC 40 httpscreativecommonsorglicensesby-nc40

CC BY-NC-SA 40

httpscreativecommonsorglicensesby-nc-sa40

Ejemplo 2

Tambieacuten existen las licencias abiertas para datos Open Data Commons4 proporcionadas por la

mundialmente conocida red Open Knowledge Foundation Network ndash OKFN5 puede consultar

las condiciones ingresando a los siguientes enlaces

ODbL 10 httpsopendatacommonsorglicensesodblsummary

PDDL 10 httpsopendatacommonsorglicensespddlsummary

ODC-BY 10 httpsopendatacommonsorglicensesbysummary

3 httpcreativecommonsorg 4 httpopendatacommonsorg 5 httpsokfnorg

11 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo 3

El Mapa de referencia para Bogotaacute estaacute publicado en

httpswwwidecagovcoesserviciosmapa-de-referencia bajo las condiciones descritas en la

ldquoLICENCIA ABIERTA O CONDICIONES DE USO PARA DATOS ABIERTOS DE LA INFRAESTRUCTURA

INTEGRADA DE DATOS ESPACIALES PARA EL DISTRITO CAPITAL (IDECA)rdquo

httpswwwidecagovcoeslicenciaabierta

12 Buenas praacutecticas para la publicacioacuten de datos

3 Utilizar vocabularios estandarizados y reutilizables en la estructuracioacuten y publicacioacuten de los datos

Un vocabulario define los conceptos y las relaciones que se utilizan para describir y representar

un aacuterea de intereacutes6 Cuando se publican datos en la Web los vocabularios permiten integrar

datos cuando existen ambiguumledades en los teacuterminos utilizados en los diferentes conjuntos de

datos En la praacutectica un vocabulario es un conjunto de palabras que permiten a dos usuarios

comunicarse entre siacute La efectividad de dicha comunicacioacuten radica en que el significado de una

palabra para el usuario emisor sea el mismo que para el usuario receptor independientemente

de si utilizaron el mismo teacutermino

Cuando se habla de interoperabilidad de datos lo que se espera es que tanto los usuarios

como las aplicaciones informaacuteticas entiendan y comprendan la mayor cantidad de informacioacuten

que estaacuten consumiendo Para conseguir esto las comunidades de datos han identificado

vocablos palabras o teacuterminos de uso comuacuten los cuales cuentan con significados apropiados y

que actualmente se encuentran integrados y estructurados en diferentes estaacutendares

internacionales

Se recomienda utilizar vocabularios de este tipo para estandarizar los datos contenidos en la

informacioacuten publicada

iquestQueacute logro

Que mis datos sean consultados utilizados y reutilizados por maacutes usuarios Que se reduzca la ambiguumledad en la interpretacioacuten de mis datos Que mis datos sean interoperables Que mis datos sean procesados en entornos nacionales e internacionales Que mis datos puedan ser compartidos e intercambiados entre sistemas Que mis datos sean maacutes confiables

iexclRecomendaciones

Consulte normas locales o vocabularios internacionales para la estructuracioacuten7 de sus

datos

Apropie los vocabularios consultados y adapte sus datos a estos en los casos en que sea

posible

Incluya vocabularios ya definidos y reconocidos internacionalmente cuando vaya a

producir nuevos datos

6 httpswwww3orgstandardssemanticwebontology 7 Estructurar significa ajustar los datos a un esquema fijo

13 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo 1

A continuacioacuten se presentan algunos vocabularios internacionales que puede consultar y

apropiar para optimizar el intercambio de sus datos

Data Catalog Vocabulary (DCAT) httpswwww3orgTRvocab-dcatclass-catalog

FOAF Vocabulary Specification httpxmlnscomfoaf01

ISOTC 211 Geographic informationGeomatics Terminology

httpwwwisotc211orgTerminologyhtm

The RDF Data Cube Vocabulary httpswwww3orgTR2014REC-vocab-data-cube-20140116

ODRL Vocabulary amp Expression 22

httpswwww3orgTR2018REC-odrl-vocab-20180215

HTTP Vocabulary in RDF 10 httpswwww3orgTR2017NOTE-HTTP-in-RDF10-20170202

vCard Ontology - for describing People and Organizations

httpswwww3orgTRvcard-rdf

Ejemplo 2

En el contexto Nacional el Ministerio de Tecnologiacuteas de la Informacioacuten y las Comunicaciones ha

establecido el Lenguaje Comuacuten de Intercambio de como un instrumento de consulta que

contiene la definicioacuten de los elementos de datos conceptualizados por las entidades del

estado La consulta la puede realizar en httplenguajeminticgovco

14 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo 3

La especificacioacuten vCard disponible en httpswwww3orgTRvcard-rdf promueve un

vocabulario especiacutefico para describir personas y organizaciones

Uno de los vocablos que describe esta especificacioacuten es la ldquodireccioacuten de entregardquo llamado

dentro del vocabulario como ADR y definido como ldquola direccioacuten del objeto representado en

partes estructuradasrdquo

Ahora bien este vocabulario especifica los componentes de la direccioacuten de entrega para el

objeto asiacute el nombre del paiacutes la localidad el coacutedigo postal la regioacuten y la direccioacuten dada por

viacuteas (calles y carreras en el caso colombiano) Esto quiere decir que cualquiera de los

componentes descritos puede usarse como direccioacuten de entrega vaacutelida ya que son equivalentes

entre siacute

Aunque en el vocabulario la direccioacuten de entrega se llame ADR el usuario de la informacioacuten

entenderaacute que un nombre de paiacutes o un coacutedigo postal pueden interpretarse como ADR

15 Buenas praacutecticas para la publicacioacuten de datos

4 Anonimizar los datos de caraacutecter personal informacioacuten estadiacutestica informacioacuten indirectamente identificable e informacioacuten sensible o confidencial

Anonimizar es el proceso que impide la identificacioacuten de las unidades de estudio que son fuente

para los registros individuales de un conjunto8 de datos o maacutes claro es la aplicacioacuten de teacutecnicas

que permitan expresar un dato relativo a personas eliminando la referencia a su identidad9

Baacutesicamente lo que se busca es reducir los riesgos en el uso y procesamiento de datos

personales evitar la extraccioacuten de registros que identifican a una persona reducir la

combinacioacuten de dos o maacutes registros en una o varias bases de datos para identificar a una

persona y minimizar la deduccioacuten de datos personales partir de uno o varios datos publicados

iquestQueacute informacioacuten debo prioritariamente anonimizar

Datos personales Informacioacuten numeacuterica alfabeacutetica graacutefica fotograacutefica acuacutestica o

cualquier otro tipo susceptible de recogida registro tratamiento y transmisioacuten

concerniente a personas fiacutesicas identificadas o identificables (tales como nombre

apellidos estado civil sexo edad domicilio identificacioacuten personal nuacutemero de

teleacutefono etc)10

Informacioacuten sensible Informacioacuten considerada como estrictamente confidencial

Informacioacuten y caracteriacutesticas referentes a la edad procedencia salud raza religioacuten

ideologiacutea afiliacioacuten finanzas etc se consideran de caraacutecter sensible y requieren de

una proteccioacuten especial11

iquestQueacute logro

Garantizar que mis datos publicados cuentan con medidas de proteccioacuten de datos

personales

Eliminar de manera efectiva el riesgo de re-identificacioacuten

Evitar que el procesamiento de mis datos tenga consecuencias negativas para alguna

persona

Disponer muchos maacutes datos sin invadir la informacioacuten personal

iexclRecomendaciones

Implemente actividades de proteccioacuten de la privacidad de los datos personales antes

de publicarlos

Elimine cualquier identificador directo de la persona (nombre documento de

identidad etc)

8 httpswwwdanegovcofilessenlineamientosDSO_020_LIN_08pdf 9 httpdleraeesid=2jjMiRi 10 httpswwwdanegovcofilessenlineamientosDSO_020_LIN_08pdf 11 Ibidem

16 Buenas praacutecticas para la publicacioacuten de datos

Reemplace los identificadores directos por coacutedigos de referencia pseudoacutenimos

(algoritmos AES12 o un hash cifrado HMAC13) coacutedigos arbitrarios o aleatorios

Si reemplazando el identificador directo auacuten es faacutecil identificar a la persona elimine el

dato

Clasifique yo categorice los datos

Redondee los datos numeacutericos hacia arriba o hacia abajo

Evaluacutee antes durante y despueacutes de publicados los datos si la anonimizacioacuten de sus

datos es suficiente y evaluacutee regularmente los riesgos existentes

Para maacutes informacioacuten consulte los Lineamientos para la Anonimizacioacuten de micro datos

Ejemplo 1

Antes de publicar sus datos retire el identificador directo de la persona En este caso

reemplace en nuacutemero de documento que identifica al usuario y reemplaacutecelo por un

consecutivo

Usuario Beneficio Usuario Beneficio

80123456 Subsidio de vivienda Usuario 1 Subsidio de vivienda

51123456 Subsidio de alimentacioacuten Usuario 2 Subsidio de alimentacioacuten

19123456 Subsidio al adulto mayor Usuario 3 Subsidio al adulto mayor

53123456 Subsidio de desempleo Usuario 4 Subsidio de desempleo

Ejemplo 2

Clasifique o categorice sus datos En este ejemplo asigne rangos a la edad de manera tal que el

titular del registro no sea identificable por este dato

Usuario Edad Usuario Rango de edad

Usuario 1 11 antildeos Usuario 1 Entre 10 y 15 antildeos

Usuario 2 22 antildeos Usuario 2 Entre 20 y 25 antildeos

Usuario 3 36 antildeos Usuario 3 Entre 35 y 40 antildeos

Usuario 4 63 antildeos Usuario 4 Entre 60 y 65 antildeos

12 Advanced Encryption Standard puede consultar como ha sido implementado este algoritmo en httpsrevistasudistritaleducoojsindexphpTecnuraarticleview72368892 13 Hash-based Message Authentication Code puede consultar como se crea este cifrado en httpsdocsoraclecomcdE19253-01819-7804wanboottasks2-51indexhtml

17 Buenas praacutecticas para la publicacioacuten de datos

5 Publicar los datos en formatos estaacutendar reutilizables y legibles por aplicaciones informaacuteticas

Un formato puede ser definido como la estructura de un disco dividido en campos y pistas

seguacuten un determinado sistema operativo lo que permite almacenar en eacutel informacioacuten14

baacutesicamente es la forma en que se codifican los datos en un archivo informaacutetico

Actualmente conocemos formatos comunes de almacenamiento como el doc una extensioacuten

de Word que almacena texto y cuyo propietario es la compantildeiacutea Microsoft Pero iquestqueacute pasa si un

usuario quiere abrir un documento doc en un procesador de texto diferente a Word

difiacutecilmente va a poder conocer el contenido de dicho documento sin tener esta licencia

Lo que queremos lograr con la implementacioacuten de esta praacutectica es que todos los usuarios que

encuentren mis datos puedan accederlos sin necesidad de contar con un software o aplicacioacuten

informaacutetica especiacutefica

iquestQueacute logro

Que mis datos sean consultados utilizados y reutilizados por maacutes usuarios

Que mis datos sean maacutes interoperables y maacutes procesados

Que mis datos puedan ser extraiacutedos transformados y procesados por aplicaciones

informaacuteticas

Que mis datos puedan ser compartidos e intercambiados entre sistemas

Disminuir los costos y los tiempos en el uso y la transformacioacuten de mis datos

iexclRecomendaciones

Prefiera publicar su conjunto de datos en formatos abiertos o no propietario ya que

estos facilitan el uso re-uso y distribucioacuten de estos Se busca que un mayor nuacutemero de

aplicaciones informaacuteticas pueda extraer leer y transformar los datos generando mayor

uso y re-uso por los usuarios

Disponga sus datos en muacuteltiples formatos con el fin de incrementar el acceso a los

mismos Se busca que el mayor nuacutemero de usuarios pueda utilizar los datos sin tener

que transformarlos primero en su formato preferido

Utilice Web Services para mejorar el intercambio e interoperabilidad de los datos

publicados

14 httpdleraeessrvsearchm=30ampw=formato

18 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo 1

A continuacioacuten encontraraacute extensiones de formato propietario y no propietario prefiera para

la publicacioacuten de sus datos las extensiones de la derecha

FORMATO PROPIETARIO FORMATO NO PROPIETARIO

DOC GDB TXT ASCII Grid KML RDF

XLS DWG CSV GeoJSON DXF XML

PPT SHP JSON GML ODF

Ejemplo 2

Si no fue posible utilizar una extensioacuten de formato no propietario publique sus datos en una

variedad de formatos que le permita al usuario acceder a los datos desde diferentes

aplicaciones informaacuteticas

Ejemplo 3

Para publicar sus datos conozca diferentes tipos de Web Services que viajan en la red utilizando extensiones XML

SOAP httpswwww3orgTRsoap

REST httprestelksteinorg

WMS httpwwwopengeospatialorgstandardswms

WFS httpwwwopengeospatialorgstandardswfs

WCS httpwwwopengeospatialorgstandardswcs

19 Buenas praacutecticas para la publicacioacuten de datos

6 Proporcionar un diccionario de datos que facilite el uso e interpretacioacuten de los datos publicados

Un diccionario estaacute definido como un repertorio en forma de libro o en soporte electroacutenico en el

que se recogen seguacuten un orden determinado las palabras o expresiones de una o maacutes lenguas

o de una materia concreta acompantildeadas de su definicioacuten equivalencia o explicacioacuten15

especiacuteficamente en un diccionario de datos se encuentran los conceptos de los datos y sus

propiedades (atributos dominios asociaciones y operaciones) acompantildeados de una definicioacuten

en donde se identifica el propoacutesito alcance y campo de aplicacioacuten del dato publicado

Lograr que los usuarios de mis datos entiendan la informacioacuten que estaacute publicada le permitiraacute

decidir si satisfacen o no su necesidad y le facilitaraacute la decisioacuten para explotar lo datos

Para maacutes informacioacuten consulte el Instructivo Diccionario de Datos

iquestQueacute logro

Que mis datos sean consultados utilizados y reutilizados por maacutes usuarios

Que se eviten ambiguumledades en la interpretacioacuten de mis datos

Que mis datos publicados esteacuten unificados y consistentes

Que los usuarios comprendan mejor y dispongan de claridad sobre los conceptos de

mis datos

iexclRecomendaciones

Publique como miacutenimo un diccionario de datos que contenga la caracterizacioacuten del

conjunto de datos producidos por su entidad

Cree el diccionario de datos teniendo en cuenta como miacutenimo la siguiente informacioacuten

Nombre del atributo Nombre que identifica de manera clara un atributo

Definicioacuten Descripcioacuten del atributo

Tipo de dato Tipo de valor del atributo

Unidad de medida Expresa la unidad de medida del atributo

Dominio Determina si el atributo tiene asociado un dominio

15 httpdleraeesw=diccionario

20 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo

Para el conjunto de datos ldquoEstablecimientos Educativos en Bogotaacuterdquo publicariacuteamos un

diccionario de datos similar al siguiente

Nombre del atributo Definicioacuten Tipo de dato

Unidad de Medida

Dominio

Coacutedigo del establecimiento

Coacutedigo DANE asignado al Institucioacuten Educativa Decimal

Nombre del establecimiento

Nombre de la Institucioacuten Educativa Cadena de Caracteres

Aacuterea construida del establecimiento

Aacuterea construida de la Institucioacuten Educativa Decimal Metros

cuadrados

Sector

Clasificacioacuten asignada seguacuten la naturaleza juriacutedica la cual define las principales caracteriacutesticas que desde lo juriacutedico - administrativo y tiene que ver con el origen de su creacioacuten

Entero

EESector

No podriacuteamos olvidar detallar el dominio asociado

Atributo Nombre del Dominio Coacutedigo Definicioacuten

EESector

Oficial 1

Es una institucioacuten donde su naturaleza de servicio puacuteblico cultural y su funcioacuten social le es inherente cumpliendo con las disposiciones legales y estatutarias que las rigen donde sus rentas se conservan y se aplican debidamente

Privado 2

Es una institucioacuten constituida como persona juriacutedica de utilidad comuacuten donde sus rentas se conservan y se aplican debidamente y que en todo lo esencial se cumple con la voluntad de sus fundadores

21 Buenas praacutecticas para la publicacioacuten de datos

7 Acompantildear la publicacioacuten de los datos con enlaces a otros recursos

Un enlace es definido como una secuencia de caracteres que se utiliza como direccioacuten para

acceder a informacioacuten adicional16 maacutes sencillo puede definirse como una expresioacuten que

conecta una cierta informacioacuten con otra17Ahora bien un recurso se puede entender como

cualquier medio que satisfaga una necesidad por ejemplo datos servicios documentos o

software

En teacuterminos generales se sugiere que para facilitar al usuario la comprensioacuten de los datos

publicados se proporcionen recursos o documentos adicionales que puedan ser consultados

yo descargados traveacutes de enlaces o links de otro sitio Web

Dentro de los recursos adicionales que pueden publicarse para acompantildear el dato estaacuten los

procedimientos de captura del dato los cataacutelogos de objetos las especificaciones teacutecnicas los

documentos normativos los cataacutelogos de simbologiacutea los reportes de evaluacioacuten de calidad

entre otros

iquestQueacute logro

Mejorar la consulta utilizacioacuten y reutilizacioacuten de mis datos

Que los usuarios comprendan mejor mis datos

Que mis datos sean compartidos e intercambiados por un mayor nuacutemero de usuarios

iexclRecomendaciones

Disponga informacioacuten adicional de sus datos que le permita a los usuarios ampliar el

horizonte de las aplicaciones y funcionalidades en las que pueda utilizar y explotar del

dato

No olvide vincular o registrar esta informacioacuten en el metadato

16 httpdleraeesid=FTVRKyj 17 httpssistemascomenlacephp

22 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo 1

El ldquoMapa de Referencia para Bogotaacuterdquo publicado en httpswwwidecagovcoesserviciosmapa-de-referencia tiene publicados varios enlaces a otros recursos

Especificacioacuten teacutecnica para la elaboracioacuten del Mapa de Referencia para Bogotaacute DC V0318

Cataacutelogo de Objetos del Mapa de Referencia de Bogotaacute DC V 57

Cataacutelogo de Representacioacuten del Mapa de Referencia de Bogotaacute DC V30

Reporte de evaluacioacuten de calidad generado al Mapa de Referencia del Distrito Capital V1217

Ejemplo 2

La informacioacuten de los ldquohumedales de Bogotaacuterdquo publicada en

httpambientebogotagovcowebsdahumedales tiene publicados enlaces a otros recursos

o Gestioacuten de los humedales

o Poliacutetica de Humedales del Distrito Capital

o Normatividad

o Planes de Manejo Ambiental

o Comiteacute distrital de humedales documentos de consulta normatividad

23 Buenas praacutecticas para la publicacioacuten de datos

8 Depurar sus datos antes de publicarlos para garantizar su calidad y aumentar su confianza

La calidad estaacute definida como el conjunto de propiedades inherentes a algo que permiten

juzgar su valor18 para el caso que nos concierne este algo hace referencia al dato publicado

Ahora bien la calidad tambieacuten es entendida como la capacidad del dato publicado para

satisfacer los requerimientos y las necesidades de los usuarios respetando una serie de normas

y especificaciones establecidas

Actualmente existen muacuteltiples elementos de calidad de los datos que identifican las cualidades

de estos sin embargo en este aparte citaremos los elementos principales que usted o su

entidad deben tener en cuenta para publicar sus datos con un estaacutendar miacutenimo de calidad

Para maacutes informacioacuten consulte el Procedimiento para evaluar y reportar la calidad de

los datos espaciales

iquestQueacute logro

Que mis datos sean consultados utilizados y reutilizados por maacutes usuarios

Que los usuarios hablen bien de mis datos

Que mis datos sean maacutes interoperables y maacutes procesados

Que mis datos sean maacutes compartidos

Que mis datos sean maacutes confiables

Recomendacioacuten 1

Establezca si dentro de su conjunto de datos existen capos vaciacuteos o nulos con informacioacuten

descontextualizada sobrante o duplicada Si existen compleacutetelos o elimiacutenelos seguacuten

corresponda antes de la publicacioacuten El elemento de calidad asociado se denomina ldquototalidadrdquo

Localidad Atendidos Localidad Atendidos

Suba 200 Suba 200

Suba 200 Tunjuelito 500

Ameacutericas 100

850

Tunjuelito 500

18 httpdleraeesid=6nVpk8P|6nXVL1Z

Campo duplicado

Campo inconsistente

Campo vaciacuteo

24 Buenas praacutecticas para la publicacioacuten de datos

Recomendacioacuten 2

Identifique y transforme si es necesario los datos que hayan sido registrados en un formato

diferente al establecido para su conjunto de datos Es decir estandarice el formato de salida

del dato que va a publicar El elemento de calidad asociado se denomina ldquoconsistencia de

formatordquo

Localidad Atendidos Localidad Atendidos

Suba 200 Suba 200

Tunjuelito 5008 Tunjuelito 500

Fontiboacuten 40 Fontiboacuten 430

Tunjuelito 500 Tunjuelito 500

Recomendacioacuten 3

Si sus datos tienen alguacuten tipo de clasificacioacuten o rangos previo a la publicacioacuten valide que estos

se hayan registrado correctamente El elemento de calidad asociado se denomina ldquoexactitud de

clasificacioacutenrdquo

Geacutenero Edad Rango de Edad Geacutenero Edad Rango de Edad

Femenino 5 0 lt Edad le 10 Femenino 5 0 lt Edad le 10

Masculino 15 0 lt Edad le 10 Masculino 15 10 lt Edad le 20

Femenino 35 40 lt Edad le 50 Femenino 35 30 lt Edad le 40

Recomendacioacuten 4

Si sus datos representan atributos cuantitativos verifique antes de la publicacioacuten que estos

correspondan a valores conocidos como verdaderos El elemento de calidad asociado se

denomina ldquoexactitud de atributos cuantitativosrdquo

Localidad Mes Temperatura Localidad Mes Temperatura

Chapinero Enero 7degC Chapinero Enero 7degC

Suba Agosto -15degC Suba Agosto 15degC

Tunjuelito Abril 60degC Tunjuelito Abril 16degC

Clasificacioacuten inconsistente

Formato inconsistente

Valor inconsistente

25 Buenas praacutecticas para la publicacioacuten de datos

Recomendacioacuten 5

Si los datos a publicar tienen asociadas fechas de captura o recoleccioacuten de informacioacuten (Por

ejemplo registro de incidentes registro de vacunacioacuten conteo de vehiacuteculos etc) valide que

las fechas registradas coincidan con la fecha del evento capturado El elemento de calidad

asociado se denomina ldquoexactitud de la medicioacuten del tiempordquo

Precipitacioacuten (mm) Fecha de registro Precipitacioacuten (mm) Fecha de registro

00 20580101 00 20180101

01 20180102 01 20180102

126 20510403 126 20180103

20 20180104 20 20180104

Recomendacioacuten 6

Cuando sus datos reflejen informacioacuten determinada por un orden de eventos garantice antes

de la publicacioacuten que este orden sea el adecuado El elemento de calidad asociado se

denomina ldquoconsistencia temporalrdquo

Usuario Escolaridad Periodo de Estudio Usuario Escolaridad Periodo de Estudio

Usuario 1 Preescolar 20030101 ndash 20051231 Usuario 1 Preescolar 20030101 ndash 20051231

Usuario 1 Primaria 20030101 ndash 20101231 Usuario 1 Primaria 20060101 ndash 20101231

Usuario 1 Secundaria 20060101 ndash 20163112 Usuario 1 Secundaria 20110101 ndash 20143112

Usuario 1 Media 20150101 - 20163112 Usuario 1 Media 20150101 - 20163112

Recomendacioacuten 7

Si sus datos incluyen alguna ubicacioacuten (direccioacuten lugar coordenadas) verifique que esta

corresponda a la ubicacioacuten real El elemento de calidad asociado se denomina ldquoexactitud

posicionalrdquo

Eventos Deportivos Lugar Eventos Deportivos Lugar

Evento 1 AK 30 25 90 Evento 1 AK 30 25 90

Evento 2 AC 63 215 20 Evento 2 Parque La Florida

Evento 3 Parque Simoacuten Boliacutevar Evento 3 Parque Simoacuten Boliacutevar

Fecha

inconsistente

Fechas no secuenciales

Lugar inexistente

26 Buenas praacutecticas para la publicacioacuten de datos

9 Incorporar el componente geograacutefico en los datos publicados para optimizar su comprensioacuten uso re-uso y visualizacioacuten

El espacio geograacutefico es un punto de la superficie terrestre que se vea afectado o que afecte de

alguna manera a la humanidad19 Este punto de la superficie puede ser la direccioacuten de una

institucioacuten educativa la ubicacioacuten de un centro de vacunacioacuten el lugar donde se miden las

variaciones de traacutensito en la ciudad los parques de Bogotaacute el edificio en donde se llevan a

cabo los traacutemites de una entidad etc

Los datos que usted captura o recolecta en su quehacer misional siempre estaacuten asociados a un

espacio geograacutefico por lo tanto este componente deberiacutea ser incluido en los datos publicados

Tenga en cuenta que el componente geograacutefico lo puede incorporar incluyendo una ubicacioacuten

asociada a una direccioacuten a un lugar a una localidad a un barrio al nombre de un

establecimiento puacuteblicamente reconocido o a cualquier punto que permita al usuario

identificar la localizacioacuten del dato publicado

iquestQueacute logro

Ampliar el espectro de usuarios que consultan utilizan y reutilizan mis datos

Que mis datos sean maacutes interoperables y maacutes procesados

Que mis datos sean puedan compartir en maacutes plataformas

Que los usuarios puedan visualizar mis datos en un mapa

iexclRecomendaciones

Disponga sus datos agregando un atributo de ubicacioacuten como direcciones coordenadas o

lugares geograacuteficos

Ejemplo 1

Incluya direcciones que permitan localizar espacialmente sus datos

Programa Direccioacuten

Registro de atencioacuten a la ciudadaniacutea CL 138 108 16

Centro de autocuidado KR 18 D 77 A 11 SUR

Familias con un nintildeo en cupos cofinanciados CL 70 A SUR 20 46

Centro de autocuidado KR 18 D 73 A 33 SUR

19 httpenciclopediabanrepculturalorgindexphptitle=Espacio_geogrC3A1fico

27 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo 2

Utilice coordenadas para indicar la ubicacioacuten de sus datos

EPS Coordenada X Coordenada Y

EPS Convida 9087496334 1051342164

Capital Salud EPS 986321006 954875808

EPS Famisanar 9742508812 8837031501

Aliansalud EPS 9716943356 9659706891

Salud Total EPS 9215624975 9625189518

Tenga en cuenta que para publicar datos con coordenadas tendraacute que incluir dentro

de su metadato el Sistema de referencia empleado

MAGNA ndash SIRGAS EPSG 4686 httpsepsgio4686

MAGNA ndash SIRGAS EPSG 3116 httpsepsgio3116

MAGNA ndash BOGOTAacute SR-ORG 7458 httpspatialreferenceorgrefsr-org7458

Ejemplo 3

Tambieacuten puede incluir lugares geograacuteficos descriptivos asiacute

Usuario Vacunado Lugar de Vacunacioacuten

Usuario 1 BOSQUE IZQUIERDO

Usuario 2 LAGUNITAS URBANO

Usuario 3 LA CAPUCHINA

Usuario 4 SAN JOSE SUR

Usuario 5 VENECIA

28 Buenas praacutecticas para la publicacioacuten de datos

10 Asignar un identificador uacutenico que permita aumentar la consulta uso e interoperabilidad del dato publicado

Considere un identificador uacutenico como un texto que permite identificar inequiacutevocamente el

dato publicado Si usted va a publicar un dato buscando que este sea reutilizado por los

usuarios y por su propia entidad asignar un identificador facilitaraacute el descubrimiento y la

citacioacuten del dato a traveacutes del tiempo independientemente del estado la disponibilidad o el

formato de este

En la vida cotidiana mediante la ceacutedula de ciudadaniacutea se asigna a cada ciudadano un nuacutemero

de identificacioacuten uacutenico y a traveacutes de este identificador el ciudadano es reconocido a lo largo de

su vida e incluso despueacutes de su muerte por otras personas yo autoridades En el mundo de la

informacioacuten cada dato deberiacutea viajar con un identificador uacutenico que le permita ser encontrado

y reconocido faacutecilmente entre los demaacutes datos

Ahora bien si usted o su entidad publican continuamente datos establecer un sistema de

identificacioacuten comuacuten le permitiraacute identificar raacutepidamente los datos y los haraacute comparables por

cualquier usuario de manera confiable Esta condicioacuten es previa para lograr una correcta

gestioacuten y reutilizacioacuten de sus datos

iquestQueacute logro

Ampliar el espectro de usuarios que consultan utilizan y reutilizan mis datos

Que mis datos sean maacutes interoperables y maacutes procesados

Que mis datos sean compartidos en maacutes plataformas

Que mis datos puedan vincularse a otros datos en el entorno Web

Que mis datos sean encontrados usados y citados inequiacutevocamente

Garantizar y monitorear la reutilizacioacuten de mis datos

Reducir del uso erroacuteneo de mis datos

iexclRecomendaciones

Establezca un sistema de identificacioacuten comuacuten para los datos que va a publicar

Utilice siempre el identificador asignado para publicar sus datos

29 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo

IDECA ha dispuesto el Sistema de Registro de Iacutetems geograacuteficos

httpgeoitemsidecagovcogeoitemsano una herramienta web desarrollada para la

creacioacuten aprobacioacuten publicacioacuten y mantenimiento de iacutetems geograacuteficos que permite la

asignacioacuten concertada de identificadores y significados uacutenicos que contribuyen a la definicioacuten

de un lenguaje comuacuten para el desarrollo de nuevos sistema de informacioacuten en el Distrito

garantizando con ello su fiabilidad e interoperabilidad Adicionalmente permite almacenar

descripciones de la informacioacuten oficial producida e identificar su respectivo custodio jugando

asiacute un papel importante en el control y seguimiento de la produccioacuten de informacioacuten

geograacutefica

Este sistema asigna un identificador uacutenico a cada uno de los iacutetems creados Dentro de los iacutetems

publicados se reconoce el ID 65 como unidad de planeamiento y siempre que se hace

referencia a este objeto es suficiente nombrarlo asiacute para entender que se habla de ldquoUnidades

territoriales de anaacutelisis planeamiento y gestioacuten que tienen como propoacutesito definir y precisar el

planeamiento del suelo urbano de expansioacuten y ruralrdquo

30 Buenas praacutecticas para la publicacioacuten de datos

OBTENGA EL MAacuteS ALTO NIVEL EN PUBLICACIOacuteN DE DATOS

Hasta aquiacute hemos publicado las que consideramos como mejores praacutecticas de publicacioacuten de datos Ahora usted como publicador o como entidad debe evaluar si sus datos se estaacuten disponiendo con los maacutes altos y mejores estaacutendares de publicacioacuten

Lo invitamos a que valide en queacute nivel de publicacioacuten se encuentra su entidad teniendo en cuenta el siguiente listado

Nivel Baacutesico

En este nivel se encuentran aquellas entidades que publican sus datos en formatos estaacutendar y reutilizables (praacutectica 5) que integran a la publicacioacuten sus respectivos metadatos (praacutectica 1) y que acompantildean la publicacioacuten con una licencia asociada (praacutectica 2)

Nivel Intermedio

Este nivel lo alcanzan las entidades que superando el nivel baacutesico disponen un mayor volumen de informacioacuten gracias a que anonimizan sus datos (praacutectica 4) implementan medidas de calidad que aumentan la confianza en sus datos (praacutectica 8) incorporan el componente geograacutefico proporcionando valor agregado a sus datos (praacutectica 9) y publican un diccionario de datos que facilita la interpretacioacuten de los datos publicados (praacutectica 6)

Nivel Avanzado

Las entidades que superando el nivel intermedio utilizan vocabularios estandarizados en sus nuevas publicaciones (praacutectica 3) acompantildean la publicacioacuten de sus datos con enlaces a otros recursos (praacutectica 7) y asignan un identificador uacutenico para dato logrando asiacute aumentar su descubrimiento y reutilizacioacuten (praacutectica 10)

31 Buenas praacutecticas para la publicacioacuten de datos

REFERENCIAS

Bernadette Farias Loacutescio Caroline Burle Newton Calegari W3C Data on the Web Best

Practices 31 de enero de 2017 W3C Recommendation URL httpswwww3orgTRdwbp

Bernadette Hyland Ghislain Auguste Atemezing Boris Villazoacuten-Terrazas W3C Best Practices

for Publishing Linked Data 9 de enero de 2014 W3C Note URL httpswwww3orgTRld-bp

Dan Brickley Libby Miller FOAF project FOAF Vocabulary Specification 099 (Paddington

Edition) 14 de enero de 2014 URL httpxmlnscomfoafspec

Dublin Core metadata initiative DCMI Metadata Terms 14 de junio de 2012 DCMI

Recommendation URL httpdublincoreorgdocumentsdcmi-terms

Fadi Maali John Erickson W3C Data Catalog Vocabulary (DCAT) 16 de enero de 2014 W3C

Recommendation URL httpswwww3orgTRvocab-dcat

ISO 19115-12014 (E) Geographic information ndash Metadata Part1 Fundamentals 01 de abril de

2014 International Standard

ISO 191262009 (E) Geographic information -- Feature concept dictionaries and registers

noviembre de 2009 International Standard

ISO 191572013 (E) Geographic information ndash Data quality 15 de diciembre de 2013

International Standard

Jeremy Tandy Payam Barnaghi Linda van den Brink W3C Spatial Data on the Web Best

Practices 5 de enero 2017 W3C Note URL httpswwww3orgTRsdw-bp

T Berners-Lee R Fielding L Masinter IETF Uniform Resource Identifier (URI) Generic Syntax

Enero de 2005 Internet Standard URL httpstoolsietforghtmlrfc3986

World Wide Web Foundation Open Data Barometer URL httpopendatabarometerorg

W3C OWL Working Group W3C OWL 2 Web Ontology Language Document Overview (Second

Edition) 11 de diciembre de 2012 W3C Recommendation URL httpswwww3orgTRowl2-

overview

W3org Semantic Web - W3C URL httpswwww3orgstandardssemanticweb Consultado

el 12 de septiembre de 2018

Page 5: PARA LA PUBLICACIÓN DE DATOSideca.gov.co/.../files/documentacion/buenaspracticaspublicaciondat… · La obtención de datos la realiza cada entidad en el desarrollo de sus actividades

5 Buenas praacutecticas para la publicacioacuten de datos

OBJETIVO

Promover en las entidades de la Administracioacuten Distrital y sus responsables la apropiacioacuten y

adopcioacuten de las mejores praacutecticas de publicacioacuten de datos con el fin de aumentar el valor en la

informacioacuten producida dentro de su quehacer institucional

AUDIENCIA

Este documento estaacute dirigido a las entidades y personas responsables de la Administracioacuten

Distrital que publican o desean publicar datos oficiales de Bogotaacute a traveacutes de cualquier

plataforma de datos

ALCANCE

Las mejores praacutecticas expuestas en este documento estaacuten encaminadas a que los datos

publicados a traveacutes de plataformas oficiales cumplan con unos requisitos miacutenimos de calidad

documentacioacuten interoperabilidad y licenciamiento dentro del proceso de publicacioacuten

Buscamos con esta guiacutea de buenas praacutecticas garantizar la apropiacioacuten de cuatro principios

Que los datos sean descubiertos es decir que cualquier usuario en el entorno Web los

pueda encontrar faacutecilmente

Que los datos sean accesibles quiere decir que no presenten restricciones de acceso ni

que se encuentren cifrados

Que los datos sean interoperables en otras palabras que sean publicados en formatos

estandarizados que permitan ser procesados por cualquier software

Que los datos sean reutilizables es decir que estos sean utilizados en la mayor cantidad

de productos servicios y mercados

Debe tenerse en cuenta que IDECA expone en este documento las mejores praacutecticas de

publicacioacuten de datos identificadas con base a la experiencia adquirida en la disposicioacuten datos

de los uacuteltimos antildeos sin embargo existe una amplia gama de otras buenas praacutecticas de

publicacioacuten que no han sido incluidas en el presente texto y en consecuencia se invita al lector

a apropiarse de las praacutecticas expuestas y a dejar abierta la posibilidad de complementar la

informacioacuten presentada con otras fuentes

6 Buenas praacutecticas para la publicacioacuten de datos

BUENAS PRAacuteCTICAS PARA LA PUBLICACIOacuteN DE DATOS

1 Proporcionar metadatos asociados con los datos publicados Estos metadatos permitiraacuten conocer las caracteriacutesticas de los datos y deberaacuten ser interpretables tanto por usuarios como por aplicaciones informaacuteticas

Un metadato entendido como la informacioacuten acerca de un recurso1 es un dato con muchos

elementos que le permiten al usuario conocer desde la visioacuten del productor las caracteriacutesticas

propias de los datos publicados tales como las fechas de creacioacuten y actualizacioacuten el canal de

acceso la calidad del dato las condiciones de uso quieacuten lo produjo quieacuten lo distribuye etc

esto quiere decir que el metadato explica el dato en eacutel estaacute contenida toda la informacioacuten

relevante del dato

En la vida cotidiana la ceacutedula de ciudadaniacutea es el documento que contiene la informacioacuten

miacutenima de las personas (nombre sexo fecha de nacimiento GS RH estatura lugar de

nacimiento) esta informacioacuten permite que el ciudadano se identifique en cualquier lugar del

territorio nacional ante otras personas o autoridades que requieran conocerlo

Con los datos el tratamiento es similar el dato corresponde a la persona y el metadato

corresponde a la ceacutedula de ciudadaniacutea Asiacute como en Colombia todo ciudadano debe portar su

documento de identificacioacuten en el entorno Web todo dato debe portar su metadato en otras

palabras el metadato es parte integral del dato y existe entre ambos un viacutenculo inseparable

Los datos siempre deberaacuten publicarse con su respectivo metadato este uacuteltimo deberaacute contar

con informacioacuten completa y estandarizada que garantice que los usuarios encuentren

conozcan y utilicen los datos que producimos

Recuerde que la publicacioacuten del metadato es igual de importante que la publicacioacuten del

dato

iquestQueacute logro

Al publicar datos en conjunto con su metadato obtengo

Que mis datos sean encontrados y utilizados por maacutes usuarios Que los usuarios logren una correcta interpretacioacuten de la naturaleza calidad y

distribucioacuten de mis datos

Que mis datos sean entendidos evaluados y retroalimentados por maacutes usuarios

Que mis datos puedan ser compartidos e intercambiados entre sistemas

Que los motores de buacutesqueda encuentren mis datos publicados

Que las aplicaciones informaacuteticas procesen mejor y en mayor cantidad mis datos

1 ISO 19115-12014 410

7 Buenas praacutecticas para la publicacioacuten de datos

iexclRecomendaciones

Disponga metadatos suficientes que permitan a los usuarios tener la informacioacuten

correcta para decidir si el dato publicado satisface o no sus necesidades

Incluya en sus metadatos la ubicacioacuten del dato a traveacutes de la descripcioacuten del lugar

(localidad parque riacuteo etc) o a traveacutes de localizacioacuten por coordenadas geograacuteficas x e

y

Publique sus metadatos como una paacutegina Web HTML (HyperText Markup Language) o

simplemente como un archivo de texto separado

Disponga sus metadatos en el formato baacutesico de intercambio XML (Extensible Markup

Language) o en formatos estaacutendar maacutes sofisticados como JSON (JavaScript Object

Notation)

Al igual que los datos puede publicar los metadatos en muacuteltiples formatos desde la

misma URL

Tenga en cuenta que IDECA a partir de estaacutendares internacionales ha definido los

elementos miacutenimos que debe contener el metadato y que estos pueden ser utilizados

en la publicacioacuten de sus metadatos para facilitar el intercambio de estos

Figura 1 Secciones del Perfil de Metadatos IDECA

Para maacutes informacioacuten consulte la Cartilla para la creacioacuten de metadatos geograacuteficos en

Bogotaacute Distrito Capital

8 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo 1

En la siguiente URL se observa un metadato dispuesto para que los usuarios puedan consultar

faacutecilmente la informacioacuten asociada al dato publicado (Desarrollo Econoacutemico Rural Bogotaacute

DC)

httpmetadatosidecagovcogeoportalcatalogsearchresourcedetailspageuuid=A8AB6E

7A-55FB-40DA-85E1-0AA6B4FE6CE3

Ejemplo 2

En la siguiente URL estaacute disponible el metadato de un nivel de informacioacuten dispuesto por la

Unidad Administrativa Especial de Catastro Distrital ndash UAECD ndash en formato XML (legible por

aplicaciones informaacuteticas

httpmetadatosidecagovcogeoportalrestdocumentid=7BBE5F9AEE-1FBC-4C13-822F-

F2CE44AFDD7E7D

9 Buenas praacutecticas para la publicacioacuten de datos

2 Proporcionar una licencia en donde se especifiquen las limitaciones yo restricciones de acceso y uso de los datos

Una licencia entendida como las condiciones legales bajo las cuales estaacute disponible la obra2 es

un instrumento mediante el cual el propietario del dato autoriza o no a los usuarios para que

accedan a su contenido y tambieacuten lo faculta para su utilizacioacuten Existen diferentes tipos de

licencia para la distribucioacuten y explotacioacuten de obras y cuyo propoacutesito es regular las condiciones

de acceso y uso de los datos

Dependiendo el acceso autorizado a los datos las licencias pueden clasificarse en

Privativas o restrictivas Aquellas licencias conocidas como cerradas o no libres donde la mayoriacutea de las veces solo el autor puede usar la obra o en caso contrario se definen condiciones especiacuteficas que se deben cumplir para hacer uso de la informacioacuten

Semilibres Aquellas licencias que requieren autorizaciones para que los usuarios utilicen copien distribuyan o modifiquen su contenido

Libres o abiertas Aquellas licencias que en teacuterminos generales permiten usar distribuir y compartir los datos con muy pocas restricciones

Cuando un dato se publica acompantildeado de su licencia el usuario conoce las condiciones de

acceso uso y distribucioacuten de los datos que estaacute consumiendo de esta forma se garantiza que

los datos se distribuyan seguacuten los intereses de la entidad que los produce y se minimizan los

usos indebidos de los datos por parte de los usuarios

Ahora bien definir la licencia adecuada para cada dato dependeraacute de las condiciones que

establezca la entidad productora de este Revise los ejemplos y defina la licencia maacutes adecuada

para sus datos

Para maacutes informacioacuten consulte el Instructivo para la definicioacuten de licencias de datos

iquestQueacute logro

Que el usuario evaluacutee si puede o no usar mis datos

Que el usuario conozca las condiciones de acceso uso y manejo sobre los datos

disponibles

Dar claridad y potenciar el uso de los datos disponibles

Que el usuario de los reconocimientos respectivos a la entidad productora de los datos

Que se genere valor agregado sobre los datos disponibles en caso de asignar una

licencia abierta

2 Recuperado de httpsopendefinitionorgod21es

10 Buenas praacutecticas para la publicacioacuten de datos

iexclRecomendaciones

Identifique la licencia que mejor se acomode a su modelo de negocio Recuerde que

mediante la Ley 1712 de 2014 se reguloacute el derecho de acceso a la informacioacuten puacuteblica

y se incluyeron los principios de facilitacioacuten gratuidad y divulgacioacuten proactiva de la

informacioacuten

Disponga una licencia para su conjunto de datos a traveacutes de un enlace una copia

incorporada o dentro del metadato

Prefiera el uso de licencias abiertas de este modo sus datos seraacuten utilizados en una

mayor cantidad de productos servicios y mercados

Ejemplo 1

Mundialmente conocidas las licencias Creative Commons3 tienen como objetivo fortalecer a los

creadores para que sean quienes definan los teacuterminos en que sus obras pueden ser usadas queacute

derechos desean entregar y en queacute condiciones lo haraacuten A continuacioacuten encontraraacute los

enlaces de acceso para conocer las condiciones de cada una de las licencias disponibles

CC0 10 httpscreativecommonsorgpublicdomainzero10deedes

CC BY 40 httpscreativecommonsorglicensesby40

CC BY-SA 40 httpscreativecommonsorglicensesby-sa40

CC BY-ND 40 httpscreativecommonsorglicensesby-nd40

CC BY-NC 40 httpscreativecommonsorglicensesby-nc40

CC BY-NC-SA 40

httpscreativecommonsorglicensesby-nc-sa40

Ejemplo 2

Tambieacuten existen las licencias abiertas para datos Open Data Commons4 proporcionadas por la

mundialmente conocida red Open Knowledge Foundation Network ndash OKFN5 puede consultar

las condiciones ingresando a los siguientes enlaces

ODbL 10 httpsopendatacommonsorglicensesodblsummary

PDDL 10 httpsopendatacommonsorglicensespddlsummary

ODC-BY 10 httpsopendatacommonsorglicensesbysummary

3 httpcreativecommonsorg 4 httpopendatacommonsorg 5 httpsokfnorg

11 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo 3

El Mapa de referencia para Bogotaacute estaacute publicado en

httpswwwidecagovcoesserviciosmapa-de-referencia bajo las condiciones descritas en la

ldquoLICENCIA ABIERTA O CONDICIONES DE USO PARA DATOS ABIERTOS DE LA INFRAESTRUCTURA

INTEGRADA DE DATOS ESPACIALES PARA EL DISTRITO CAPITAL (IDECA)rdquo

httpswwwidecagovcoeslicenciaabierta

12 Buenas praacutecticas para la publicacioacuten de datos

3 Utilizar vocabularios estandarizados y reutilizables en la estructuracioacuten y publicacioacuten de los datos

Un vocabulario define los conceptos y las relaciones que se utilizan para describir y representar

un aacuterea de intereacutes6 Cuando se publican datos en la Web los vocabularios permiten integrar

datos cuando existen ambiguumledades en los teacuterminos utilizados en los diferentes conjuntos de

datos En la praacutectica un vocabulario es un conjunto de palabras que permiten a dos usuarios

comunicarse entre siacute La efectividad de dicha comunicacioacuten radica en que el significado de una

palabra para el usuario emisor sea el mismo que para el usuario receptor independientemente

de si utilizaron el mismo teacutermino

Cuando se habla de interoperabilidad de datos lo que se espera es que tanto los usuarios

como las aplicaciones informaacuteticas entiendan y comprendan la mayor cantidad de informacioacuten

que estaacuten consumiendo Para conseguir esto las comunidades de datos han identificado

vocablos palabras o teacuterminos de uso comuacuten los cuales cuentan con significados apropiados y

que actualmente se encuentran integrados y estructurados en diferentes estaacutendares

internacionales

Se recomienda utilizar vocabularios de este tipo para estandarizar los datos contenidos en la

informacioacuten publicada

iquestQueacute logro

Que mis datos sean consultados utilizados y reutilizados por maacutes usuarios Que se reduzca la ambiguumledad en la interpretacioacuten de mis datos Que mis datos sean interoperables Que mis datos sean procesados en entornos nacionales e internacionales Que mis datos puedan ser compartidos e intercambiados entre sistemas Que mis datos sean maacutes confiables

iexclRecomendaciones

Consulte normas locales o vocabularios internacionales para la estructuracioacuten7 de sus

datos

Apropie los vocabularios consultados y adapte sus datos a estos en los casos en que sea

posible

Incluya vocabularios ya definidos y reconocidos internacionalmente cuando vaya a

producir nuevos datos

6 httpswwww3orgstandardssemanticwebontology 7 Estructurar significa ajustar los datos a un esquema fijo

13 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo 1

A continuacioacuten se presentan algunos vocabularios internacionales que puede consultar y

apropiar para optimizar el intercambio de sus datos

Data Catalog Vocabulary (DCAT) httpswwww3orgTRvocab-dcatclass-catalog

FOAF Vocabulary Specification httpxmlnscomfoaf01

ISOTC 211 Geographic informationGeomatics Terminology

httpwwwisotc211orgTerminologyhtm

The RDF Data Cube Vocabulary httpswwww3orgTR2014REC-vocab-data-cube-20140116

ODRL Vocabulary amp Expression 22

httpswwww3orgTR2018REC-odrl-vocab-20180215

HTTP Vocabulary in RDF 10 httpswwww3orgTR2017NOTE-HTTP-in-RDF10-20170202

vCard Ontology - for describing People and Organizations

httpswwww3orgTRvcard-rdf

Ejemplo 2

En el contexto Nacional el Ministerio de Tecnologiacuteas de la Informacioacuten y las Comunicaciones ha

establecido el Lenguaje Comuacuten de Intercambio de como un instrumento de consulta que

contiene la definicioacuten de los elementos de datos conceptualizados por las entidades del

estado La consulta la puede realizar en httplenguajeminticgovco

14 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo 3

La especificacioacuten vCard disponible en httpswwww3orgTRvcard-rdf promueve un

vocabulario especiacutefico para describir personas y organizaciones

Uno de los vocablos que describe esta especificacioacuten es la ldquodireccioacuten de entregardquo llamado

dentro del vocabulario como ADR y definido como ldquola direccioacuten del objeto representado en

partes estructuradasrdquo

Ahora bien este vocabulario especifica los componentes de la direccioacuten de entrega para el

objeto asiacute el nombre del paiacutes la localidad el coacutedigo postal la regioacuten y la direccioacuten dada por

viacuteas (calles y carreras en el caso colombiano) Esto quiere decir que cualquiera de los

componentes descritos puede usarse como direccioacuten de entrega vaacutelida ya que son equivalentes

entre siacute

Aunque en el vocabulario la direccioacuten de entrega se llame ADR el usuario de la informacioacuten

entenderaacute que un nombre de paiacutes o un coacutedigo postal pueden interpretarse como ADR

15 Buenas praacutecticas para la publicacioacuten de datos

4 Anonimizar los datos de caraacutecter personal informacioacuten estadiacutestica informacioacuten indirectamente identificable e informacioacuten sensible o confidencial

Anonimizar es el proceso que impide la identificacioacuten de las unidades de estudio que son fuente

para los registros individuales de un conjunto8 de datos o maacutes claro es la aplicacioacuten de teacutecnicas

que permitan expresar un dato relativo a personas eliminando la referencia a su identidad9

Baacutesicamente lo que se busca es reducir los riesgos en el uso y procesamiento de datos

personales evitar la extraccioacuten de registros que identifican a una persona reducir la

combinacioacuten de dos o maacutes registros en una o varias bases de datos para identificar a una

persona y minimizar la deduccioacuten de datos personales partir de uno o varios datos publicados

iquestQueacute informacioacuten debo prioritariamente anonimizar

Datos personales Informacioacuten numeacuterica alfabeacutetica graacutefica fotograacutefica acuacutestica o

cualquier otro tipo susceptible de recogida registro tratamiento y transmisioacuten

concerniente a personas fiacutesicas identificadas o identificables (tales como nombre

apellidos estado civil sexo edad domicilio identificacioacuten personal nuacutemero de

teleacutefono etc)10

Informacioacuten sensible Informacioacuten considerada como estrictamente confidencial

Informacioacuten y caracteriacutesticas referentes a la edad procedencia salud raza religioacuten

ideologiacutea afiliacioacuten finanzas etc se consideran de caraacutecter sensible y requieren de

una proteccioacuten especial11

iquestQueacute logro

Garantizar que mis datos publicados cuentan con medidas de proteccioacuten de datos

personales

Eliminar de manera efectiva el riesgo de re-identificacioacuten

Evitar que el procesamiento de mis datos tenga consecuencias negativas para alguna

persona

Disponer muchos maacutes datos sin invadir la informacioacuten personal

iexclRecomendaciones

Implemente actividades de proteccioacuten de la privacidad de los datos personales antes

de publicarlos

Elimine cualquier identificador directo de la persona (nombre documento de

identidad etc)

8 httpswwwdanegovcofilessenlineamientosDSO_020_LIN_08pdf 9 httpdleraeesid=2jjMiRi 10 httpswwwdanegovcofilessenlineamientosDSO_020_LIN_08pdf 11 Ibidem

16 Buenas praacutecticas para la publicacioacuten de datos

Reemplace los identificadores directos por coacutedigos de referencia pseudoacutenimos

(algoritmos AES12 o un hash cifrado HMAC13) coacutedigos arbitrarios o aleatorios

Si reemplazando el identificador directo auacuten es faacutecil identificar a la persona elimine el

dato

Clasifique yo categorice los datos

Redondee los datos numeacutericos hacia arriba o hacia abajo

Evaluacutee antes durante y despueacutes de publicados los datos si la anonimizacioacuten de sus

datos es suficiente y evaluacutee regularmente los riesgos existentes

Para maacutes informacioacuten consulte los Lineamientos para la Anonimizacioacuten de micro datos

Ejemplo 1

Antes de publicar sus datos retire el identificador directo de la persona En este caso

reemplace en nuacutemero de documento que identifica al usuario y reemplaacutecelo por un

consecutivo

Usuario Beneficio Usuario Beneficio

80123456 Subsidio de vivienda Usuario 1 Subsidio de vivienda

51123456 Subsidio de alimentacioacuten Usuario 2 Subsidio de alimentacioacuten

19123456 Subsidio al adulto mayor Usuario 3 Subsidio al adulto mayor

53123456 Subsidio de desempleo Usuario 4 Subsidio de desempleo

Ejemplo 2

Clasifique o categorice sus datos En este ejemplo asigne rangos a la edad de manera tal que el

titular del registro no sea identificable por este dato

Usuario Edad Usuario Rango de edad

Usuario 1 11 antildeos Usuario 1 Entre 10 y 15 antildeos

Usuario 2 22 antildeos Usuario 2 Entre 20 y 25 antildeos

Usuario 3 36 antildeos Usuario 3 Entre 35 y 40 antildeos

Usuario 4 63 antildeos Usuario 4 Entre 60 y 65 antildeos

12 Advanced Encryption Standard puede consultar como ha sido implementado este algoritmo en httpsrevistasudistritaleducoojsindexphpTecnuraarticleview72368892 13 Hash-based Message Authentication Code puede consultar como se crea este cifrado en httpsdocsoraclecomcdE19253-01819-7804wanboottasks2-51indexhtml

17 Buenas praacutecticas para la publicacioacuten de datos

5 Publicar los datos en formatos estaacutendar reutilizables y legibles por aplicaciones informaacuteticas

Un formato puede ser definido como la estructura de un disco dividido en campos y pistas

seguacuten un determinado sistema operativo lo que permite almacenar en eacutel informacioacuten14

baacutesicamente es la forma en que se codifican los datos en un archivo informaacutetico

Actualmente conocemos formatos comunes de almacenamiento como el doc una extensioacuten

de Word que almacena texto y cuyo propietario es la compantildeiacutea Microsoft Pero iquestqueacute pasa si un

usuario quiere abrir un documento doc en un procesador de texto diferente a Word

difiacutecilmente va a poder conocer el contenido de dicho documento sin tener esta licencia

Lo que queremos lograr con la implementacioacuten de esta praacutectica es que todos los usuarios que

encuentren mis datos puedan accederlos sin necesidad de contar con un software o aplicacioacuten

informaacutetica especiacutefica

iquestQueacute logro

Que mis datos sean consultados utilizados y reutilizados por maacutes usuarios

Que mis datos sean maacutes interoperables y maacutes procesados

Que mis datos puedan ser extraiacutedos transformados y procesados por aplicaciones

informaacuteticas

Que mis datos puedan ser compartidos e intercambiados entre sistemas

Disminuir los costos y los tiempos en el uso y la transformacioacuten de mis datos

iexclRecomendaciones

Prefiera publicar su conjunto de datos en formatos abiertos o no propietario ya que

estos facilitan el uso re-uso y distribucioacuten de estos Se busca que un mayor nuacutemero de

aplicaciones informaacuteticas pueda extraer leer y transformar los datos generando mayor

uso y re-uso por los usuarios

Disponga sus datos en muacuteltiples formatos con el fin de incrementar el acceso a los

mismos Se busca que el mayor nuacutemero de usuarios pueda utilizar los datos sin tener

que transformarlos primero en su formato preferido

Utilice Web Services para mejorar el intercambio e interoperabilidad de los datos

publicados

14 httpdleraeessrvsearchm=30ampw=formato

18 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo 1

A continuacioacuten encontraraacute extensiones de formato propietario y no propietario prefiera para

la publicacioacuten de sus datos las extensiones de la derecha

FORMATO PROPIETARIO FORMATO NO PROPIETARIO

DOC GDB TXT ASCII Grid KML RDF

XLS DWG CSV GeoJSON DXF XML

PPT SHP JSON GML ODF

Ejemplo 2

Si no fue posible utilizar una extensioacuten de formato no propietario publique sus datos en una

variedad de formatos que le permita al usuario acceder a los datos desde diferentes

aplicaciones informaacuteticas

Ejemplo 3

Para publicar sus datos conozca diferentes tipos de Web Services que viajan en la red utilizando extensiones XML

SOAP httpswwww3orgTRsoap

REST httprestelksteinorg

WMS httpwwwopengeospatialorgstandardswms

WFS httpwwwopengeospatialorgstandardswfs

WCS httpwwwopengeospatialorgstandardswcs

19 Buenas praacutecticas para la publicacioacuten de datos

6 Proporcionar un diccionario de datos que facilite el uso e interpretacioacuten de los datos publicados

Un diccionario estaacute definido como un repertorio en forma de libro o en soporte electroacutenico en el

que se recogen seguacuten un orden determinado las palabras o expresiones de una o maacutes lenguas

o de una materia concreta acompantildeadas de su definicioacuten equivalencia o explicacioacuten15

especiacuteficamente en un diccionario de datos se encuentran los conceptos de los datos y sus

propiedades (atributos dominios asociaciones y operaciones) acompantildeados de una definicioacuten

en donde se identifica el propoacutesito alcance y campo de aplicacioacuten del dato publicado

Lograr que los usuarios de mis datos entiendan la informacioacuten que estaacute publicada le permitiraacute

decidir si satisfacen o no su necesidad y le facilitaraacute la decisioacuten para explotar lo datos

Para maacutes informacioacuten consulte el Instructivo Diccionario de Datos

iquestQueacute logro

Que mis datos sean consultados utilizados y reutilizados por maacutes usuarios

Que se eviten ambiguumledades en la interpretacioacuten de mis datos

Que mis datos publicados esteacuten unificados y consistentes

Que los usuarios comprendan mejor y dispongan de claridad sobre los conceptos de

mis datos

iexclRecomendaciones

Publique como miacutenimo un diccionario de datos que contenga la caracterizacioacuten del

conjunto de datos producidos por su entidad

Cree el diccionario de datos teniendo en cuenta como miacutenimo la siguiente informacioacuten

Nombre del atributo Nombre que identifica de manera clara un atributo

Definicioacuten Descripcioacuten del atributo

Tipo de dato Tipo de valor del atributo

Unidad de medida Expresa la unidad de medida del atributo

Dominio Determina si el atributo tiene asociado un dominio

15 httpdleraeesw=diccionario

20 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo

Para el conjunto de datos ldquoEstablecimientos Educativos en Bogotaacuterdquo publicariacuteamos un

diccionario de datos similar al siguiente

Nombre del atributo Definicioacuten Tipo de dato

Unidad de Medida

Dominio

Coacutedigo del establecimiento

Coacutedigo DANE asignado al Institucioacuten Educativa Decimal

Nombre del establecimiento

Nombre de la Institucioacuten Educativa Cadena de Caracteres

Aacuterea construida del establecimiento

Aacuterea construida de la Institucioacuten Educativa Decimal Metros

cuadrados

Sector

Clasificacioacuten asignada seguacuten la naturaleza juriacutedica la cual define las principales caracteriacutesticas que desde lo juriacutedico - administrativo y tiene que ver con el origen de su creacioacuten

Entero

EESector

No podriacuteamos olvidar detallar el dominio asociado

Atributo Nombre del Dominio Coacutedigo Definicioacuten

EESector

Oficial 1

Es una institucioacuten donde su naturaleza de servicio puacuteblico cultural y su funcioacuten social le es inherente cumpliendo con las disposiciones legales y estatutarias que las rigen donde sus rentas se conservan y se aplican debidamente

Privado 2

Es una institucioacuten constituida como persona juriacutedica de utilidad comuacuten donde sus rentas se conservan y se aplican debidamente y que en todo lo esencial se cumple con la voluntad de sus fundadores

21 Buenas praacutecticas para la publicacioacuten de datos

7 Acompantildear la publicacioacuten de los datos con enlaces a otros recursos

Un enlace es definido como una secuencia de caracteres que se utiliza como direccioacuten para

acceder a informacioacuten adicional16 maacutes sencillo puede definirse como una expresioacuten que

conecta una cierta informacioacuten con otra17Ahora bien un recurso se puede entender como

cualquier medio que satisfaga una necesidad por ejemplo datos servicios documentos o

software

En teacuterminos generales se sugiere que para facilitar al usuario la comprensioacuten de los datos

publicados se proporcionen recursos o documentos adicionales que puedan ser consultados

yo descargados traveacutes de enlaces o links de otro sitio Web

Dentro de los recursos adicionales que pueden publicarse para acompantildear el dato estaacuten los

procedimientos de captura del dato los cataacutelogos de objetos las especificaciones teacutecnicas los

documentos normativos los cataacutelogos de simbologiacutea los reportes de evaluacioacuten de calidad

entre otros

iquestQueacute logro

Mejorar la consulta utilizacioacuten y reutilizacioacuten de mis datos

Que los usuarios comprendan mejor mis datos

Que mis datos sean compartidos e intercambiados por un mayor nuacutemero de usuarios

iexclRecomendaciones

Disponga informacioacuten adicional de sus datos que le permita a los usuarios ampliar el

horizonte de las aplicaciones y funcionalidades en las que pueda utilizar y explotar del

dato

No olvide vincular o registrar esta informacioacuten en el metadato

16 httpdleraeesid=FTVRKyj 17 httpssistemascomenlacephp

22 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo 1

El ldquoMapa de Referencia para Bogotaacuterdquo publicado en httpswwwidecagovcoesserviciosmapa-de-referencia tiene publicados varios enlaces a otros recursos

Especificacioacuten teacutecnica para la elaboracioacuten del Mapa de Referencia para Bogotaacute DC V0318

Cataacutelogo de Objetos del Mapa de Referencia de Bogotaacute DC V 57

Cataacutelogo de Representacioacuten del Mapa de Referencia de Bogotaacute DC V30

Reporte de evaluacioacuten de calidad generado al Mapa de Referencia del Distrito Capital V1217

Ejemplo 2

La informacioacuten de los ldquohumedales de Bogotaacuterdquo publicada en

httpambientebogotagovcowebsdahumedales tiene publicados enlaces a otros recursos

o Gestioacuten de los humedales

o Poliacutetica de Humedales del Distrito Capital

o Normatividad

o Planes de Manejo Ambiental

o Comiteacute distrital de humedales documentos de consulta normatividad

23 Buenas praacutecticas para la publicacioacuten de datos

8 Depurar sus datos antes de publicarlos para garantizar su calidad y aumentar su confianza

La calidad estaacute definida como el conjunto de propiedades inherentes a algo que permiten

juzgar su valor18 para el caso que nos concierne este algo hace referencia al dato publicado

Ahora bien la calidad tambieacuten es entendida como la capacidad del dato publicado para

satisfacer los requerimientos y las necesidades de los usuarios respetando una serie de normas

y especificaciones establecidas

Actualmente existen muacuteltiples elementos de calidad de los datos que identifican las cualidades

de estos sin embargo en este aparte citaremos los elementos principales que usted o su

entidad deben tener en cuenta para publicar sus datos con un estaacutendar miacutenimo de calidad

Para maacutes informacioacuten consulte el Procedimiento para evaluar y reportar la calidad de

los datos espaciales

iquestQueacute logro

Que mis datos sean consultados utilizados y reutilizados por maacutes usuarios

Que los usuarios hablen bien de mis datos

Que mis datos sean maacutes interoperables y maacutes procesados

Que mis datos sean maacutes compartidos

Que mis datos sean maacutes confiables

Recomendacioacuten 1

Establezca si dentro de su conjunto de datos existen capos vaciacuteos o nulos con informacioacuten

descontextualizada sobrante o duplicada Si existen compleacutetelos o elimiacutenelos seguacuten

corresponda antes de la publicacioacuten El elemento de calidad asociado se denomina ldquototalidadrdquo

Localidad Atendidos Localidad Atendidos

Suba 200 Suba 200

Suba 200 Tunjuelito 500

Ameacutericas 100

850

Tunjuelito 500

18 httpdleraeesid=6nVpk8P|6nXVL1Z

Campo duplicado

Campo inconsistente

Campo vaciacuteo

24 Buenas praacutecticas para la publicacioacuten de datos

Recomendacioacuten 2

Identifique y transforme si es necesario los datos que hayan sido registrados en un formato

diferente al establecido para su conjunto de datos Es decir estandarice el formato de salida

del dato que va a publicar El elemento de calidad asociado se denomina ldquoconsistencia de

formatordquo

Localidad Atendidos Localidad Atendidos

Suba 200 Suba 200

Tunjuelito 5008 Tunjuelito 500

Fontiboacuten 40 Fontiboacuten 430

Tunjuelito 500 Tunjuelito 500

Recomendacioacuten 3

Si sus datos tienen alguacuten tipo de clasificacioacuten o rangos previo a la publicacioacuten valide que estos

se hayan registrado correctamente El elemento de calidad asociado se denomina ldquoexactitud de

clasificacioacutenrdquo

Geacutenero Edad Rango de Edad Geacutenero Edad Rango de Edad

Femenino 5 0 lt Edad le 10 Femenino 5 0 lt Edad le 10

Masculino 15 0 lt Edad le 10 Masculino 15 10 lt Edad le 20

Femenino 35 40 lt Edad le 50 Femenino 35 30 lt Edad le 40

Recomendacioacuten 4

Si sus datos representan atributos cuantitativos verifique antes de la publicacioacuten que estos

correspondan a valores conocidos como verdaderos El elemento de calidad asociado se

denomina ldquoexactitud de atributos cuantitativosrdquo

Localidad Mes Temperatura Localidad Mes Temperatura

Chapinero Enero 7degC Chapinero Enero 7degC

Suba Agosto -15degC Suba Agosto 15degC

Tunjuelito Abril 60degC Tunjuelito Abril 16degC

Clasificacioacuten inconsistente

Formato inconsistente

Valor inconsistente

25 Buenas praacutecticas para la publicacioacuten de datos

Recomendacioacuten 5

Si los datos a publicar tienen asociadas fechas de captura o recoleccioacuten de informacioacuten (Por

ejemplo registro de incidentes registro de vacunacioacuten conteo de vehiacuteculos etc) valide que

las fechas registradas coincidan con la fecha del evento capturado El elemento de calidad

asociado se denomina ldquoexactitud de la medicioacuten del tiempordquo

Precipitacioacuten (mm) Fecha de registro Precipitacioacuten (mm) Fecha de registro

00 20580101 00 20180101

01 20180102 01 20180102

126 20510403 126 20180103

20 20180104 20 20180104

Recomendacioacuten 6

Cuando sus datos reflejen informacioacuten determinada por un orden de eventos garantice antes

de la publicacioacuten que este orden sea el adecuado El elemento de calidad asociado se

denomina ldquoconsistencia temporalrdquo

Usuario Escolaridad Periodo de Estudio Usuario Escolaridad Periodo de Estudio

Usuario 1 Preescolar 20030101 ndash 20051231 Usuario 1 Preescolar 20030101 ndash 20051231

Usuario 1 Primaria 20030101 ndash 20101231 Usuario 1 Primaria 20060101 ndash 20101231

Usuario 1 Secundaria 20060101 ndash 20163112 Usuario 1 Secundaria 20110101 ndash 20143112

Usuario 1 Media 20150101 - 20163112 Usuario 1 Media 20150101 - 20163112

Recomendacioacuten 7

Si sus datos incluyen alguna ubicacioacuten (direccioacuten lugar coordenadas) verifique que esta

corresponda a la ubicacioacuten real El elemento de calidad asociado se denomina ldquoexactitud

posicionalrdquo

Eventos Deportivos Lugar Eventos Deportivos Lugar

Evento 1 AK 30 25 90 Evento 1 AK 30 25 90

Evento 2 AC 63 215 20 Evento 2 Parque La Florida

Evento 3 Parque Simoacuten Boliacutevar Evento 3 Parque Simoacuten Boliacutevar

Fecha

inconsistente

Fechas no secuenciales

Lugar inexistente

26 Buenas praacutecticas para la publicacioacuten de datos

9 Incorporar el componente geograacutefico en los datos publicados para optimizar su comprensioacuten uso re-uso y visualizacioacuten

El espacio geograacutefico es un punto de la superficie terrestre que se vea afectado o que afecte de

alguna manera a la humanidad19 Este punto de la superficie puede ser la direccioacuten de una

institucioacuten educativa la ubicacioacuten de un centro de vacunacioacuten el lugar donde se miden las

variaciones de traacutensito en la ciudad los parques de Bogotaacute el edificio en donde se llevan a

cabo los traacutemites de una entidad etc

Los datos que usted captura o recolecta en su quehacer misional siempre estaacuten asociados a un

espacio geograacutefico por lo tanto este componente deberiacutea ser incluido en los datos publicados

Tenga en cuenta que el componente geograacutefico lo puede incorporar incluyendo una ubicacioacuten

asociada a una direccioacuten a un lugar a una localidad a un barrio al nombre de un

establecimiento puacuteblicamente reconocido o a cualquier punto que permita al usuario

identificar la localizacioacuten del dato publicado

iquestQueacute logro

Ampliar el espectro de usuarios que consultan utilizan y reutilizan mis datos

Que mis datos sean maacutes interoperables y maacutes procesados

Que mis datos sean puedan compartir en maacutes plataformas

Que los usuarios puedan visualizar mis datos en un mapa

iexclRecomendaciones

Disponga sus datos agregando un atributo de ubicacioacuten como direcciones coordenadas o

lugares geograacuteficos

Ejemplo 1

Incluya direcciones que permitan localizar espacialmente sus datos

Programa Direccioacuten

Registro de atencioacuten a la ciudadaniacutea CL 138 108 16

Centro de autocuidado KR 18 D 77 A 11 SUR

Familias con un nintildeo en cupos cofinanciados CL 70 A SUR 20 46

Centro de autocuidado KR 18 D 73 A 33 SUR

19 httpenciclopediabanrepculturalorgindexphptitle=Espacio_geogrC3A1fico

27 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo 2

Utilice coordenadas para indicar la ubicacioacuten de sus datos

EPS Coordenada X Coordenada Y

EPS Convida 9087496334 1051342164

Capital Salud EPS 986321006 954875808

EPS Famisanar 9742508812 8837031501

Aliansalud EPS 9716943356 9659706891

Salud Total EPS 9215624975 9625189518

Tenga en cuenta que para publicar datos con coordenadas tendraacute que incluir dentro

de su metadato el Sistema de referencia empleado

MAGNA ndash SIRGAS EPSG 4686 httpsepsgio4686

MAGNA ndash SIRGAS EPSG 3116 httpsepsgio3116

MAGNA ndash BOGOTAacute SR-ORG 7458 httpspatialreferenceorgrefsr-org7458

Ejemplo 3

Tambieacuten puede incluir lugares geograacuteficos descriptivos asiacute

Usuario Vacunado Lugar de Vacunacioacuten

Usuario 1 BOSQUE IZQUIERDO

Usuario 2 LAGUNITAS URBANO

Usuario 3 LA CAPUCHINA

Usuario 4 SAN JOSE SUR

Usuario 5 VENECIA

28 Buenas praacutecticas para la publicacioacuten de datos

10 Asignar un identificador uacutenico que permita aumentar la consulta uso e interoperabilidad del dato publicado

Considere un identificador uacutenico como un texto que permite identificar inequiacutevocamente el

dato publicado Si usted va a publicar un dato buscando que este sea reutilizado por los

usuarios y por su propia entidad asignar un identificador facilitaraacute el descubrimiento y la

citacioacuten del dato a traveacutes del tiempo independientemente del estado la disponibilidad o el

formato de este

En la vida cotidiana mediante la ceacutedula de ciudadaniacutea se asigna a cada ciudadano un nuacutemero

de identificacioacuten uacutenico y a traveacutes de este identificador el ciudadano es reconocido a lo largo de

su vida e incluso despueacutes de su muerte por otras personas yo autoridades En el mundo de la

informacioacuten cada dato deberiacutea viajar con un identificador uacutenico que le permita ser encontrado

y reconocido faacutecilmente entre los demaacutes datos

Ahora bien si usted o su entidad publican continuamente datos establecer un sistema de

identificacioacuten comuacuten le permitiraacute identificar raacutepidamente los datos y los haraacute comparables por

cualquier usuario de manera confiable Esta condicioacuten es previa para lograr una correcta

gestioacuten y reutilizacioacuten de sus datos

iquestQueacute logro

Ampliar el espectro de usuarios que consultan utilizan y reutilizan mis datos

Que mis datos sean maacutes interoperables y maacutes procesados

Que mis datos sean compartidos en maacutes plataformas

Que mis datos puedan vincularse a otros datos en el entorno Web

Que mis datos sean encontrados usados y citados inequiacutevocamente

Garantizar y monitorear la reutilizacioacuten de mis datos

Reducir del uso erroacuteneo de mis datos

iexclRecomendaciones

Establezca un sistema de identificacioacuten comuacuten para los datos que va a publicar

Utilice siempre el identificador asignado para publicar sus datos

29 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo

IDECA ha dispuesto el Sistema de Registro de Iacutetems geograacuteficos

httpgeoitemsidecagovcogeoitemsano una herramienta web desarrollada para la

creacioacuten aprobacioacuten publicacioacuten y mantenimiento de iacutetems geograacuteficos que permite la

asignacioacuten concertada de identificadores y significados uacutenicos que contribuyen a la definicioacuten

de un lenguaje comuacuten para el desarrollo de nuevos sistema de informacioacuten en el Distrito

garantizando con ello su fiabilidad e interoperabilidad Adicionalmente permite almacenar

descripciones de la informacioacuten oficial producida e identificar su respectivo custodio jugando

asiacute un papel importante en el control y seguimiento de la produccioacuten de informacioacuten

geograacutefica

Este sistema asigna un identificador uacutenico a cada uno de los iacutetems creados Dentro de los iacutetems

publicados se reconoce el ID 65 como unidad de planeamiento y siempre que se hace

referencia a este objeto es suficiente nombrarlo asiacute para entender que se habla de ldquoUnidades

territoriales de anaacutelisis planeamiento y gestioacuten que tienen como propoacutesito definir y precisar el

planeamiento del suelo urbano de expansioacuten y ruralrdquo

30 Buenas praacutecticas para la publicacioacuten de datos

OBTENGA EL MAacuteS ALTO NIVEL EN PUBLICACIOacuteN DE DATOS

Hasta aquiacute hemos publicado las que consideramos como mejores praacutecticas de publicacioacuten de datos Ahora usted como publicador o como entidad debe evaluar si sus datos se estaacuten disponiendo con los maacutes altos y mejores estaacutendares de publicacioacuten

Lo invitamos a que valide en queacute nivel de publicacioacuten se encuentra su entidad teniendo en cuenta el siguiente listado

Nivel Baacutesico

En este nivel se encuentran aquellas entidades que publican sus datos en formatos estaacutendar y reutilizables (praacutectica 5) que integran a la publicacioacuten sus respectivos metadatos (praacutectica 1) y que acompantildean la publicacioacuten con una licencia asociada (praacutectica 2)

Nivel Intermedio

Este nivel lo alcanzan las entidades que superando el nivel baacutesico disponen un mayor volumen de informacioacuten gracias a que anonimizan sus datos (praacutectica 4) implementan medidas de calidad que aumentan la confianza en sus datos (praacutectica 8) incorporan el componente geograacutefico proporcionando valor agregado a sus datos (praacutectica 9) y publican un diccionario de datos que facilita la interpretacioacuten de los datos publicados (praacutectica 6)

Nivel Avanzado

Las entidades que superando el nivel intermedio utilizan vocabularios estandarizados en sus nuevas publicaciones (praacutectica 3) acompantildean la publicacioacuten de sus datos con enlaces a otros recursos (praacutectica 7) y asignan un identificador uacutenico para dato logrando asiacute aumentar su descubrimiento y reutilizacioacuten (praacutectica 10)

31 Buenas praacutecticas para la publicacioacuten de datos

REFERENCIAS

Bernadette Farias Loacutescio Caroline Burle Newton Calegari W3C Data on the Web Best

Practices 31 de enero de 2017 W3C Recommendation URL httpswwww3orgTRdwbp

Bernadette Hyland Ghislain Auguste Atemezing Boris Villazoacuten-Terrazas W3C Best Practices

for Publishing Linked Data 9 de enero de 2014 W3C Note URL httpswwww3orgTRld-bp

Dan Brickley Libby Miller FOAF project FOAF Vocabulary Specification 099 (Paddington

Edition) 14 de enero de 2014 URL httpxmlnscomfoafspec

Dublin Core metadata initiative DCMI Metadata Terms 14 de junio de 2012 DCMI

Recommendation URL httpdublincoreorgdocumentsdcmi-terms

Fadi Maali John Erickson W3C Data Catalog Vocabulary (DCAT) 16 de enero de 2014 W3C

Recommendation URL httpswwww3orgTRvocab-dcat

ISO 19115-12014 (E) Geographic information ndash Metadata Part1 Fundamentals 01 de abril de

2014 International Standard

ISO 191262009 (E) Geographic information -- Feature concept dictionaries and registers

noviembre de 2009 International Standard

ISO 191572013 (E) Geographic information ndash Data quality 15 de diciembre de 2013

International Standard

Jeremy Tandy Payam Barnaghi Linda van den Brink W3C Spatial Data on the Web Best

Practices 5 de enero 2017 W3C Note URL httpswwww3orgTRsdw-bp

T Berners-Lee R Fielding L Masinter IETF Uniform Resource Identifier (URI) Generic Syntax

Enero de 2005 Internet Standard URL httpstoolsietforghtmlrfc3986

World Wide Web Foundation Open Data Barometer URL httpopendatabarometerorg

W3C OWL Working Group W3C OWL 2 Web Ontology Language Document Overview (Second

Edition) 11 de diciembre de 2012 W3C Recommendation URL httpswwww3orgTRowl2-

overview

W3org Semantic Web - W3C URL httpswwww3orgstandardssemanticweb Consultado

el 12 de septiembre de 2018

Page 6: PARA LA PUBLICACIÓN DE DATOSideca.gov.co/.../files/documentacion/buenaspracticaspublicaciondat… · La obtención de datos la realiza cada entidad en el desarrollo de sus actividades

6 Buenas praacutecticas para la publicacioacuten de datos

BUENAS PRAacuteCTICAS PARA LA PUBLICACIOacuteN DE DATOS

1 Proporcionar metadatos asociados con los datos publicados Estos metadatos permitiraacuten conocer las caracteriacutesticas de los datos y deberaacuten ser interpretables tanto por usuarios como por aplicaciones informaacuteticas

Un metadato entendido como la informacioacuten acerca de un recurso1 es un dato con muchos

elementos que le permiten al usuario conocer desde la visioacuten del productor las caracteriacutesticas

propias de los datos publicados tales como las fechas de creacioacuten y actualizacioacuten el canal de

acceso la calidad del dato las condiciones de uso quieacuten lo produjo quieacuten lo distribuye etc

esto quiere decir que el metadato explica el dato en eacutel estaacute contenida toda la informacioacuten

relevante del dato

En la vida cotidiana la ceacutedula de ciudadaniacutea es el documento que contiene la informacioacuten

miacutenima de las personas (nombre sexo fecha de nacimiento GS RH estatura lugar de

nacimiento) esta informacioacuten permite que el ciudadano se identifique en cualquier lugar del

territorio nacional ante otras personas o autoridades que requieran conocerlo

Con los datos el tratamiento es similar el dato corresponde a la persona y el metadato

corresponde a la ceacutedula de ciudadaniacutea Asiacute como en Colombia todo ciudadano debe portar su

documento de identificacioacuten en el entorno Web todo dato debe portar su metadato en otras

palabras el metadato es parte integral del dato y existe entre ambos un viacutenculo inseparable

Los datos siempre deberaacuten publicarse con su respectivo metadato este uacuteltimo deberaacute contar

con informacioacuten completa y estandarizada que garantice que los usuarios encuentren

conozcan y utilicen los datos que producimos

Recuerde que la publicacioacuten del metadato es igual de importante que la publicacioacuten del

dato

iquestQueacute logro

Al publicar datos en conjunto con su metadato obtengo

Que mis datos sean encontrados y utilizados por maacutes usuarios Que los usuarios logren una correcta interpretacioacuten de la naturaleza calidad y

distribucioacuten de mis datos

Que mis datos sean entendidos evaluados y retroalimentados por maacutes usuarios

Que mis datos puedan ser compartidos e intercambiados entre sistemas

Que los motores de buacutesqueda encuentren mis datos publicados

Que las aplicaciones informaacuteticas procesen mejor y en mayor cantidad mis datos

1 ISO 19115-12014 410

7 Buenas praacutecticas para la publicacioacuten de datos

iexclRecomendaciones

Disponga metadatos suficientes que permitan a los usuarios tener la informacioacuten

correcta para decidir si el dato publicado satisface o no sus necesidades

Incluya en sus metadatos la ubicacioacuten del dato a traveacutes de la descripcioacuten del lugar

(localidad parque riacuteo etc) o a traveacutes de localizacioacuten por coordenadas geograacuteficas x e

y

Publique sus metadatos como una paacutegina Web HTML (HyperText Markup Language) o

simplemente como un archivo de texto separado

Disponga sus metadatos en el formato baacutesico de intercambio XML (Extensible Markup

Language) o en formatos estaacutendar maacutes sofisticados como JSON (JavaScript Object

Notation)

Al igual que los datos puede publicar los metadatos en muacuteltiples formatos desde la

misma URL

Tenga en cuenta que IDECA a partir de estaacutendares internacionales ha definido los

elementos miacutenimos que debe contener el metadato y que estos pueden ser utilizados

en la publicacioacuten de sus metadatos para facilitar el intercambio de estos

Figura 1 Secciones del Perfil de Metadatos IDECA

Para maacutes informacioacuten consulte la Cartilla para la creacioacuten de metadatos geograacuteficos en

Bogotaacute Distrito Capital

8 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo 1

En la siguiente URL se observa un metadato dispuesto para que los usuarios puedan consultar

faacutecilmente la informacioacuten asociada al dato publicado (Desarrollo Econoacutemico Rural Bogotaacute

DC)

httpmetadatosidecagovcogeoportalcatalogsearchresourcedetailspageuuid=A8AB6E

7A-55FB-40DA-85E1-0AA6B4FE6CE3

Ejemplo 2

En la siguiente URL estaacute disponible el metadato de un nivel de informacioacuten dispuesto por la

Unidad Administrativa Especial de Catastro Distrital ndash UAECD ndash en formato XML (legible por

aplicaciones informaacuteticas

httpmetadatosidecagovcogeoportalrestdocumentid=7BBE5F9AEE-1FBC-4C13-822F-

F2CE44AFDD7E7D

9 Buenas praacutecticas para la publicacioacuten de datos

2 Proporcionar una licencia en donde se especifiquen las limitaciones yo restricciones de acceso y uso de los datos

Una licencia entendida como las condiciones legales bajo las cuales estaacute disponible la obra2 es

un instrumento mediante el cual el propietario del dato autoriza o no a los usuarios para que

accedan a su contenido y tambieacuten lo faculta para su utilizacioacuten Existen diferentes tipos de

licencia para la distribucioacuten y explotacioacuten de obras y cuyo propoacutesito es regular las condiciones

de acceso y uso de los datos

Dependiendo el acceso autorizado a los datos las licencias pueden clasificarse en

Privativas o restrictivas Aquellas licencias conocidas como cerradas o no libres donde la mayoriacutea de las veces solo el autor puede usar la obra o en caso contrario se definen condiciones especiacuteficas que se deben cumplir para hacer uso de la informacioacuten

Semilibres Aquellas licencias que requieren autorizaciones para que los usuarios utilicen copien distribuyan o modifiquen su contenido

Libres o abiertas Aquellas licencias que en teacuterminos generales permiten usar distribuir y compartir los datos con muy pocas restricciones

Cuando un dato se publica acompantildeado de su licencia el usuario conoce las condiciones de

acceso uso y distribucioacuten de los datos que estaacute consumiendo de esta forma se garantiza que

los datos se distribuyan seguacuten los intereses de la entidad que los produce y se minimizan los

usos indebidos de los datos por parte de los usuarios

Ahora bien definir la licencia adecuada para cada dato dependeraacute de las condiciones que

establezca la entidad productora de este Revise los ejemplos y defina la licencia maacutes adecuada

para sus datos

Para maacutes informacioacuten consulte el Instructivo para la definicioacuten de licencias de datos

iquestQueacute logro

Que el usuario evaluacutee si puede o no usar mis datos

Que el usuario conozca las condiciones de acceso uso y manejo sobre los datos

disponibles

Dar claridad y potenciar el uso de los datos disponibles

Que el usuario de los reconocimientos respectivos a la entidad productora de los datos

Que se genere valor agregado sobre los datos disponibles en caso de asignar una

licencia abierta

2 Recuperado de httpsopendefinitionorgod21es

10 Buenas praacutecticas para la publicacioacuten de datos

iexclRecomendaciones

Identifique la licencia que mejor se acomode a su modelo de negocio Recuerde que

mediante la Ley 1712 de 2014 se reguloacute el derecho de acceso a la informacioacuten puacuteblica

y se incluyeron los principios de facilitacioacuten gratuidad y divulgacioacuten proactiva de la

informacioacuten

Disponga una licencia para su conjunto de datos a traveacutes de un enlace una copia

incorporada o dentro del metadato

Prefiera el uso de licencias abiertas de este modo sus datos seraacuten utilizados en una

mayor cantidad de productos servicios y mercados

Ejemplo 1

Mundialmente conocidas las licencias Creative Commons3 tienen como objetivo fortalecer a los

creadores para que sean quienes definan los teacuterminos en que sus obras pueden ser usadas queacute

derechos desean entregar y en queacute condiciones lo haraacuten A continuacioacuten encontraraacute los

enlaces de acceso para conocer las condiciones de cada una de las licencias disponibles

CC0 10 httpscreativecommonsorgpublicdomainzero10deedes

CC BY 40 httpscreativecommonsorglicensesby40

CC BY-SA 40 httpscreativecommonsorglicensesby-sa40

CC BY-ND 40 httpscreativecommonsorglicensesby-nd40

CC BY-NC 40 httpscreativecommonsorglicensesby-nc40

CC BY-NC-SA 40

httpscreativecommonsorglicensesby-nc-sa40

Ejemplo 2

Tambieacuten existen las licencias abiertas para datos Open Data Commons4 proporcionadas por la

mundialmente conocida red Open Knowledge Foundation Network ndash OKFN5 puede consultar

las condiciones ingresando a los siguientes enlaces

ODbL 10 httpsopendatacommonsorglicensesodblsummary

PDDL 10 httpsopendatacommonsorglicensespddlsummary

ODC-BY 10 httpsopendatacommonsorglicensesbysummary

3 httpcreativecommonsorg 4 httpopendatacommonsorg 5 httpsokfnorg

11 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo 3

El Mapa de referencia para Bogotaacute estaacute publicado en

httpswwwidecagovcoesserviciosmapa-de-referencia bajo las condiciones descritas en la

ldquoLICENCIA ABIERTA O CONDICIONES DE USO PARA DATOS ABIERTOS DE LA INFRAESTRUCTURA

INTEGRADA DE DATOS ESPACIALES PARA EL DISTRITO CAPITAL (IDECA)rdquo

httpswwwidecagovcoeslicenciaabierta

12 Buenas praacutecticas para la publicacioacuten de datos

3 Utilizar vocabularios estandarizados y reutilizables en la estructuracioacuten y publicacioacuten de los datos

Un vocabulario define los conceptos y las relaciones que se utilizan para describir y representar

un aacuterea de intereacutes6 Cuando se publican datos en la Web los vocabularios permiten integrar

datos cuando existen ambiguumledades en los teacuterminos utilizados en los diferentes conjuntos de

datos En la praacutectica un vocabulario es un conjunto de palabras que permiten a dos usuarios

comunicarse entre siacute La efectividad de dicha comunicacioacuten radica en que el significado de una

palabra para el usuario emisor sea el mismo que para el usuario receptor independientemente

de si utilizaron el mismo teacutermino

Cuando se habla de interoperabilidad de datos lo que se espera es que tanto los usuarios

como las aplicaciones informaacuteticas entiendan y comprendan la mayor cantidad de informacioacuten

que estaacuten consumiendo Para conseguir esto las comunidades de datos han identificado

vocablos palabras o teacuterminos de uso comuacuten los cuales cuentan con significados apropiados y

que actualmente se encuentran integrados y estructurados en diferentes estaacutendares

internacionales

Se recomienda utilizar vocabularios de este tipo para estandarizar los datos contenidos en la

informacioacuten publicada

iquestQueacute logro

Que mis datos sean consultados utilizados y reutilizados por maacutes usuarios Que se reduzca la ambiguumledad en la interpretacioacuten de mis datos Que mis datos sean interoperables Que mis datos sean procesados en entornos nacionales e internacionales Que mis datos puedan ser compartidos e intercambiados entre sistemas Que mis datos sean maacutes confiables

iexclRecomendaciones

Consulte normas locales o vocabularios internacionales para la estructuracioacuten7 de sus

datos

Apropie los vocabularios consultados y adapte sus datos a estos en los casos en que sea

posible

Incluya vocabularios ya definidos y reconocidos internacionalmente cuando vaya a

producir nuevos datos

6 httpswwww3orgstandardssemanticwebontology 7 Estructurar significa ajustar los datos a un esquema fijo

13 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo 1

A continuacioacuten se presentan algunos vocabularios internacionales que puede consultar y

apropiar para optimizar el intercambio de sus datos

Data Catalog Vocabulary (DCAT) httpswwww3orgTRvocab-dcatclass-catalog

FOAF Vocabulary Specification httpxmlnscomfoaf01

ISOTC 211 Geographic informationGeomatics Terminology

httpwwwisotc211orgTerminologyhtm

The RDF Data Cube Vocabulary httpswwww3orgTR2014REC-vocab-data-cube-20140116

ODRL Vocabulary amp Expression 22

httpswwww3orgTR2018REC-odrl-vocab-20180215

HTTP Vocabulary in RDF 10 httpswwww3orgTR2017NOTE-HTTP-in-RDF10-20170202

vCard Ontology - for describing People and Organizations

httpswwww3orgTRvcard-rdf

Ejemplo 2

En el contexto Nacional el Ministerio de Tecnologiacuteas de la Informacioacuten y las Comunicaciones ha

establecido el Lenguaje Comuacuten de Intercambio de como un instrumento de consulta que

contiene la definicioacuten de los elementos de datos conceptualizados por las entidades del

estado La consulta la puede realizar en httplenguajeminticgovco

14 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo 3

La especificacioacuten vCard disponible en httpswwww3orgTRvcard-rdf promueve un

vocabulario especiacutefico para describir personas y organizaciones

Uno de los vocablos que describe esta especificacioacuten es la ldquodireccioacuten de entregardquo llamado

dentro del vocabulario como ADR y definido como ldquola direccioacuten del objeto representado en

partes estructuradasrdquo

Ahora bien este vocabulario especifica los componentes de la direccioacuten de entrega para el

objeto asiacute el nombre del paiacutes la localidad el coacutedigo postal la regioacuten y la direccioacuten dada por

viacuteas (calles y carreras en el caso colombiano) Esto quiere decir que cualquiera de los

componentes descritos puede usarse como direccioacuten de entrega vaacutelida ya que son equivalentes

entre siacute

Aunque en el vocabulario la direccioacuten de entrega se llame ADR el usuario de la informacioacuten

entenderaacute que un nombre de paiacutes o un coacutedigo postal pueden interpretarse como ADR

15 Buenas praacutecticas para la publicacioacuten de datos

4 Anonimizar los datos de caraacutecter personal informacioacuten estadiacutestica informacioacuten indirectamente identificable e informacioacuten sensible o confidencial

Anonimizar es el proceso que impide la identificacioacuten de las unidades de estudio que son fuente

para los registros individuales de un conjunto8 de datos o maacutes claro es la aplicacioacuten de teacutecnicas

que permitan expresar un dato relativo a personas eliminando la referencia a su identidad9

Baacutesicamente lo que se busca es reducir los riesgos en el uso y procesamiento de datos

personales evitar la extraccioacuten de registros que identifican a una persona reducir la

combinacioacuten de dos o maacutes registros en una o varias bases de datos para identificar a una

persona y minimizar la deduccioacuten de datos personales partir de uno o varios datos publicados

iquestQueacute informacioacuten debo prioritariamente anonimizar

Datos personales Informacioacuten numeacuterica alfabeacutetica graacutefica fotograacutefica acuacutestica o

cualquier otro tipo susceptible de recogida registro tratamiento y transmisioacuten

concerniente a personas fiacutesicas identificadas o identificables (tales como nombre

apellidos estado civil sexo edad domicilio identificacioacuten personal nuacutemero de

teleacutefono etc)10

Informacioacuten sensible Informacioacuten considerada como estrictamente confidencial

Informacioacuten y caracteriacutesticas referentes a la edad procedencia salud raza religioacuten

ideologiacutea afiliacioacuten finanzas etc se consideran de caraacutecter sensible y requieren de

una proteccioacuten especial11

iquestQueacute logro

Garantizar que mis datos publicados cuentan con medidas de proteccioacuten de datos

personales

Eliminar de manera efectiva el riesgo de re-identificacioacuten

Evitar que el procesamiento de mis datos tenga consecuencias negativas para alguna

persona

Disponer muchos maacutes datos sin invadir la informacioacuten personal

iexclRecomendaciones

Implemente actividades de proteccioacuten de la privacidad de los datos personales antes

de publicarlos

Elimine cualquier identificador directo de la persona (nombre documento de

identidad etc)

8 httpswwwdanegovcofilessenlineamientosDSO_020_LIN_08pdf 9 httpdleraeesid=2jjMiRi 10 httpswwwdanegovcofilessenlineamientosDSO_020_LIN_08pdf 11 Ibidem

16 Buenas praacutecticas para la publicacioacuten de datos

Reemplace los identificadores directos por coacutedigos de referencia pseudoacutenimos

(algoritmos AES12 o un hash cifrado HMAC13) coacutedigos arbitrarios o aleatorios

Si reemplazando el identificador directo auacuten es faacutecil identificar a la persona elimine el

dato

Clasifique yo categorice los datos

Redondee los datos numeacutericos hacia arriba o hacia abajo

Evaluacutee antes durante y despueacutes de publicados los datos si la anonimizacioacuten de sus

datos es suficiente y evaluacutee regularmente los riesgos existentes

Para maacutes informacioacuten consulte los Lineamientos para la Anonimizacioacuten de micro datos

Ejemplo 1

Antes de publicar sus datos retire el identificador directo de la persona En este caso

reemplace en nuacutemero de documento que identifica al usuario y reemplaacutecelo por un

consecutivo

Usuario Beneficio Usuario Beneficio

80123456 Subsidio de vivienda Usuario 1 Subsidio de vivienda

51123456 Subsidio de alimentacioacuten Usuario 2 Subsidio de alimentacioacuten

19123456 Subsidio al adulto mayor Usuario 3 Subsidio al adulto mayor

53123456 Subsidio de desempleo Usuario 4 Subsidio de desempleo

Ejemplo 2

Clasifique o categorice sus datos En este ejemplo asigne rangos a la edad de manera tal que el

titular del registro no sea identificable por este dato

Usuario Edad Usuario Rango de edad

Usuario 1 11 antildeos Usuario 1 Entre 10 y 15 antildeos

Usuario 2 22 antildeos Usuario 2 Entre 20 y 25 antildeos

Usuario 3 36 antildeos Usuario 3 Entre 35 y 40 antildeos

Usuario 4 63 antildeos Usuario 4 Entre 60 y 65 antildeos

12 Advanced Encryption Standard puede consultar como ha sido implementado este algoritmo en httpsrevistasudistritaleducoojsindexphpTecnuraarticleview72368892 13 Hash-based Message Authentication Code puede consultar como se crea este cifrado en httpsdocsoraclecomcdE19253-01819-7804wanboottasks2-51indexhtml

17 Buenas praacutecticas para la publicacioacuten de datos

5 Publicar los datos en formatos estaacutendar reutilizables y legibles por aplicaciones informaacuteticas

Un formato puede ser definido como la estructura de un disco dividido en campos y pistas

seguacuten un determinado sistema operativo lo que permite almacenar en eacutel informacioacuten14

baacutesicamente es la forma en que se codifican los datos en un archivo informaacutetico

Actualmente conocemos formatos comunes de almacenamiento como el doc una extensioacuten

de Word que almacena texto y cuyo propietario es la compantildeiacutea Microsoft Pero iquestqueacute pasa si un

usuario quiere abrir un documento doc en un procesador de texto diferente a Word

difiacutecilmente va a poder conocer el contenido de dicho documento sin tener esta licencia

Lo que queremos lograr con la implementacioacuten de esta praacutectica es que todos los usuarios que

encuentren mis datos puedan accederlos sin necesidad de contar con un software o aplicacioacuten

informaacutetica especiacutefica

iquestQueacute logro

Que mis datos sean consultados utilizados y reutilizados por maacutes usuarios

Que mis datos sean maacutes interoperables y maacutes procesados

Que mis datos puedan ser extraiacutedos transformados y procesados por aplicaciones

informaacuteticas

Que mis datos puedan ser compartidos e intercambiados entre sistemas

Disminuir los costos y los tiempos en el uso y la transformacioacuten de mis datos

iexclRecomendaciones

Prefiera publicar su conjunto de datos en formatos abiertos o no propietario ya que

estos facilitan el uso re-uso y distribucioacuten de estos Se busca que un mayor nuacutemero de

aplicaciones informaacuteticas pueda extraer leer y transformar los datos generando mayor

uso y re-uso por los usuarios

Disponga sus datos en muacuteltiples formatos con el fin de incrementar el acceso a los

mismos Se busca que el mayor nuacutemero de usuarios pueda utilizar los datos sin tener

que transformarlos primero en su formato preferido

Utilice Web Services para mejorar el intercambio e interoperabilidad de los datos

publicados

14 httpdleraeessrvsearchm=30ampw=formato

18 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo 1

A continuacioacuten encontraraacute extensiones de formato propietario y no propietario prefiera para

la publicacioacuten de sus datos las extensiones de la derecha

FORMATO PROPIETARIO FORMATO NO PROPIETARIO

DOC GDB TXT ASCII Grid KML RDF

XLS DWG CSV GeoJSON DXF XML

PPT SHP JSON GML ODF

Ejemplo 2

Si no fue posible utilizar una extensioacuten de formato no propietario publique sus datos en una

variedad de formatos que le permita al usuario acceder a los datos desde diferentes

aplicaciones informaacuteticas

Ejemplo 3

Para publicar sus datos conozca diferentes tipos de Web Services que viajan en la red utilizando extensiones XML

SOAP httpswwww3orgTRsoap

REST httprestelksteinorg

WMS httpwwwopengeospatialorgstandardswms

WFS httpwwwopengeospatialorgstandardswfs

WCS httpwwwopengeospatialorgstandardswcs

19 Buenas praacutecticas para la publicacioacuten de datos

6 Proporcionar un diccionario de datos que facilite el uso e interpretacioacuten de los datos publicados

Un diccionario estaacute definido como un repertorio en forma de libro o en soporte electroacutenico en el

que se recogen seguacuten un orden determinado las palabras o expresiones de una o maacutes lenguas

o de una materia concreta acompantildeadas de su definicioacuten equivalencia o explicacioacuten15

especiacuteficamente en un diccionario de datos se encuentran los conceptos de los datos y sus

propiedades (atributos dominios asociaciones y operaciones) acompantildeados de una definicioacuten

en donde se identifica el propoacutesito alcance y campo de aplicacioacuten del dato publicado

Lograr que los usuarios de mis datos entiendan la informacioacuten que estaacute publicada le permitiraacute

decidir si satisfacen o no su necesidad y le facilitaraacute la decisioacuten para explotar lo datos

Para maacutes informacioacuten consulte el Instructivo Diccionario de Datos

iquestQueacute logro

Que mis datos sean consultados utilizados y reutilizados por maacutes usuarios

Que se eviten ambiguumledades en la interpretacioacuten de mis datos

Que mis datos publicados esteacuten unificados y consistentes

Que los usuarios comprendan mejor y dispongan de claridad sobre los conceptos de

mis datos

iexclRecomendaciones

Publique como miacutenimo un diccionario de datos que contenga la caracterizacioacuten del

conjunto de datos producidos por su entidad

Cree el diccionario de datos teniendo en cuenta como miacutenimo la siguiente informacioacuten

Nombre del atributo Nombre que identifica de manera clara un atributo

Definicioacuten Descripcioacuten del atributo

Tipo de dato Tipo de valor del atributo

Unidad de medida Expresa la unidad de medida del atributo

Dominio Determina si el atributo tiene asociado un dominio

15 httpdleraeesw=diccionario

20 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo

Para el conjunto de datos ldquoEstablecimientos Educativos en Bogotaacuterdquo publicariacuteamos un

diccionario de datos similar al siguiente

Nombre del atributo Definicioacuten Tipo de dato

Unidad de Medida

Dominio

Coacutedigo del establecimiento

Coacutedigo DANE asignado al Institucioacuten Educativa Decimal

Nombre del establecimiento

Nombre de la Institucioacuten Educativa Cadena de Caracteres

Aacuterea construida del establecimiento

Aacuterea construida de la Institucioacuten Educativa Decimal Metros

cuadrados

Sector

Clasificacioacuten asignada seguacuten la naturaleza juriacutedica la cual define las principales caracteriacutesticas que desde lo juriacutedico - administrativo y tiene que ver con el origen de su creacioacuten

Entero

EESector

No podriacuteamos olvidar detallar el dominio asociado

Atributo Nombre del Dominio Coacutedigo Definicioacuten

EESector

Oficial 1

Es una institucioacuten donde su naturaleza de servicio puacuteblico cultural y su funcioacuten social le es inherente cumpliendo con las disposiciones legales y estatutarias que las rigen donde sus rentas se conservan y se aplican debidamente

Privado 2

Es una institucioacuten constituida como persona juriacutedica de utilidad comuacuten donde sus rentas se conservan y se aplican debidamente y que en todo lo esencial se cumple con la voluntad de sus fundadores

21 Buenas praacutecticas para la publicacioacuten de datos

7 Acompantildear la publicacioacuten de los datos con enlaces a otros recursos

Un enlace es definido como una secuencia de caracteres que se utiliza como direccioacuten para

acceder a informacioacuten adicional16 maacutes sencillo puede definirse como una expresioacuten que

conecta una cierta informacioacuten con otra17Ahora bien un recurso se puede entender como

cualquier medio que satisfaga una necesidad por ejemplo datos servicios documentos o

software

En teacuterminos generales se sugiere que para facilitar al usuario la comprensioacuten de los datos

publicados se proporcionen recursos o documentos adicionales que puedan ser consultados

yo descargados traveacutes de enlaces o links de otro sitio Web

Dentro de los recursos adicionales que pueden publicarse para acompantildear el dato estaacuten los

procedimientos de captura del dato los cataacutelogos de objetos las especificaciones teacutecnicas los

documentos normativos los cataacutelogos de simbologiacutea los reportes de evaluacioacuten de calidad

entre otros

iquestQueacute logro

Mejorar la consulta utilizacioacuten y reutilizacioacuten de mis datos

Que los usuarios comprendan mejor mis datos

Que mis datos sean compartidos e intercambiados por un mayor nuacutemero de usuarios

iexclRecomendaciones

Disponga informacioacuten adicional de sus datos que le permita a los usuarios ampliar el

horizonte de las aplicaciones y funcionalidades en las que pueda utilizar y explotar del

dato

No olvide vincular o registrar esta informacioacuten en el metadato

16 httpdleraeesid=FTVRKyj 17 httpssistemascomenlacephp

22 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo 1

El ldquoMapa de Referencia para Bogotaacuterdquo publicado en httpswwwidecagovcoesserviciosmapa-de-referencia tiene publicados varios enlaces a otros recursos

Especificacioacuten teacutecnica para la elaboracioacuten del Mapa de Referencia para Bogotaacute DC V0318

Cataacutelogo de Objetos del Mapa de Referencia de Bogotaacute DC V 57

Cataacutelogo de Representacioacuten del Mapa de Referencia de Bogotaacute DC V30

Reporte de evaluacioacuten de calidad generado al Mapa de Referencia del Distrito Capital V1217

Ejemplo 2

La informacioacuten de los ldquohumedales de Bogotaacuterdquo publicada en

httpambientebogotagovcowebsdahumedales tiene publicados enlaces a otros recursos

o Gestioacuten de los humedales

o Poliacutetica de Humedales del Distrito Capital

o Normatividad

o Planes de Manejo Ambiental

o Comiteacute distrital de humedales documentos de consulta normatividad

23 Buenas praacutecticas para la publicacioacuten de datos

8 Depurar sus datos antes de publicarlos para garantizar su calidad y aumentar su confianza

La calidad estaacute definida como el conjunto de propiedades inherentes a algo que permiten

juzgar su valor18 para el caso que nos concierne este algo hace referencia al dato publicado

Ahora bien la calidad tambieacuten es entendida como la capacidad del dato publicado para

satisfacer los requerimientos y las necesidades de los usuarios respetando una serie de normas

y especificaciones establecidas

Actualmente existen muacuteltiples elementos de calidad de los datos que identifican las cualidades

de estos sin embargo en este aparte citaremos los elementos principales que usted o su

entidad deben tener en cuenta para publicar sus datos con un estaacutendar miacutenimo de calidad

Para maacutes informacioacuten consulte el Procedimiento para evaluar y reportar la calidad de

los datos espaciales

iquestQueacute logro

Que mis datos sean consultados utilizados y reutilizados por maacutes usuarios

Que los usuarios hablen bien de mis datos

Que mis datos sean maacutes interoperables y maacutes procesados

Que mis datos sean maacutes compartidos

Que mis datos sean maacutes confiables

Recomendacioacuten 1

Establezca si dentro de su conjunto de datos existen capos vaciacuteos o nulos con informacioacuten

descontextualizada sobrante o duplicada Si existen compleacutetelos o elimiacutenelos seguacuten

corresponda antes de la publicacioacuten El elemento de calidad asociado se denomina ldquototalidadrdquo

Localidad Atendidos Localidad Atendidos

Suba 200 Suba 200

Suba 200 Tunjuelito 500

Ameacutericas 100

850

Tunjuelito 500

18 httpdleraeesid=6nVpk8P|6nXVL1Z

Campo duplicado

Campo inconsistente

Campo vaciacuteo

24 Buenas praacutecticas para la publicacioacuten de datos

Recomendacioacuten 2

Identifique y transforme si es necesario los datos que hayan sido registrados en un formato

diferente al establecido para su conjunto de datos Es decir estandarice el formato de salida

del dato que va a publicar El elemento de calidad asociado se denomina ldquoconsistencia de

formatordquo

Localidad Atendidos Localidad Atendidos

Suba 200 Suba 200

Tunjuelito 5008 Tunjuelito 500

Fontiboacuten 40 Fontiboacuten 430

Tunjuelito 500 Tunjuelito 500

Recomendacioacuten 3

Si sus datos tienen alguacuten tipo de clasificacioacuten o rangos previo a la publicacioacuten valide que estos

se hayan registrado correctamente El elemento de calidad asociado se denomina ldquoexactitud de

clasificacioacutenrdquo

Geacutenero Edad Rango de Edad Geacutenero Edad Rango de Edad

Femenino 5 0 lt Edad le 10 Femenino 5 0 lt Edad le 10

Masculino 15 0 lt Edad le 10 Masculino 15 10 lt Edad le 20

Femenino 35 40 lt Edad le 50 Femenino 35 30 lt Edad le 40

Recomendacioacuten 4

Si sus datos representan atributos cuantitativos verifique antes de la publicacioacuten que estos

correspondan a valores conocidos como verdaderos El elemento de calidad asociado se

denomina ldquoexactitud de atributos cuantitativosrdquo

Localidad Mes Temperatura Localidad Mes Temperatura

Chapinero Enero 7degC Chapinero Enero 7degC

Suba Agosto -15degC Suba Agosto 15degC

Tunjuelito Abril 60degC Tunjuelito Abril 16degC

Clasificacioacuten inconsistente

Formato inconsistente

Valor inconsistente

25 Buenas praacutecticas para la publicacioacuten de datos

Recomendacioacuten 5

Si los datos a publicar tienen asociadas fechas de captura o recoleccioacuten de informacioacuten (Por

ejemplo registro de incidentes registro de vacunacioacuten conteo de vehiacuteculos etc) valide que

las fechas registradas coincidan con la fecha del evento capturado El elemento de calidad

asociado se denomina ldquoexactitud de la medicioacuten del tiempordquo

Precipitacioacuten (mm) Fecha de registro Precipitacioacuten (mm) Fecha de registro

00 20580101 00 20180101

01 20180102 01 20180102

126 20510403 126 20180103

20 20180104 20 20180104

Recomendacioacuten 6

Cuando sus datos reflejen informacioacuten determinada por un orden de eventos garantice antes

de la publicacioacuten que este orden sea el adecuado El elemento de calidad asociado se

denomina ldquoconsistencia temporalrdquo

Usuario Escolaridad Periodo de Estudio Usuario Escolaridad Periodo de Estudio

Usuario 1 Preescolar 20030101 ndash 20051231 Usuario 1 Preescolar 20030101 ndash 20051231

Usuario 1 Primaria 20030101 ndash 20101231 Usuario 1 Primaria 20060101 ndash 20101231

Usuario 1 Secundaria 20060101 ndash 20163112 Usuario 1 Secundaria 20110101 ndash 20143112

Usuario 1 Media 20150101 - 20163112 Usuario 1 Media 20150101 - 20163112

Recomendacioacuten 7

Si sus datos incluyen alguna ubicacioacuten (direccioacuten lugar coordenadas) verifique que esta

corresponda a la ubicacioacuten real El elemento de calidad asociado se denomina ldquoexactitud

posicionalrdquo

Eventos Deportivos Lugar Eventos Deportivos Lugar

Evento 1 AK 30 25 90 Evento 1 AK 30 25 90

Evento 2 AC 63 215 20 Evento 2 Parque La Florida

Evento 3 Parque Simoacuten Boliacutevar Evento 3 Parque Simoacuten Boliacutevar

Fecha

inconsistente

Fechas no secuenciales

Lugar inexistente

26 Buenas praacutecticas para la publicacioacuten de datos

9 Incorporar el componente geograacutefico en los datos publicados para optimizar su comprensioacuten uso re-uso y visualizacioacuten

El espacio geograacutefico es un punto de la superficie terrestre que se vea afectado o que afecte de

alguna manera a la humanidad19 Este punto de la superficie puede ser la direccioacuten de una

institucioacuten educativa la ubicacioacuten de un centro de vacunacioacuten el lugar donde se miden las

variaciones de traacutensito en la ciudad los parques de Bogotaacute el edificio en donde se llevan a

cabo los traacutemites de una entidad etc

Los datos que usted captura o recolecta en su quehacer misional siempre estaacuten asociados a un

espacio geograacutefico por lo tanto este componente deberiacutea ser incluido en los datos publicados

Tenga en cuenta que el componente geograacutefico lo puede incorporar incluyendo una ubicacioacuten

asociada a una direccioacuten a un lugar a una localidad a un barrio al nombre de un

establecimiento puacuteblicamente reconocido o a cualquier punto que permita al usuario

identificar la localizacioacuten del dato publicado

iquestQueacute logro

Ampliar el espectro de usuarios que consultan utilizan y reutilizan mis datos

Que mis datos sean maacutes interoperables y maacutes procesados

Que mis datos sean puedan compartir en maacutes plataformas

Que los usuarios puedan visualizar mis datos en un mapa

iexclRecomendaciones

Disponga sus datos agregando un atributo de ubicacioacuten como direcciones coordenadas o

lugares geograacuteficos

Ejemplo 1

Incluya direcciones que permitan localizar espacialmente sus datos

Programa Direccioacuten

Registro de atencioacuten a la ciudadaniacutea CL 138 108 16

Centro de autocuidado KR 18 D 77 A 11 SUR

Familias con un nintildeo en cupos cofinanciados CL 70 A SUR 20 46

Centro de autocuidado KR 18 D 73 A 33 SUR

19 httpenciclopediabanrepculturalorgindexphptitle=Espacio_geogrC3A1fico

27 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo 2

Utilice coordenadas para indicar la ubicacioacuten de sus datos

EPS Coordenada X Coordenada Y

EPS Convida 9087496334 1051342164

Capital Salud EPS 986321006 954875808

EPS Famisanar 9742508812 8837031501

Aliansalud EPS 9716943356 9659706891

Salud Total EPS 9215624975 9625189518

Tenga en cuenta que para publicar datos con coordenadas tendraacute que incluir dentro

de su metadato el Sistema de referencia empleado

MAGNA ndash SIRGAS EPSG 4686 httpsepsgio4686

MAGNA ndash SIRGAS EPSG 3116 httpsepsgio3116

MAGNA ndash BOGOTAacute SR-ORG 7458 httpspatialreferenceorgrefsr-org7458

Ejemplo 3

Tambieacuten puede incluir lugares geograacuteficos descriptivos asiacute

Usuario Vacunado Lugar de Vacunacioacuten

Usuario 1 BOSQUE IZQUIERDO

Usuario 2 LAGUNITAS URBANO

Usuario 3 LA CAPUCHINA

Usuario 4 SAN JOSE SUR

Usuario 5 VENECIA

28 Buenas praacutecticas para la publicacioacuten de datos

10 Asignar un identificador uacutenico que permita aumentar la consulta uso e interoperabilidad del dato publicado

Considere un identificador uacutenico como un texto que permite identificar inequiacutevocamente el

dato publicado Si usted va a publicar un dato buscando que este sea reutilizado por los

usuarios y por su propia entidad asignar un identificador facilitaraacute el descubrimiento y la

citacioacuten del dato a traveacutes del tiempo independientemente del estado la disponibilidad o el

formato de este

En la vida cotidiana mediante la ceacutedula de ciudadaniacutea se asigna a cada ciudadano un nuacutemero

de identificacioacuten uacutenico y a traveacutes de este identificador el ciudadano es reconocido a lo largo de

su vida e incluso despueacutes de su muerte por otras personas yo autoridades En el mundo de la

informacioacuten cada dato deberiacutea viajar con un identificador uacutenico que le permita ser encontrado

y reconocido faacutecilmente entre los demaacutes datos

Ahora bien si usted o su entidad publican continuamente datos establecer un sistema de

identificacioacuten comuacuten le permitiraacute identificar raacutepidamente los datos y los haraacute comparables por

cualquier usuario de manera confiable Esta condicioacuten es previa para lograr una correcta

gestioacuten y reutilizacioacuten de sus datos

iquestQueacute logro

Ampliar el espectro de usuarios que consultan utilizan y reutilizan mis datos

Que mis datos sean maacutes interoperables y maacutes procesados

Que mis datos sean compartidos en maacutes plataformas

Que mis datos puedan vincularse a otros datos en el entorno Web

Que mis datos sean encontrados usados y citados inequiacutevocamente

Garantizar y monitorear la reutilizacioacuten de mis datos

Reducir del uso erroacuteneo de mis datos

iexclRecomendaciones

Establezca un sistema de identificacioacuten comuacuten para los datos que va a publicar

Utilice siempre el identificador asignado para publicar sus datos

29 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo

IDECA ha dispuesto el Sistema de Registro de Iacutetems geograacuteficos

httpgeoitemsidecagovcogeoitemsano una herramienta web desarrollada para la

creacioacuten aprobacioacuten publicacioacuten y mantenimiento de iacutetems geograacuteficos que permite la

asignacioacuten concertada de identificadores y significados uacutenicos que contribuyen a la definicioacuten

de un lenguaje comuacuten para el desarrollo de nuevos sistema de informacioacuten en el Distrito

garantizando con ello su fiabilidad e interoperabilidad Adicionalmente permite almacenar

descripciones de la informacioacuten oficial producida e identificar su respectivo custodio jugando

asiacute un papel importante en el control y seguimiento de la produccioacuten de informacioacuten

geograacutefica

Este sistema asigna un identificador uacutenico a cada uno de los iacutetems creados Dentro de los iacutetems

publicados se reconoce el ID 65 como unidad de planeamiento y siempre que se hace

referencia a este objeto es suficiente nombrarlo asiacute para entender que se habla de ldquoUnidades

territoriales de anaacutelisis planeamiento y gestioacuten que tienen como propoacutesito definir y precisar el

planeamiento del suelo urbano de expansioacuten y ruralrdquo

30 Buenas praacutecticas para la publicacioacuten de datos

OBTENGA EL MAacuteS ALTO NIVEL EN PUBLICACIOacuteN DE DATOS

Hasta aquiacute hemos publicado las que consideramos como mejores praacutecticas de publicacioacuten de datos Ahora usted como publicador o como entidad debe evaluar si sus datos se estaacuten disponiendo con los maacutes altos y mejores estaacutendares de publicacioacuten

Lo invitamos a que valide en queacute nivel de publicacioacuten se encuentra su entidad teniendo en cuenta el siguiente listado

Nivel Baacutesico

En este nivel se encuentran aquellas entidades que publican sus datos en formatos estaacutendar y reutilizables (praacutectica 5) que integran a la publicacioacuten sus respectivos metadatos (praacutectica 1) y que acompantildean la publicacioacuten con una licencia asociada (praacutectica 2)

Nivel Intermedio

Este nivel lo alcanzan las entidades que superando el nivel baacutesico disponen un mayor volumen de informacioacuten gracias a que anonimizan sus datos (praacutectica 4) implementan medidas de calidad que aumentan la confianza en sus datos (praacutectica 8) incorporan el componente geograacutefico proporcionando valor agregado a sus datos (praacutectica 9) y publican un diccionario de datos que facilita la interpretacioacuten de los datos publicados (praacutectica 6)

Nivel Avanzado

Las entidades que superando el nivel intermedio utilizan vocabularios estandarizados en sus nuevas publicaciones (praacutectica 3) acompantildean la publicacioacuten de sus datos con enlaces a otros recursos (praacutectica 7) y asignan un identificador uacutenico para dato logrando asiacute aumentar su descubrimiento y reutilizacioacuten (praacutectica 10)

31 Buenas praacutecticas para la publicacioacuten de datos

REFERENCIAS

Bernadette Farias Loacutescio Caroline Burle Newton Calegari W3C Data on the Web Best

Practices 31 de enero de 2017 W3C Recommendation URL httpswwww3orgTRdwbp

Bernadette Hyland Ghislain Auguste Atemezing Boris Villazoacuten-Terrazas W3C Best Practices

for Publishing Linked Data 9 de enero de 2014 W3C Note URL httpswwww3orgTRld-bp

Dan Brickley Libby Miller FOAF project FOAF Vocabulary Specification 099 (Paddington

Edition) 14 de enero de 2014 URL httpxmlnscomfoafspec

Dublin Core metadata initiative DCMI Metadata Terms 14 de junio de 2012 DCMI

Recommendation URL httpdublincoreorgdocumentsdcmi-terms

Fadi Maali John Erickson W3C Data Catalog Vocabulary (DCAT) 16 de enero de 2014 W3C

Recommendation URL httpswwww3orgTRvocab-dcat

ISO 19115-12014 (E) Geographic information ndash Metadata Part1 Fundamentals 01 de abril de

2014 International Standard

ISO 191262009 (E) Geographic information -- Feature concept dictionaries and registers

noviembre de 2009 International Standard

ISO 191572013 (E) Geographic information ndash Data quality 15 de diciembre de 2013

International Standard

Jeremy Tandy Payam Barnaghi Linda van den Brink W3C Spatial Data on the Web Best

Practices 5 de enero 2017 W3C Note URL httpswwww3orgTRsdw-bp

T Berners-Lee R Fielding L Masinter IETF Uniform Resource Identifier (URI) Generic Syntax

Enero de 2005 Internet Standard URL httpstoolsietforghtmlrfc3986

World Wide Web Foundation Open Data Barometer URL httpopendatabarometerorg

W3C OWL Working Group W3C OWL 2 Web Ontology Language Document Overview (Second

Edition) 11 de diciembre de 2012 W3C Recommendation URL httpswwww3orgTRowl2-

overview

W3org Semantic Web - W3C URL httpswwww3orgstandardssemanticweb Consultado

el 12 de septiembre de 2018

Page 7: PARA LA PUBLICACIÓN DE DATOSideca.gov.co/.../files/documentacion/buenaspracticaspublicaciondat… · La obtención de datos la realiza cada entidad en el desarrollo de sus actividades

7 Buenas praacutecticas para la publicacioacuten de datos

iexclRecomendaciones

Disponga metadatos suficientes que permitan a los usuarios tener la informacioacuten

correcta para decidir si el dato publicado satisface o no sus necesidades

Incluya en sus metadatos la ubicacioacuten del dato a traveacutes de la descripcioacuten del lugar

(localidad parque riacuteo etc) o a traveacutes de localizacioacuten por coordenadas geograacuteficas x e

y

Publique sus metadatos como una paacutegina Web HTML (HyperText Markup Language) o

simplemente como un archivo de texto separado

Disponga sus metadatos en el formato baacutesico de intercambio XML (Extensible Markup

Language) o en formatos estaacutendar maacutes sofisticados como JSON (JavaScript Object

Notation)

Al igual que los datos puede publicar los metadatos en muacuteltiples formatos desde la

misma URL

Tenga en cuenta que IDECA a partir de estaacutendares internacionales ha definido los

elementos miacutenimos que debe contener el metadato y que estos pueden ser utilizados

en la publicacioacuten de sus metadatos para facilitar el intercambio de estos

Figura 1 Secciones del Perfil de Metadatos IDECA

Para maacutes informacioacuten consulte la Cartilla para la creacioacuten de metadatos geograacuteficos en

Bogotaacute Distrito Capital

8 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo 1

En la siguiente URL se observa un metadato dispuesto para que los usuarios puedan consultar

faacutecilmente la informacioacuten asociada al dato publicado (Desarrollo Econoacutemico Rural Bogotaacute

DC)

httpmetadatosidecagovcogeoportalcatalogsearchresourcedetailspageuuid=A8AB6E

7A-55FB-40DA-85E1-0AA6B4FE6CE3

Ejemplo 2

En la siguiente URL estaacute disponible el metadato de un nivel de informacioacuten dispuesto por la

Unidad Administrativa Especial de Catastro Distrital ndash UAECD ndash en formato XML (legible por

aplicaciones informaacuteticas

httpmetadatosidecagovcogeoportalrestdocumentid=7BBE5F9AEE-1FBC-4C13-822F-

F2CE44AFDD7E7D

9 Buenas praacutecticas para la publicacioacuten de datos

2 Proporcionar una licencia en donde se especifiquen las limitaciones yo restricciones de acceso y uso de los datos

Una licencia entendida como las condiciones legales bajo las cuales estaacute disponible la obra2 es

un instrumento mediante el cual el propietario del dato autoriza o no a los usuarios para que

accedan a su contenido y tambieacuten lo faculta para su utilizacioacuten Existen diferentes tipos de

licencia para la distribucioacuten y explotacioacuten de obras y cuyo propoacutesito es regular las condiciones

de acceso y uso de los datos

Dependiendo el acceso autorizado a los datos las licencias pueden clasificarse en

Privativas o restrictivas Aquellas licencias conocidas como cerradas o no libres donde la mayoriacutea de las veces solo el autor puede usar la obra o en caso contrario se definen condiciones especiacuteficas que se deben cumplir para hacer uso de la informacioacuten

Semilibres Aquellas licencias que requieren autorizaciones para que los usuarios utilicen copien distribuyan o modifiquen su contenido

Libres o abiertas Aquellas licencias que en teacuterminos generales permiten usar distribuir y compartir los datos con muy pocas restricciones

Cuando un dato se publica acompantildeado de su licencia el usuario conoce las condiciones de

acceso uso y distribucioacuten de los datos que estaacute consumiendo de esta forma se garantiza que

los datos se distribuyan seguacuten los intereses de la entidad que los produce y se minimizan los

usos indebidos de los datos por parte de los usuarios

Ahora bien definir la licencia adecuada para cada dato dependeraacute de las condiciones que

establezca la entidad productora de este Revise los ejemplos y defina la licencia maacutes adecuada

para sus datos

Para maacutes informacioacuten consulte el Instructivo para la definicioacuten de licencias de datos

iquestQueacute logro

Que el usuario evaluacutee si puede o no usar mis datos

Que el usuario conozca las condiciones de acceso uso y manejo sobre los datos

disponibles

Dar claridad y potenciar el uso de los datos disponibles

Que el usuario de los reconocimientos respectivos a la entidad productora de los datos

Que se genere valor agregado sobre los datos disponibles en caso de asignar una

licencia abierta

2 Recuperado de httpsopendefinitionorgod21es

10 Buenas praacutecticas para la publicacioacuten de datos

iexclRecomendaciones

Identifique la licencia que mejor se acomode a su modelo de negocio Recuerde que

mediante la Ley 1712 de 2014 se reguloacute el derecho de acceso a la informacioacuten puacuteblica

y se incluyeron los principios de facilitacioacuten gratuidad y divulgacioacuten proactiva de la

informacioacuten

Disponga una licencia para su conjunto de datos a traveacutes de un enlace una copia

incorporada o dentro del metadato

Prefiera el uso de licencias abiertas de este modo sus datos seraacuten utilizados en una

mayor cantidad de productos servicios y mercados

Ejemplo 1

Mundialmente conocidas las licencias Creative Commons3 tienen como objetivo fortalecer a los

creadores para que sean quienes definan los teacuterminos en que sus obras pueden ser usadas queacute

derechos desean entregar y en queacute condiciones lo haraacuten A continuacioacuten encontraraacute los

enlaces de acceso para conocer las condiciones de cada una de las licencias disponibles

CC0 10 httpscreativecommonsorgpublicdomainzero10deedes

CC BY 40 httpscreativecommonsorglicensesby40

CC BY-SA 40 httpscreativecommonsorglicensesby-sa40

CC BY-ND 40 httpscreativecommonsorglicensesby-nd40

CC BY-NC 40 httpscreativecommonsorglicensesby-nc40

CC BY-NC-SA 40

httpscreativecommonsorglicensesby-nc-sa40

Ejemplo 2

Tambieacuten existen las licencias abiertas para datos Open Data Commons4 proporcionadas por la

mundialmente conocida red Open Knowledge Foundation Network ndash OKFN5 puede consultar

las condiciones ingresando a los siguientes enlaces

ODbL 10 httpsopendatacommonsorglicensesodblsummary

PDDL 10 httpsopendatacommonsorglicensespddlsummary

ODC-BY 10 httpsopendatacommonsorglicensesbysummary

3 httpcreativecommonsorg 4 httpopendatacommonsorg 5 httpsokfnorg

11 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo 3

El Mapa de referencia para Bogotaacute estaacute publicado en

httpswwwidecagovcoesserviciosmapa-de-referencia bajo las condiciones descritas en la

ldquoLICENCIA ABIERTA O CONDICIONES DE USO PARA DATOS ABIERTOS DE LA INFRAESTRUCTURA

INTEGRADA DE DATOS ESPACIALES PARA EL DISTRITO CAPITAL (IDECA)rdquo

httpswwwidecagovcoeslicenciaabierta

12 Buenas praacutecticas para la publicacioacuten de datos

3 Utilizar vocabularios estandarizados y reutilizables en la estructuracioacuten y publicacioacuten de los datos

Un vocabulario define los conceptos y las relaciones que se utilizan para describir y representar

un aacuterea de intereacutes6 Cuando se publican datos en la Web los vocabularios permiten integrar

datos cuando existen ambiguumledades en los teacuterminos utilizados en los diferentes conjuntos de

datos En la praacutectica un vocabulario es un conjunto de palabras que permiten a dos usuarios

comunicarse entre siacute La efectividad de dicha comunicacioacuten radica en que el significado de una

palabra para el usuario emisor sea el mismo que para el usuario receptor independientemente

de si utilizaron el mismo teacutermino

Cuando se habla de interoperabilidad de datos lo que se espera es que tanto los usuarios

como las aplicaciones informaacuteticas entiendan y comprendan la mayor cantidad de informacioacuten

que estaacuten consumiendo Para conseguir esto las comunidades de datos han identificado

vocablos palabras o teacuterminos de uso comuacuten los cuales cuentan con significados apropiados y

que actualmente se encuentran integrados y estructurados en diferentes estaacutendares

internacionales

Se recomienda utilizar vocabularios de este tipo para estandarizar los datos contenidos en la

informacioacuten publicada

iquestQueacute logro

Que mis datos sean consultados utilizados y reutilizados por maacutes usuarios Que se reduzca la ambiguumledad en la interpretacioacuten de mis datos Que mis datos sean interoperables Que mis datos sean procesados en entornos nacionales e internacionales Que mis datos puedan ser compartidos e intercambiados entre sistemas Que mis datos sean maacutes confiables

iexclRecomendaciones

Consulte normas locales o vocabularios internacionales para la estructuracioacuten7 de sus

datos

Apropie los vocabularios consultados y adapte sus datos a estos en los casos en que sea

posible

Incluya vocabularios ya definidos y reconocidos internacionalmente cuando vaya a

producir nuevos datos

6 httpswwww3orgstandardssemanticwebontology 7 Estructurar significa ajustar los datos a un esquema fijo

13 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo 1

A continuacioacuten se presentan algunos vocabularios internacionales que puede consultar y

apropiar para optimizar el intercambio de sus datos

Data Catalog Vocabulary (DCAT) httpswwww3orgTRvocab-dcatclass-catalog

FOAF Vocabulary Specification httpxmlnscomfoaf01

ISOTC 211 Geographic informationGeomatics Terminology

httpwwwisotc211orgTerminologyhtm

The RDF Data Cube Vocabulary httpswwww3orgTR2014REC-vocab-data-cube-20140116

ODRL Vocabulary amp Expression 22

httpswwww3orgTR2018REC-odrl-vocab-20180215

HTTP Vocabulary in RDF 10 httpswwww3orgTR2017NOTE-HTTP-in-RDF10-20170202

vCard Ontology - for describing People and Organizations

httpswwww3orgTRvcard-rdf

Ejemplo 2

En el contexto Nacional el Ministerio de Tecnologiacuteas de la Informacioacuten y las Comunicaciones ha

establecido el Lenguaje Comuacuten de Intercambio de como un instrumento de consulta que

contiene la definicioacuten de los elementos de datos conceptualizados por las entidades del

estado La consulta la puede realizar en httplenguajeminticgovco

14 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo 3

La especificacioacuten vCard disponible en httpswwww3orgTRvcard-rdf promueve un

vocabulario especiacutefico para describir personas y organizaciones

Uno de los vocablos que describe esta especificacioacuten es la ldquodireccioacuten de entregardquo llamado

dentro del vocabulario como ADR y definido como ldquola direccioacuten del objeto representado en

partes estructuradasrdquo

Ahora bien este vocabulario especifica los componentes de la direccioacuten de entrega para el

objeto asiacute el nombre del paiacutes la localidad el coacutedigo postal la regioacuten y la direccioacuten dada por

viacuteas (calles y carreras en el caso colombiano) Esto quiere decir que cualquiera de los

componentes descritos puede usarse como direccioacuten de entrega vaacutelida ya que son equivalentes

entre siacute

Aunque en el vocabulario la direccioacuten de entrega se llame ADR el usuario de la informacioacuten

entenderaacute que un nombre de paiacutes o un coacutedigo postal pueden interpretarse como ADR

15 Buenas praacutecticas para la publicacioacuten de datos

4 Anonimizar los datos de caraacutecter personal informacioacuten estadiacutestica informacioacuten indirectamente identificable e informacioacuten sensible o confidencial

Anonimizar es el proceso que impide la identificacioacuten de las unidades de estudio que son fuente

para los registros individuales de un conjunto8 de datos o maacutes claro es la aplicacioacuten de teacutecnicas

que permitan expresar un dato relativo a personas eliminando la referencia a su identidad9

Baacutesicamente lo que se busca es reducir los riesgos en el uso y procesamiento de datos

personales evitar la extraccioacuten de registros que identifican a una persona reducir la

combinacioacuten de dos o maacutes registros en una o varias bases de datos para identificar a una

persona y minimizar la deduccioacuten de datos personales partir de uno o varios datos publicados

iquestQueacute informacioacuten debo prioritariamente anonimizar

Datos personales Informacioacuten numeacuterica alfabeacutetica graacutefica fotograacutefica acuacutestica o

cualquier otro tipo susceptible de recogida registro tratamiento y transmisioacuten

concerniente a personas fiacutesicas identificadas o identificables (tales como nombre

apellidos estado civil sexo edad domicilio identificacioacuten personal nuacutemero de

teleacutefono etc)10

Informacioacuten sensible Informacioacuten considerada como estrictamente confidencial

Informacioacuten y caracteriacutesticas referentes a la edad procedencia salud raza religioacuten

ideologiacutea afiliacioacuten finanzas etc se consideran de caraacutecter sensible y requieren de

una proteccioacuten especial11

iquestQueacute logro

Garantizar que mis datos publicados cuentan con medidas de proteccioacuten de datos

personales

Eliminar de manera efectiva el riesgo de re-identificacioacuten

Evitar que el procesamiento de mis datos tenga consecuencias negativas para alguna

persona

Disponer muchos maacutes datos sin invadir la informacioacuten personal

iexclRecomendaciones

Implemente actividades de proteccioacuten de la privacidad de los datos personales antes

de publicarlos

Elimine cualquier identificador directo de la persona (nombre documento de

identidad etc)

8 httpswwwdanegovcofilessenlineamientosDSO_020_LIN_08pdf 9 httpdleraeesid=2jjMiRi 10 httpswwwdanegovcofilessenlineamientosDSO_020_LIN_08pdf 11 Ibidem

16 Buenas praacutecticas para la publicacioacuten de datos

Reemplace los identificadores directos por coacutedigos de referencia pseudoacutenimos

(algoritmos AES12 o un hash cifrado HMAC13) coacutedigos arbitrarios o aleatorios

Si reemplazando el identificador directo auacuten es faacutecil identificar a la persona elimine el

dato

Clasifique yo categorice los datos

Redondee los datos numeacutericos hacia arriba o hacia abajo

Evaluacutee antes durante y despueacutes de publicados los datos si la anonimizacioacuten de sus

datos es suficiente y evaluacutee regularmente los riesgos existentes

Para maacutes informacioacuten consulte los Lineamientos para la Anonimizacioacuten de micro datos

Ejemplo 1

Antes de publicar sus datos retire el identificador directo de la persona En este caso

reemplace en nuacutemero de documento que identifica al usuario y reemplaacutecelo por un

consecutivo

Usuario Beneficio Usuario Beneficio

80123456 Subsidio de vivienda Usuario 1 Subsidio de vivienda

51123456 Subsidio de alimentacioacuten Usuario 2 Subsidio de alimentacioacuten

19123456 Subsidio al adulto mayor Usuario 3 Subsidio al adulto mayor

53123456 Subsidio de desempleo Usuario 4 Subsidio de desempleo

Ejemplo 2

Clasifique o categorice sus datos En este ejemplo asigne rangos a la edad de manera tal que el

titular del registro no sea identificable por este dato

Usuario Edad Usuario Rango de edad

Usuario 1 11 antildeos Usuario 1 Entre 10 y 15 antildeos

Usuario 2 22 antildeos Usuario 2 Entre 20 y 25 antildeos

Usuario 3 36 antildeos Usuario 3 Entre 35 y 40 antildeos

Usuario 4 63 antildeos Usuario 4 Entre 60 y 65 antildeos

12 Advanced Encryption Standard puede consultar como ha sido implementado este algoritmo en httpsrevistasudistritaleducoojsindexphpTecnuraarticleview72368892 13 Hash-based Message Authentication Code puede consultar como se crea este cifrado en httpsdocsoraclecomcdE19253-01819-7804wanboottasks2-51indexhtml

17 Buenas praacutecticas para la publicacioacuten de datos

5 Publicar los datos en formatos estaacutendar reutilizables y legibles por aplicaciones informaacuteticas

Un formato puede ser definido como la estructura de un disco dividido en campos y pistas

seguacuten un determinado sistema operativo lo que permite almacenar en eacutel informacioacuten14

baacutesicamente es la forma en que se codifican los datos en un archivo informaacutetico

Actualmente conocemos formatos comunes de almacenamiento como el doc una extensioacuten

de Word que almacena texto y cuyo propietario es la compantildeiacutea Microsoft Pero iquestqueacute pasa si un

usuario quiere abrir un documento doc en un procesador de texto diferente a Word

difiacutecilmente va a poder conocer el contenido de dicho documento sin tener esta licencia

Lo que queremos lograr con la implementacioacuten de esta praacutectica es que todos los usuarios que

encuentren mis datos puedan accederlos sin necesidad de contar con un software o aplicacioacuten

informaacutetica especiacutefica

iquestQueacute logro

Que mis datos sean consultados utilizados y reutilizados por maacutes usuarios

Que mis datos sean maacutes interoperables y maacutes procesados

Que mis datos puedan ser extraiacutedos transformados y procesados por aplicaciones

informaacuteticas

Que mis datos puedan ser compartidos e intercambiados entre sistemas

Disminuir los costos y los tiempos en el uso y la transformacioacuten de mis datos

iexclRecomendaciones

Prefiera publicar su conjunto de datos en formatos abiertos o no propietario ya que

estos facilitan el uso re-uso y distribucioacuten de estos Se busca que un mayor nuacutemero de

aplicaciones informaacuteticas pueda extraer leer y transformar los datos generando mayor

uso y re-uso por los usuarios

Disponga sus datos en muacuteltiples formatos con el fin de incrementar el acceso a los

mismos Se busca que el mayor nuacutemero de usuarios pueda utilizar los datos sin tener

que transformarlos primero en su formato preferido

Utilice Web Services para mejorar el intercambio e interoperabilidad de los datos

publicados

14 httpdleraeessrvsearchm=30ampw=formato

18 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo 1

A continuacioacuten encontraraacute extensiones de formato propietario y no propietario prefiera para

la publicacioacuten de sus datos las extensiones de la derecha

FORMATO PROPIETARIO FORMATO NO PROPIETARIO

DOC GDB TXT ASCII Grid KML RDF

XLS DWG CSV GeoJSON DXF XML

PPT SHP JSON GML ODF

Ejemplo 2

Si no fue posible utilizar una extensioacuten de formato no propietario publique sus datos en una

variedad de formatos que le permita al usuario acceder a los datos desde diferentes

aplicaciones informaacuteticas

Ejemplo 3

Para publicar sus datos conozca diferentes tipos de Web Services que viajan en la red utilizando extensiones XML

SOAP httpswwww3orgTRsoap

REST httprestelksteinorg

WMS httpwwwopengeospatialorgstandardswms

WFS httpwwwopengeospatialorgstandardswfs

WCS httpwwwopengeospatialorgstandardswcs

19 Buenas praacutecticas para la publicacioacuten de datos

6 Proporcionar un diccionario de datos que facilite el uso e interpretacioacuten de los datos publicados

Un diccionario estaacute definido como un repertorio en forma de libro o en soporte electroacutenico en el

que se recogen seguacuten un orden determinado las palabras o expresiones de una o maacutes lenguas

o de una materia concreta acompantildeadas de su definicioacuten equivalencia o explicacioacuten15

especiacuteficamente en un diccionario de datos se encuentran los conceptos de los datos y sus

propiedades (atributos dominios asociaciones y operaciones) acompantildeados de una definicioacuten

en donde se identifica el propoacutesito alcance y campo de aplicacioacuten del dato publicado

Lograr que los usuarios de mis datos entiendan la informacioacuten que estaacute publicada le permitiraacute

decidir si satisfacen o no su necesidad y le facilitaraacute la decisioacuten para explotar lo datos

Para maacutes informacioacuten consulte el Instructivo Diccionario de Datos

iquestQueacute logro

Que mis datos sean consultados utilizados y reutilizados por maacutes usuarios

Que se eviten ambiguumledades en la interpretacioacuten de mis datos

Que mis datos publicados esteacuten unificados y consistentes

Que los usuarios comprendan mejor y dispongan de claridad sobre los conceptos de

mis datos

iexclRecomendaciones

Publique como miacutenimo un diccionario de datos que contenga la caracterizacioacuten del

conjunto de datos producidos por su entidad

Cree el diccionario de datos teniendo en cuenta como miacutenimo la siguiente informacioacuten

Nombre del atributo Nombre que identifica de manera clara un atributo

Definicioacuten Descripcioacuten del atributo

Tipo de dato Tipo de valor del atributo

Unidad de medida Expresa la unidad de medida del atributo

Dominio Determina si el atributo tiene asociado un dominio

15 httpdleraeesw=diccionario

20 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo

Para el conjunto de datos ldquoEstablecimientos Educativos en Bogotaacuterdquo publicariacuteamos un

diccionario de datos similar al siguiente

Nombre del atributo Definicioacuten Tipo de dato

Unidad de Medida

Dominio

Coacutedigo del establecimiento

Coacutedigo DANE asignado al Institucioacuten Educativa Decimal

Nombre del establecimiento

Nombre de la Institucioacuten Educativa Cadena de Caracteres

Aacuterea construida del establecimiento

Aacuterea construida de la Institucioacuten Educativa Decimal Metros

cuadrados

Sector

Clasificacioacuten asignada seguacuten la naturaleza juriacutedica la cual define las principales caracteriacutesticas que desde lo juriacutedico - administrativo y tiene que ver con el origen de su creacioacuten

Entero

EESector

No podriacuteamos olvidar detallar el dominio asociado

Atributo Nombre del Dominio Coacutedigo Definicioacuten

EESector

Oficial 1

Es una institucioacuten donde su naturaleza de servicio puacuteblico cultural y su funcioacuten social le es inherente cumpliendo con las disposiciones legales y estatutarias que las rigen donde sus rentas se conservan y se aplican debidamente

Privado 2

Es una institucioacuten constituida como persona juriacutedica de utilidad comuacuten donde sus rentas se conservan y se aplican debidamente y que en todo lo esencial se cumple con la voluntad de sus fundadores

21 Buenas praacutecticas para la publicacioacuten de datos

7 Acompantildear la publicacioacuten de los datos con enlaces a otros recursos

Un enlace es definido como una secuencia de caracteres que se utiliza como direccioacuten para

acceder a informacioacuten adicional16 maacutes sencillo puede definirse como una expresioacuten que

conecta una cierta informacioacuten con otra17Ahora bien un recurso se puede entender como

cualquier medio que satisfaga una necesidad por ejemplo datos servicios documentos o

software

En teacuterminos generales se sugiere que para facilitar al usuario la comprensioacuten de los datos

publicados se proporcionen recursos o documentos adicionales que puedan ser consultados

yo descargados traveacutes de enlaces o links de otro sitio Web

Dentro de los recursos adicionales que pueden publicarse para acompantildear el dato estaacuten los

procedimientos de captura del dato los cataacutelogos de objetos las especificaciones teacutecnicas los

documentos normativos los cataacutelogos de simbologiacutea los reportes de evaluacioacuten de calidad

entre otros

iquestQueacute logro

Mejorar la consulta utilizacioacuten y reutilizacioacuten de mis datos

Que los usuarios comprendan mejor mis datos

Que mis datos sean compartidos e intercambiados por un mayor nuacutemero de usuarios

iexclRecomendaciones

Disponga informacioacuten adicional de sus datos que le permita a los usuarios ampliar el

horizonte de las aplicaciones y funcionalidades en las que pueda utilizar y explotar del

dato

No olvide vincular o registrar esta informacioacuten en el metadato

16 httpdleraeesid=FTVRKyj 17 httpssistemascomenlacephp

22 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo 1

El ldquoMapa de Referencia para Bogotaacuterdquo publicado en httpswwwidecagovcoesserviciosmapa-de-referencia tiene publicados varios enlaces a otros recursos

Especificacioacuten teacutecnica para la elaboracioacuten del Mapa de Referencia para Bogotaacute DC V0318

Cataacutelogo de Objetos del Mapa de Referencia de Bogotaacute DC V 57

Cataacutelogo de Representacioacuten del Mapa de Referencia de Bogotaacute DC V30

Reporte de evaluacioacuten de calidad generado al Mapa de Referencia del Distrito Capital V1217

Ejemplo 2

La informacioacuten de los ldquohumedales de Bogotaacuterdquo publicada en

httpambientebogotagovcowebsdahumedales tiene publicados enlaces a otros recursos

o Gestioacuten de los humedales

o Poliacutetica de Humedales del Distrito Capital

o Normatividad

o Planes de Manejo Ambiental

o Comiteacute distrital de humedales documentos de consulta normatividad

23 Buenas praacutecticas para la publicacioacuten de datos

8 Depurar sus datos antes de publicarlos para garantizar su calidad y aumentar su confianza

La calidad estaacute definida como el conjunto de propiedades inherentes a algo que permiten

juzgar su valor18 para el caso que nos concierne este algo hace referencia al dato publicado

Ahora bien la calidad tambieacuten es entendida como la capacidad del dato publicado para

satisfacer los requerimientos y las necesidades de los usuarios respetando una serie de normas

y especificaciones establecidas

Actualmente existen muacuteltiples elementos de calidad de los datos que identifican las cualidades

de estos sin embargo en este aparte citaremos los elementos principales que usted o su

entidad deben tener en cuenta para publicar sus datos con un estaacutendar miacutenimo de calidad

Para maacutes informacioacuten consulte el Procedimiento para evaluar y reportar la calidad de

los datos espaciales

iquestQueacute logro

Que mis datos sean consultados utilizados y reutilizados por maacutes usuarios

Que los usuarios hablen bien de mis datos

Que mis datos sean maacutes interoperables y maacutes procesados

Que mis datos sean maacutes compartidos

Que mis datos sean maacutes confiables

Recomendacioacuten 1

Establezca si dentro de su conjunto de datos existen capos vaciacuteos o nulos con informacioacuten

descontextualizada sobrante o duplicada Si existen compleacutetelos o elimiacutenelos seguacuten

corresponda antes de la publicacioacuten El elemento de calidad asociado se denomina ldquototalidadrdquo

Localidad Atendidos Localidad Atendidos

Suba 200 Suba 200

Suba 200 Tunjuelito 500

Ameacutericas 100

850

Tunjuelito 500

18 httpdleraeesid=6nVpk8P|6nXVL1Z

Campo duplicado

Campo inconsistente

Campo vaciacuteo

24 Buenas praacutecticas para la publicacioacuten de datos

Recomendacioacuten 2

Identifique y transforme si es necesario los datos que hayan sido registrados en un formato

diferente al establecido para su conjunto de datos Es decir estandarice el formato de salida

del dato que va a publicar El elemento de calidad asociado se denomina ldquoconsistencia de

formatordquo

Localidad Atendidos Localidad Atendidos

Suba 200 Suba 200

Tunjuelito 5008 Tunjuelito 500

Fontiboacuten 40 Fontiboacuten 430

Tunjuelito 500 Tunjuelito 500

Recomendacioacuten 3

Si sus datos tienen alguacuten tipo de clasificacioacuten o rangos previo a la publicacioacuten valide que estos

se hayan registrado correctamente El elemento de calidad asociado se denomina ldquoexactitud de

clasificacioacutenrdquo

Geacutenero Edad Rango de Edad Geacutenero Edad Rango de Edad

Femenino 5 0 lt Edad le 10 Femenino 5 0 lt Edad le 10

Masculino 15 0 lt Edad le 10 Masculino 15 10 lt Edad le 20

Femenino 35 40 lt Edad le 50 Femenino 35 30 lt Edad le 40

Recomendacioacuten 4

Si sus datos representan atributos cuantitativos verifique antes de la publicacioacuten que estos

correspondan a valores conocidos como verdaderos El elemento de calidad asociado se

denomina ldquoexactitud de atributos cuantitativosrdquo

Localidad Mes Temperatura Localidad Mes Temperatura

Chapinero Enero 7degC Chapinero Enero 7degC

Suba Agosto -15degC Suba Agosto 15degC

Tunjuelito Abril 60degC Tunjuelito Abril 16degC

Clasificacioacuten inconsistente

Formato inconsistente

Valor inconsistente

25 Buenas praacutecticas para la publicacioacuten de datos

Recomendacioacuten 5

Si los datos a publicar tienen asociadas fechas de captura o recoleccioacuten de informacioacuten (Por

ejemplo registro de incidentes registro de vacunacioacuten conteo de vehiacuteculos etc) valide que

las fechas registradas coincidan con la fecha del evento capturado El elemento de calidad

asociado se denomina ldquoexactitud de la medicioacuten del tiempordquo

Precipitacioacuten (mm) Fecha de registro Precipitacioacuten (mm) Fecha de registro

00 20580101 00 20180101

01 20180102 01 20180102

126 20510403 126 20180103

20 20180104 20 20180104

Recomendacioacuten 6

Cuando sus datos reflejen informacioacuten determinada por un orden de eventos garantice antes

de la publicacioacuten que este orden sea el adecuado El elemento de calidad asociado se

denomina ldquoconsistencia temporalrdquo

Usuario Escolaridad Periodo de Estudio Usuario Escolaridad Periodo de Estudio

Usuario 1 Preescolar 20030101 ndash 20051231 Usuario 1 Preescolar 20030101 ndash 20051231

Usuario 1 Primaria 20030101 ndash 20101231 Usuario 1 Primaria 20060101 ndash 20101231

Usuario 1 Secundaria 20060101 ndash 20163112 Usuario 1 Secundaria 20110101 ndash 20143112

Usuario 1 Media 20150101 - 20163112 Usuario 1 Media 20150101 - 20163112

Recomendacioacuten 7

Si sus datos incluyen alguna ubicacioacuten (direccioacuten lugar coordenadas) verifique que esta

corresponda a la ubicacioacuten real El elemento de calidad asociado se denomina ldquoexactitud

posicionalrdquo

Eventos Deportivos Lugar Eventos Deportivos Lugar

Evento 1 AK 30 25 90 Evento 1 AK 30 25 90

Evento 2 AC 63 215 20 Evento 2 Parque La Florida

Evento 3 Parque Simoacuten Boliacutevar Evento 3 Parque Simoacuten Boliacutevar

Fecha

inconsistente

Fechas no secuenciales

Lugar inexistente

26 Buenas praacutecticas para la publicacioacuten de datos

9 Incorporar el componente geograacutefico en los datos publicados para optimizar su comprensioacuten uso re-uso y visualizacioacuten

El espacio geograacutefico es un punto de la superficie terrestre que se vea afectado o que afecte de

alguna manera a la humanidad19 Este punto de la superficie puede ser la direccioacuten de una

institucioacuten educativa la ubicacioacuten de un centro de vacunacioacuten el lugar donde se miden las

variaciones de traacutensito en la ciudad los parques de Bogotaacute el edificio en donde se llevan a

cabo los traacutemites de una entidad etc

Los datos que usted captura o recolecta en su quehacer misional siempre estaacuten asociados a un

espacio geograacutefico por lo tanto este componente deberiacutea ser incluido en los datos publicados

Tenga en cuenta que el componente geograacutefico lo puede incorporar incluyendo una ubicacioacuten

asociada a una direccioacuten a un lugar a una localidad a un barrio al nombre de un

establecimiento puacuteblicamente reconocido o a cualquier punto que permita al usuario

identificar la localizacioacuten del dato publicado

iquestQueacute logro

Ampliar el espectro de usuarios que consultan utilizan y reutilizan mis datos

Que mis datos sean maacutes interoperables y maacutes procesados

Que mis datos sean puedan compartir en maacutes plataformas

Que los usuarios puedan visualizar mis datos en un mapa

iexclRecomendaciones

Disponga sus datos agregando un atributo de ubicacioacuten como direcciones coordenadas o

lugares geograacuteficos

Ejemplo 1

Incluya direcciones que permitan localizar espacialmente sus datos

Programa Direccioacuten

Registro de atencioacuten a la ciudadaniacutea CL 138 108 16

Centro de autocuidado KR 18 D 77 A 11 SUR

Familias con un nintildeo en cupos cofinanciados CL 70 A SUR 20 46

Centro de autocuidado KR 18 D 73 A 33 SUR

19 httpenciclopediabanrepculturalorgindexphptitle=Espacio_geogrC3A1fico

27 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo 2

Utilice coordenadas para indicar la ubicacioacuten de sus datos

EPS Coordenada X Coordenada Y

EPS Convida 9087496334 1051342164

Capital Salud EPS 986321006 954875808

EPS Famisanar 9742508812 8837031501

Aliansalud EPS 9716943356 9659706891

Salud Total EPS 9215624975 9625189518

Tenga en cuenta que para publicar datos con coordenadas tendraacute que incluir dentro

de su metadato el Sistema de referencia empleado

MAGNA ndash SIRGAS EPSG 4686 httpsepsgio4686

MAGNA ndash SIRGAS EPSG 3116 httpsepsgio3116

MAGNA ndash BOGOTAacute SR-ORG 7458 httpspatialreferenceorgrefsr-org7458

Ejemplo 3

Tambieacuten puede incluir lugares geograacuteficos descriptivos asiacute

Usuario Vacunado Lugar de Vacunacioacuten

Usuario 1 BOSQUE IZQUIERDO

Usuario 2 LAGUNITAS URBANO

Usuario 3 LA CAPUCHINA

Usuario 4 SAN JOSE SUR

Usuario 5 VENECIA

28 Buenas praacutecticas para la publicacioacuten de datos

10 Asignar un identificador uacutenico que permita aumentar la consulta uso e interoperabilidad del dato publicado

Considere un identificador uacutenico como un texto que permite identificar inequiacutevocamente el

dato publicado Si usted va a publicar un dato buscando que este sea reutilizado por los

usuarios y por su propia entidad asignar un identificador facilitaraacute el descubrimiento y la

citacioacuten del dato a traveacutes del tiempo independientemente del estado la disponibilidad o el

formato de este

En la vida cotidiana mediante la ceacutedula de ciudadaniacutea se asigna a cada ciudadano un nuacutemero

de identificacioacuten uacutenico y a traveacutes de este identificador el ciudadano es reconocido a lo largo de

su vida e incluso despueacutes de su muerte por otras personas yo autoridades En el mundo de la

informacioacuten cada dato deberiacutea viajar con un identificador uacutenico que le permita ser encontrado

y reconocido faacutecilmente entre los demaacutes datos

Ahora bien si usted o su entidad publican continuamente datos establecer un sistema de

identificacioacuten comuacuten le permitiraacute identificar raacutepidamente los datos y los haraacute comparables por

cualquier usuario de manera confiable Esta condicioacuten es previa para lograr una correcta

gestioacuten y reutilizacioacuten de sus datos

iquestQueacute logro

Ampliar el espectro de usuarios que consultan utilizan y reutilizan mis datos

Que mis datos sean maacutes interoperables y maacutes procesados

Que mis datos sean compartidos en maacutes plataformas

Que mis datos puedan vincularse a otros datos en el entorno Web

Que mis datos sean encontrados usados y citados inequiacutevocamente

Garantizar y monitorear la reutilizacioacuten de mis datos

Reducir del uso erroacuteneo de mis datos

iexclRecomendaciones

Establezca un sistema de identificacioacuten comuacuten para los datos que va a publicar

Utilice siempre el identificador asignado para publicar sus datos

29 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo

IDECA ha dispuesto el Sistema de Registro de Iacutetems geograacuteficos

httpgeoitemsidecagovcogeoitemsano una herramienta web desarrollada para la

creacioacuten aprobacioacuten publicacioacuten y mantenimiento de iacutetems geograacuteficos que permite la

asignacioacuten concertada de identificadores y significados uacutenicos que contribuyen a la definicioacuten

de un lenguaje comuacuten para el desarrollo de nuevos sistema de informacioacuten en el Distrito

garantizando con ello su fiabilidad e interoperabilidad Adicionalmente permite almacenar

descripciones de la informacioacuten oficial producida e identificar su respectivo custodio jugando

asiacute un papel importante en el control y seguimiento de la produccioacuten de informacioacuten

geograacutefica

Este sistema asigna un identificador uacutenico a cada uno de los iacutetems creados Dentro de los iacutetems

publicados se reconoce el ID 65 como unidad de planeamiento y siempre que se hace

referencia a este objeto es suficiente nombrarlo asiacute para entender que se habla de ldquoUnidades

territoriales de anaacutelisis planeamiento y gestioacuten que tienen como propoacutesito definir y precisar el

planeamiento del suelo urbano de expansioacuten y ruralrdquo

30 Buenas praacutecticas para la publicacioacuten de datos

OBTENGA EL MAacuteS ALTO NIVEL EN PUBLICACIOacuteN DE DATOS

Hasta aquiacute hemos publicado las que consideramos como mejores praacutecticas de publicacioacuten de datos Ahora usted como publicador o como entidad debe evaluar si sus datos se estaacuten disponiendo con los maacutes altos y mejores estaacutendares de publicacioacuten

Lo invitamos a que valide en queacute nivel de publicacioacuten se encuentra su entidad teniendo en cuenta el siguiente listado

Nivel Baacutesico

En este nivel se encuentran aquellas entidades que publican sus datos en formatos estaacutendar y reutilizables (praacutectica 5) que integran a la publicacioacuten sus respectivos metadatos (praacutectica 1) y que acompantildean la publicacioacuten con una licencia asociada (praacutectica 2)

Nivel Intermedio

Este nivel lo alcanzan las entidades que superando el nivel baacutesico disponen un mayor volumen de informacioacuten gracias a que anonimizan sus datos (praacutectica 4) implementan medidas de calidad que aumentan la confianza en sus datos (praacutectica 8) incorporan el componente geograacutefico proporcionando valor agregado a sus datos (praacutectica 9) y publican un diccionario de datos que facilita la interpretacioacuten de los datos publicados (praacutectica 6)

Nivel Avanzado

Las entidades que superando el nivel intermedio utilizan vocabularios estandarizados en sus nuevas publicaciones (praacutectica 3) acompantildean la publicacioacuten de sus datos con enlaces a otros recursos (praacutectica 7) y asignan un identificador uacutenico para dato logrando asiacute aumentar su descubrimiento y reutilizacioacuten (praacutectica 10)

31 Buenas praacutecticas para la publicacioacuten de datos

REFERENCIAS

Bernadette Farias Loacutescio Caroline Burle Newton Calegari W3C Data on the Web Best

Practices 31 de enero de 2017 W3C Recommendation URL httpswwww3orgTRdwbp

Bernadette Hyland Ghislain Auguste Atemezing Boris Villazoacuten-Terrazas W3C Best Practices

for Publishing Linked Data 9 de enero de 2014 W3C Note URL httpswwww3orgTRld-bp

Dan Brickley Libby Miller FOAF project FOAF Vocabulary Specification 099 (Paddington

Edition) 14 de enero de 2014 URL httpxmlnscomfoafspec

Dublin Core metadata initiative DCMI Metadata Terms 14 de junio de 2012 DCMI

Recommendation URL httpdublincoreorgdocumentsdcmi-terms

Fadi Maali John Erickson W3C Data Catalog Vocabulary (DCAT) 16 de enero de 2014 W3C

Recommendation URL httpswwww3orgTRvocab-dcat

ISO 19115-12014 (E) Geographic information ndash Metadata Part1 Fundamentals 01 de abril de

2014 International Standard

ISO 191262009 (E) Geographic information -- Feature concept dictionaries and registers

noviembre de 2009 International Standard

ISO 191572013 (E) Geographic information ndash Data quality 15 de diciembre de 2013

International Standard

Jeremy Tandy Payam Barnaghi Linda van den Brink W3C Spatial Data on the Web Best

Practices 5 de enero 2017 W3C Note URL httpswwww3orgTRsdw-bp

T Berners-Lee R Fielding L Masinter IETF Uniform Resource Identifier (URI) Generic Syntax

Enero de 2005 Internet Standard URL httpstoolsietforghtmlrfc3986

World Wide Web Foundation Open Data Barometer URL httpopendatabarometerorg

W3C OWL Working Group W3C OWL 2 Web Ontology Language Document Overview (Second

Edition) 11 de diciembre de 2012 W3C Recommendation URL httpswwww3orgTRowl2-

overview

W3org Semantic Web - W3C URL httpswwww3orgstandardssemanticweb Consultado

el 12 de septiembre de 2018

Page 8: PARA LA PUBLICACIÓN DE DATOSideca.gov.co/.../files/documentacion/buenaspracticaspublicaciondat… · La obtención de datos la realiza cada entidad en el desarrollo de sus actividades

8 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo 1

En la siguiente URL se observa un metadato dispuesto para que los usuarios puedan consultar

faacutecilmente la informacioacuten asociada al dato publicado (Desarrollo Econoacutemico Rural Bogotaacute

DC)

httpmetadatosidecagovcogeoportalcatalogsearchresourcedetailspageuuid=A8AB6E

7A-55FB-40DA-85E1-0AA6B4FE6CE3

Ejemplo 2

En la siguiente URL estaacute disponible el metadato de un nivel de informacioacuten dispuesto por la

Unidad Administrativa Especial de Catastro Distrital ndash UAECD ndash en formato XML (legible por

aplicaciones informaacuteticas

httpmetadatosidecagovcogeoportalrestdocumentid=7BBE5F9AEE-1FBC-4C13-822F-

F2CE44AFDD7E7D

9 Buenas praacutecticas para la publicacioacuten de datos

2 Proporcionar una licencia en donde se especifiquen las limitaciones yo restricciones de acceso y uso de los datos

Una licencia entendida como las condiciones legales bajo las cuales estaacute disponible la obra2 es

un instrumento mediante el cual el propietario del dato autoriza o no a los usuarios para que

accedan a su contenido y tambieacuten lo faculta para su utilizacioacuten Existen diferentes tipos de

licencia para la distribucioacuten y explotacioacuten de obras y cuyo propoacutesito es regular las condiciones

de acceso y uso de los datos

Dependiendo el acceso autorizado a los datos las licencias pueden clasificarse en

Privativas o restrictivas Aquellas licencias conocidas como cerradas o no libres donde la mayoriacutea de las veces solo el autor puede usar la obra o en caso contrario se definen condiciones especiacuteficas que se deben cumplir para hacer uso de la informacioacuten

Semilibres Aquellas licencias que requieren autorizaciones para que los usuarios utilicen copien distribuyan o modifiquen su contenido

Libres o abiertas Aquellas licencias que en teacuterminos generales permiten usar distribuir y compartir los datos con muy pocas restricciones

Cuando un dato se publica acompantildeado de su licencia el usuario conoce las condiciones de

acceso uso y distribucioacuten de los datos que estaacute consumiendo de esta forma se garantiza que

los datos se distribuyan seguacuten los intereses de la entidad que los produce y se minimizan los

usos indebidos de los datos por parte de los usuarios

Ahora bien definir la licencia adecuada para cada dato dependeraacute de las condiciones que

establezca la entidad productora de este Revise los ejemplos y defina la licencia maacutes adecuada

para sus datos

Para maacutes informacioacuten consulte el Instructivo para la definicioacuten de licencias de datos

iquestQueacute logro

Que el usuario evaluacutee si puede o no usar mis datos

Que el usuario conozca las condiciones de acceso uso y manejo sobre los datos

disponibles

Dar claridad y potenciar el uso de los datos disponibles

Que el usuario de los reconocimientos respectivos a la entidad productora de los datos

Que se genere valor agregado sobre los datos disponibles en caso de asignar una

licencia abierta

2 Recuperado de httpsopendefinitionorgod21es

10 Buenas praacutecticas para la publicacioacuten de datos

iexclRecomendaciones

Identifique la licencia que mejor se acomode a su modelo de negocio Recuerde que

mediante la Ley 1712 de 2014 se reguloacute el derecho de acceso a la informacioacuten puacuteblica

y se incluyeron los principios de facilitacioacuten gratuidad y divulgacioacuten proactiva de la

informacioacuten

Disponga una licencia para su conjunto de datos a traveacutes de un enlace una copia

incorporada o dentro del metadato

Prefiera el uso de licencias abiertas de este modo sus datos seraacuten utilizados en una

mayor cantidad de productos servicios y mercados

Ejemplo 1

Mundialmente conocidas las licencias Creative Commons3 tienen como objetivo fortalecer a los

creadores para que sean quienes definan los teacuterminos en que sus obras pueden ser usadas queacute

derechos desean entregar y en queacute condiciones lo haraacuten A continuacioacuten encontraraacute los

enlaces de acceso para conocer las condiciones de cada una de las licencias disponibles

CC0 10 httpscreativecommonsorgpublicdomainzero10deedes

CC BY 40 httpscreativecommonsorglicensesby40

CC BY-SA 40 httpscreativecommonsorglicensesby-sa40

CC BY-ND 40 httpscreativecommonsorglicensesby-nd40

CC BY-NC 40 httpscreativecommonsorglicensesby-nc40

CC BY-NC-SA 40

httpscreativecommonsorglicensesby-nc-sa40

Ejemplo 2

Tambieacuten existen las licencias abiertas para datos Open Data Commons4 proporcionadas por la

mundialmente conocida red Open Knowledge Foundation Network ndash OKFN5 puede consultar

las condiciones ingresando a los siguientes enlaces

ODbL 10 httpsopendatacommonsorglicensesodblsummary

PDDL 10 httpsopendatacommonsorglicensespddlsummary

ODC-BY 10 httpsopendatacommonsorglicensesbysummary

3 httpcreativecommonsorg 4 httpopendatacommonsorg 5 httpsokfnorg

11 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo 3

El Mapa de referencia para Bogotaacute estaacute publicado en

httpswwwidecagovcoesserviciosmapa-de-referencia bajo las condiciones descritas en la

ldquoLICENCIA ABIERTA O CONDICIONES DE USO PARA DATOS ABIERTOS DE LA INFRAESTRUCTURA

INTEGRADA DE DATOS ESPACIALES PARA EL DISTRITO CAPITAL (IDECA)rdquo

httpswwwidecagovcoeslicenciaabierta

12 Buenas praacutecticas para la publicacioacuten de datos

3 Utilizar vocabularios estandarizados y reutilizables en la estructuracioacuten y publicacioacuten de los datos

Un vocabulario define los conceptos y las relaciones que se utilizan para describir y representar

un aacuterea de intereacutes6 Cuando se publican datos en la Web los vocabularios permiten integrar

datos cuando existen ambiguumledades en los teacuterminos utilizados en los diferentes conjuntos de

datos En la praacutectica un vocabulario es un conjunto de palabras que permiten a dos usuarios

comunicarse entre siacute La efectividad de dicha comunicacioacuten radica en que el significado de una

palabra para el usuario emisor sea el mismo que para el usuario receptor independientemente

de si utilizaron el mismo teacutermino

Cuando se habla de interoperabilidad de datos lo que se espera es que tanto los usuarios

como las aplicaciones informaacuteticas entiendan y comprendan la mayor cantidad de informacioacuten

que estaacuten consumiendo Para conseguir esto las comunidades de datos han identificado

vocablos palabras o teacuterminos de uso comuacuten los cuales cuentan con significados apropiados y

que actualmente se encuentran integrados y estructurados en diferentes estaacutendares

internacionales

Se recomienda utilizar vocabularios de este tipo para estandarizar los datos contenidos en la

informacioacuten publicada

iquestQueacute logro

Que mis datos sean consultados utilizados y reutilizados por maacutes usuarios Que se reduzca la ambiguumledad en la interpretacioacuten de mis datos Que mis datos sean interoperables Que mis datos sean procesados en entornos nacionales e internacionales Que mis datos puedan ser compartidos e intercambiados entre sistemas Que mis datos sean maacutes confiables

iexclRecomendaciones

Consulte normas locales o vocabularios internacionales para la estructuracioacuten7 de sus

datos

Apropie los vocabularios consultados y adapte sus datos a estos en los casos en que sea

posible

Incluya vocabularios ya definidos y reconocidos internacionalmente cuando vaya a

producir nuevos datos

6 httpswwww3orgstandardssemanticwebontology 7 Estructurar significa ajustar los datos a un esquema fijo

13 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo 1

A continuacioacuten se presentan algunos vocabularios internacionales que puede consultar y

apropiar para optimizar el intercambio de sus datos

Data Catalog Vocabulary (DCAT) httpswwww3orgTRvocab-dcatclass-catalog

FOAF Vocabulary Specification httpxmlnscomfoaf01

ISOTC 211 Geographic informationGeomatics Terminology

httpwwwisotc211orgTerminologyhtm

The RDF Data Cube Vocabulary httpswwww3orgTR2014REC-vocab-data-cube-20140116

ODRL Vocabulary amp Expression 22

httpswwww3orgTR2018REC-odrl-vocab-20180215

HTTP Vocabulary in RDF 10 httpswwww3orgTR2017NOTE-HTTP-in-RDF10-20170202

vCard Ontology - for describing People and Organizations

httpswwww3orgTRvcard-rdf

Ejemplo 2

En el contexto Nacional el Ministerio de Tecnologiacuteas de la Informacioacuten y las Comunicaciones ha

establecido el Lenguaje Comuacuten de Intercambio de como un instrumento de consulta que

contiene la definicioacuten de los elementos de datos conceptualizados por las entidades del

estado La consulta la puede realizar en httplenguajeminticgovco

14 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo 3

La especificacioacuten vCard disponible en httpswwww3orgTRvcard-rdf promueve un

vocabulario especiacutefico para describir personas y organizaciones

Uno de los vocablos que describe esta especificacioacuten es la ldquodireccioacuten de entregardquo llamado

dentro del vocabulario como ADR y definido como ldquola direccioacuten del objeto representado en

partes estructuradasrdquo

Ahora bien este vocabulario especifica los componentes de la direccioacuten de entrega para el

objeto asiacute el nombre del paiacutes la localidad el coacutedigo postal la regioacuten y la direccioacuten dada por

viacuteas (calles y carreras en el caso colombiano) Esto quiere decir que cualquiera de los

componentes descritos puede usarse como direccioacuten de entrega vaacutelida ya que son equivalentes

entre siacute

Aunque en el vocabulario la direccioacuten de entrega se llame ADR el usuario de la informacioacuten

entenderaacute que un nombre de paiacutes o un coacutedigo postal pueden interpretarse como ADR

15 Buenas praacutecticas para la publicacioacuten de datos

4 Anonimizar los datos de caraacutecter personal informacioacuten estadiacutestica informacioacuten indirectamente identificable e informacioacuten sensible o confidencial

Anonimizar es el proceso que impide la identificacioacuten de las unidades de estudio que son fuente

para los registros individuales de un conjunto8 de datos o maacutes claro es la aplicacioacuten de teacutecnicas

que permitan expresar un dato relativo a personas eliminando la referencia a su identidad9

Baacutesicamente lo que se busca es reducir los riesgos en el uso y procesamiento de datos

personales evitar la extraccioacuten de registros que identifican a una persona reducir la

combinacioacuten de dos o maacutes registros en una o varias bases de datos para identificar a una

persona y minimizar la deduccioacuten de datos personales partir de uno o varios datos publicados

iquestQueacute informacioacuten debo prioritariamente anonimizar

Datos personales Informacioacuten numeacuterica alfabeacutetica graacutefica fotograacutefica acuacutestica o

cualquier otro tipo susceptible de recogida registro tratamiento y transmisioacuten

concerniente a personas fiacutesicas identificadas o identificables (tales como nombre

apellidos estado civil sexo edad domicilio identificacioacuten personal nuacutemero de

teleacutefono etc)10

Informacioacuten sensible Informacioacuten considerada como estrictamente confidencial

Informacioacuten y caracteriacutesticas referentes a la edad procedencia salud raza religioacuten

ideologiacutea afiliacioacuten finanzas etc se consideran de caraacutecter sensible y requieren de

una proteccioacuten especial11

iquestQueacute logro

Garantizar que mis datos publicados cuentan con medidas de proteccioacuten de datos

personales

Eliminar de manera efectiva el riesgo de re-identificacioacuten

Evitar que el procesamiento de mis datos tenga consecuencias negativas para alguna

persona

Disponer muchos maacutes datos sin invadir la informacioacuten personal

iexclRecomendaciones

Implemente actividades de proteccioacuten de la privacidad de los datos personales antes

de publicarlos

Elimine cualquier identificador directo de la persona (nombre documento de

identidad etc)

8 httpswwwdanegovcofilessenlineamientosDSO_020_LIN_08pdf 9 httpdleraeesid=2jjMiRi 10 httpswwwdanegovcofilessenlineamientosDSO_020_LIN_08pdf 11 Ibidem

16 Buenas praacutecticas para la publicacioacuten de datos

Reemplace los identificadores directos por coacutedigos de referencia pseudoacutenimos

(algoritmos AES12 o un hash cifrado HMAC13) coacutedigos arbitrarios o aleatorios

Si reemplazando el identificador directo auacuten es faacutecil identificar a la persona elimine el

dato

Clasifique yo categorice los datos

Redondee los datos numeacutericos hacia arriba o hacia abajo

Evaluacutee antes durante y despueacutes de publicados los datos si la anonimizacioacuten de sus

datos es suficiente y evaluacutee regularmente los riesgos existentes

Para maacutes informacioacuten consulte los Lineamientos para la Anonimizacioacuten de micro datos

Ejemplo 1

Antes de publicar sus datos retire el identificador directo de la persona En este caso

reemplace en nuacutemero de documento que identifica al usuario y reemplaacutecelo por un

consecutivo

Usuario Beneficio Usuario Beneficio

80123456 Subsidio de vivienda Usuario 1 Subsidio de vivienda

51123456 Subsidio de alimentacioacuten Usuario 2 Subsidio de alimentacioacuten

19123456 Subsidio al adulto mayor Usuario 3 Subsidio al adulto mayor

53123456 Subsidio de desempleo Usuario 4 Subsidio de desempleo

Ejemplo 2

Clasifique o categorice sus datos En este ejemplo asigne rangos a la edad de manera tal que el

titular del registro no sea identificable por este dato

Usuario Edad Usuario Rango de edad

Usuario 1 11 antildeos Usuario 1 Entre 10 y 15 antildeos

Usuario 2 22 antildeos Usuario 2 Entre 20 y 25 antildeos

Usuario 3 36 antildeos Usuario 3 Entre 35 y 40 antildeos

Usuario 4 63 antildeos Usuario 4 Entre 60 y 65 antildeos

12 Advanced Encryption Standard puede consultar como ha sido implementado este algoritmo en httpsrevistasudistritaleducoojsindexphpTecnuraarticleview72368892 13 Hash-based Message Authentication Code puede consultar como se crea este cifrado en httpsdocsoraclecomcdE19253-01819-7804wanboottasks2-51indexhtml

17 Buenas praacutecticas para la publicacioacuten de datos

5 Publicar los datos en formatos estaacutendar reutilizables y legibles por aplicaciones informaacuteticas

Un formato puede ser definido como la estructura de un disco dividido en campos y pistas

seguacuten un determinado sistema operativo lo que permite almacenar en eacutel informacioacuten14

baacutesicamente es la forma en que se codifican los datos en un archivo informaacutetico

Actualmente conocemos formatos comunes de almacenamiento como el doc una extensioacuten

de Word que almacena texto y cuyo propietario es la compantildeiacutea Microsoft Pero iquestqueacute pasa si un

usuario quiere abrir un documento doc en un procesador de texto diferente a Word

difiacutecilmente va a poder conocer el contenido de dicho documento sin tener esta licencia

Lo que queremos lograr con la implementacioacuten de esta praacutectica es que todos los usuarios que

encuentren mis datos puedan accederlos sin necesidad de contar con un software o aplicacioacuten

informaacutetica especiacutefica

iquestQueacute logro

Que mis datos sean consultados utilizados y reutilizados por maacutes usuarios

Que mis datos sean maacutes interoperables y maacutes procesados

Que mis datos puedan ser extraiacutedos transformados y procesados por aplicaciones

informaacuteticas

Que mis datos puedan ser compartidos e intercambiados entre sistemas

Disminuir los costos y los tiempos en el uso y la transformacioacuten de mis datos

iexclRecomendaciones

Prefiera publicar su conjunto de datos en formatos abiertos o no propietario ya que

estos facilitan el uso re-uso y distribucioacuten de estos Se busca que un mayor nuacutemero de

aplicaciones informaacuteticas pueda extraer leer y transformar los datos generando mayor

uso y re-uso por los usuarios

Disponga sus datos en muacuteltiples formatos con el fin de incrementar el acceso a los

mismos Se busca que el mayor nuacutemero de usuarios pueda utilizar los datos sin tener

que transformarlos primero en su formato preferido

Utilice Web Services para mejorar el intercambio e interoperabilidad de los datos

publicados

14 httpdleraeessrvsearchm=30ampw=formato

18 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo 1

A continuacioacuten encontraraacute extensiones de formato propietario y no propietario prefiera para

la publicacioacuten de sus datos las extensiones de la derecha

FORMATO PROPIETARIO FORMATO NO PROPIETARIO

DOC GDB TXT ASCII Grid KML RDF

XLS DWG CSV GeoJSON DXF XML

PPT SHP JSON GML ODF

Ejemplo 2

Si no fue posible utilizar una extensioacuten de formato no propietario publique sus datos en una

variedad de formatos que le permita al usuario acceder a los datos desde diferentes

aplicaciones informaacuteticas

Ejemplo 3

Para publicar sus datos conozca diferentes tipos de Web Services que viajan en la red utilizando extensiones XML

SOAP httpswwww3orgTRsoap

REST httprestelksteinorg

WMS httpwwwopengeospatialorgstandardswms

WFS httpwwwopengeospatialorgstandardswfs

WCS httpwwwopengeospatialorgstandardswcs

19 Buenas praacutecticas para la publicacioacuten de datos

6 Proporcionar un diccionario de datos que facilite el uso e interpretacioacuten de los datos publicados

Un diccionario estaacute definido como un repertorio en forma de libro o en soporte electroacutenico en el

que se recogen seguacuten un orden determinado las palabras o expresiones de una o maacutes lenguas

o de una materia concreta acompantildeadas de su definicioacuten equivalencia o explicacioacuten15

especiacuteficamente en un diccionario de datos se encuentran los conceptos de los datos y sus

propiedades (atributos dominios asociaciones y operaciones) acompantildeados de una definicioacuten

en donde se identifica el propoacutesito alcance y campo de aplicacioacuten del dato publicado

Lograr que los usuarios de mis datos entiendan la informacioacuten que estaacute publicada le permitiraacute

decidir si satisfacen o no su necesidad y le facilitaraacute la decisioacuten para explotar lo datos

Para maacutes informacioacuten consulte el Instructivo Diccionario de Datos

iquestQueacute logro

Que mis datos sean consultados utilizados y reutilizados por maacutes usuarios

Que se eviten ambiguumledades en la interpretacioacuten de mis datos

Que mis datos publicados esteacuten unificados y consistentes

Que los usuarios comprendan mejor y dispongan de claridad sobre los conceptos de

mis datos

iexclRecomendaciones

Publique como miacutenimo un diccionario de datos que contenga la caracterizacioacuten del

conjunto de datos producidos por su entidad

Cree el diccionario de datos teniendo en cuenta como miacutenimo la siguiente informacioacuten

Nombre del atributo Nombre que identifica de manera clara un atributo

Definicioacuten Descripcioacuten del atributo

Tipo de dato Tipo de valor del atributo

Unidad de medida Expresa la unidad de medida del atributo

Dominio Determina si el atributo tiene asociado un dominio

15 httpdleraeesw=diccionario

20 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo

Para el conjunto de datos ldquoEstablecimientos Educativos en Bogotaacuterdquo publicariacuteamos un

diccionario de datos similar al siguiente

Nombre del atributo Definicioacuten Tipo de dato

Unidad de Medida

Dominio

Coacutedigo del establecimiento

Coacutedigo DANE asignado al Institucioacuten Educativa Decimal

Nombre del establecimiento

Nombre de la Institucioacuten Educativa Cadena de Caracteres

Aacuterea construida del establecimiento

Aacuterea construida de la Institucioacuten Educativa Decimal Metros

cuadrados

Sector

Clasificacioacuten asignada seguacuten la naturaleza juriacutedica la cual define las principales caracteriacutesticas que desde lo juriacutedico - administrativo y tiene que ver con el origen de su creacioacuten

Entero

EESector

No podriacuteamos olvidar detallar el dominio asociado

Atributo Nombre del Dominio Coacutedigo Definicioacuten

EESector

Oficial 1

Es una institucioacuten donde su naturaleza de servicio puacuteblico cultural y su funcioacuten social le es inherente cumpliendo con las disposiciones legales y estatutarias que las rigen donde sus rentas se conservan y se aplican debidamente

Privado 2

Es una institucioacuten constituida como persona juriacutedica de utilidad comuacuten donde sus rentas se conservan y se aplican debidamente y que en todo lo esencial se cumple con la voluntad de sus fundadores

21 Buenas praacutecticas para la publicacioacuten de datos

7 Acompantildear la publicacioacuten de los datos con enlaces a otros recursos

Un enlace es definido como una secuencia de caracteres que se utiliza como direccioacuten para

acceder a informacioacuten adicional16 maacutes sencillo puede definirse como una expresioacuten que

conecta una cierta informacioacuten con otra17Ahora bien un recurso se puede entender como

cualquier medio que satisfaga una necesidad por ejemplo datos servicios documentos o

software

En teacuterminos generales se sugiere que para facilitar al usuario la comprensioacuten de los datos

publicados se proporcionen recursos o documentos adicionales que puedan ser consultados

yo descargados traveacutes de enlaces o links de otro sitio Web

Dentro de los recursos adicionales que pueden publicarse para acompantildear el dato estaacuten los

procedimientos de captura del dato los cataacutelogos de objetos las especificaciones teacutecnicas los

documentos normativos los cataacutelogos de simbologiacutea los reportes de evaluacioacuten de calidad

entre otros

iquestQueacute logro

Mejorar la consulta utilizacioacuten y reutilizacioacuten de mis datos

Que los usuarios comprendan mejor mis datos

Que mis datos sean compartidos e intercambiados por un mayor nuacutemero de usuarios

iexclRecomendaciones

Disponga informacioacuten adicional de sus datos que le permita a los usuarios ampliar el

horizonte de las aplicaciones y funcionalidades en las que pueda utilizar y explotar del

dato

No olvide vincular o registrar esta informacioacuten en el metadato

16 httpdleraeesid=FTVRKyj 17 httpssistemascomenlacephp

22 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo 1

El ldquoMapa de Referencia para Bogotaacuterdquo publicado en httpswwwidecagovcoesserviciosmapa-de-referencia tiene publicados varios enlaces a otros recursos

Especificacioacuten teacutecnica para la elaboracioacuten del Mapa de Referencia para Bogotaacute DC V0318

Cataacutelogo de Objetos del Mapa de Referencia de Bogotaacute DC V 57

Cataacutelogo de Representacioacuten del Mapa de Referencia de Bogotaacute DC V30

Reporte de evaluacioacuten de calidad generado al Mapa de Referencia del Distrito Capital V1217

Ejemplo 2

La informacioacuten de los ldquohumedales de Bogotaacuterdquo publicada en

httpambientebogotagovcowebsdahumedales tiene publicados enlaces a otros recursos

o Gestioacuten de los humedales

o Poliacutetica de Humedales del Distrito Capital

o Normatividad

o Planes de Manejo Ambiental

o Comiteacute distrital de humedales documentos de consulta normatividad

23 Buenas praacutecticas para la publicacioacuten de datos

8 Depurar sus datos antes de publicarlos para garantizar su calidad y aumentar su confianza

La calidad estaacute definida como el conjunto de propiedades inherentes a algo que permiten

juzgar su valor18 para el caso que nos concierne este algo hace referencia al dato publicado

Ahora bien la calidad tambieacuten es entendida como la capacidad del dato publicado para

satisfacer los requerimientos y las necesidades de los usuarios respetando una serie de normas

y especificaciones establecidas

Actualmente existen muacuteltiples elementos de calidad de los datos que identifican las cualidades

de estos sin embargo en este aparte citaremos los elementos principales que usted o su

entidad deben tener en cuenta para publicar sus datos con un estaacutendar miacutenimo de calidad

Para maacutes informacioacuten consulte el Procedimiento para evaluar y reportar la calidad de

los datos espaciales

iquestQueacute logro

Que mis datos sean consultados utilizados y reutilizados por maacutes usuarios

Que los usuarios hablen bien de mis datos

Que mis datos sean maacutes interoperables y maacutes procesados

Que mis datos sean maacutes compartidos

Que mis datos sean maacutes confiables

Recomendacioacuten 1

Establezca si dentro de su conjunto de datos existen capos vaciacuteos o nulos con informacioacuten

descontextualizada sobrante o duplicada Si existen compleacutetelos o elimiacutenelos seguacuten

corresponda antes de la publicacioacuten El elemento de calidad asociado se denomina ldquototalidadrdquo

Localidad Atendidos Localidad Atendidos

Suba 200 Suba 200

Suba 200 Tunjuelito 500

Ameacutericas 100

850

Tunjuelito 500

18 httpdleraeesid=6nVpk8P|6nXVL1Z

Campo duplicado

Campo inconsistente

Campo vaciacuteo

24 Buenas praacutecticas para la publicacioacuten de datos

Recomendacioacuten 2

Identifique y transforme si es necesario los datos que hayan sido registrados en un formato

diferente al establecido para su conjunto de datos Es decir estandarice el formato de salida

del dato que va a publicar El elemento de calidad asociado se denomina ldquoconsistencia de

formatordquo

Localidad Atendidos Localidad Atendidos

Suba 200 Suba 200

Tunjuelito 5008 Tunjuelito 500

Fontiboacuten 40 Fontiboacuten 430

Tunjuelito 500 Tunjuelito 500

Recomendacioacuten 3

Si sus datos tienen alguacuten tipo de clasificacioacuten o rangos previo a la publicacioacuten valide que estos

se hayan registrado correctamente El elemento de calidad asociado se denomina ldquoexactitud de

clasificacioacutenrdquo

Geacutenero Edad Rango de Edad Geacutenero Edad Rango de Edad

Femenino 5 0 lt Edad le 10 Femenino 5 0 lt Edad le 10

Masculino 15 0 lt Edad le 10 Masculino 15 10 lt Edad le 20

Femenino 35 40 lt Edad le 50 Femenino 35 30 lt Edad le 40

Recomendacioacuten 4

Si sus datos representan atributos cuantitativos verifique antes de la publicacioacuten que estos

correspondan a valores conocidos como verdaderos El elemento de calidad asociado se

denomina ldquoexactitud de atributos cuantitativosrdquo

Localidad Mes Temperatura Localidad Mes Temperatura

Chapinero Enero 7degC Chapinero Enero 7degC

Suba Agosto -15degC Suba Agosto 15degC

Tunjuelito Abril 60degC Tunjuelito Abril 16degC

Clasificacioacuten inconsistente

Formato inconsistente

Valor inconsistente

25 Buenas praacutecticas para la publicacioacuten de datos

Recomendacioacuten 5

Si los datos a publicar tienen asociadas fechas de captura o recoleccioacuten de informacioacuten (Por

ejemplo registro de incidentes registro de vacunacioacuten conteo de vehiacuteculos etc) valide que

las fechas registradas coincidan con la fecha del evento capturado El elemento de calidad

asociado se denomina ldquoexactitud de la medicioacuten del tiempordquo

Precipitacioacuten (mm) Fecha de registro Precipitacioacuten (mm) Fecha de registro

00 20580101 00 20180101

01 20180102 01 20180102

126 20510403 126 20180103

20 20180104 20 20180104

Recomendacioacuten 6

Cuando sus datos reflejen informacioacuten determinada por un orden de eventos garantice antes

de la publicacioacuten que este orden sea el adecuado El elemento de calidad asociado se

denomina ldquoconsistencia temporalrdquo

Usuario Escolaridad Periodo de Estudio Usuario Escolaridad Periodo de Estudio

Usuario 1 Preescolar 20030101 ndash 20051231 Usuario 1 Preescolar 20030101 ndash 20051231

Usuario 1 Primaria 20030101 ndash 20101231 Usuario 1 Primaria 20060101 ndash 20101231

Usuario 1 Secundaria 20060101 ndash 20163112 Usuario 1 Secundaria 20110101 ndash 20143112

Usuario 1 Media 20150101 - 20163112 Usuario 1 Media 20150101 - 20163112

Recomendacioacuten 7

Si sus datos incluyen alguna ubicacioacuten (direccioacuten lugar coordenadas) verifique que esta

corresponda a la ubicacioacuten real El elemento de calidad asociado se denomina ldquoexactitud

posicionalrdquo

Eventos Deportivos Lugar Eventos Deportivos Lugar

Evento 1 AK 30 25 90 Evento 1 AK 30 25 90

Evento 2 AC 63 215 20 Evento 2 Parque La Florida

Evento 3 Parque Simoacuten Boliacutevar Evento 3 Parque Simoacuten Boliacutevar

Fecha

inconsistente

Fechas no secuenciales

Lugar inexistente

26 Buenas praacutecticas para la publicacioacuten de datos

9 Incorporar el componente geograacutefico en los datos publicados para optimizar su comprensioacuten uso re-uso y visualizacioacuten

El espacio geograacutefico es un punto de la superficie terrestre que se vea afectado o que afecte de

alguna manera a la humanidad19 Este punto de la superficie puede ser la direccioacuten de una

institucioacuten educativa la ubicacioacuten de un centro de vacunacioacuten el lugar donde se miden las

variaciones de traacutensito en la ciudad los parques de Bogotaacute el edificio en donde se llevan a

cabo los traacutemites de una entidad etc

Los datos que usted captura o recolecta en su quehacer misional siempre estaacuten asociados a un

espacio geograacutefico por lo tanto este componente deberiacutea ser incluido en los datos publicados

Tenga en cuenta que el componente geograacutefico lo puede incorporar incluyendo una ubicacioacuten

asociada a una direccioacuten a un lugar a una localidad a un barrio al nombre de un

establecimiento puacuteblicamente reconocido o a cualquier punto que permita al usuario

identificar la localizacioacuten del dato publicado

iquestQueacute logro

Ampliar el espectro de usuarios que consultan utilizan y reutilizan mis datos

Que mis datos sean maacutes interoperables y maacutes procesados

Que mis datos sean puedan compartir en maacutes plataformas

Que los usuarios puedan visualizar mis datos en un mapa

iexclRecomendaciones

Disponga sus datos agregando un atributo de ubicacioacuten como direcciones coordenadas o

lugares geograacuteficos

Ejemplo 1

Incluya direcciones que permitan localizar espacialmente sus datos

Programa Direccioacuten

Registro de atencioacuten a la ciudadaniacutea CL 138 108 16

Centro de autocuidado KR 18 D 77 A 11 SUR

Familias con un nintildeo en cupos cofinanciados CL 70 A SUR 20 46

Centro de autocuidado KR 18 D 73 A 33 SUR

19 httpenciclopediabanrepculturalorgindexphptitle=Espacio_geogrC3A1fico

27 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo 2

Utilice coordenadas para indicar la ubicacioacuten de sus datos

EPS Coordenada X Coordenada Y

EPS Convida 9087496334 1051342164

Capital Salud EPS 986321006 954875808

EPS Famisanar 9742508812 8837031501

Aliansalud EPS 9716943356 9659706891

Salud Total EPS 9215624975 9625189518

Tenga en cuenta que para publicar datos con coordenadas tendraacute que incluir dentro

de su metadato el Sistema de referencia empleado

MAGNA ndash SIRGAS EPSG 4686 httpsepsgio4686

MAGNA ndash SIRGAS EPSG 3116 httpsepsgio3116

MAGNA ndash BOGOTAacute SR-ORG 7458 httpspatialreferenceorgrefsr-org7458

Ejemplo 3

Tambieacuten puede incluir lugares geograacuteficos descriptivos asiacute

Usuario Vacunado Lugar de Vacunacioacuten

Usuario 1 BOSQUE IZQUIERDO

Usuario 2 LAGUNITAS URBANO

Usuario 3 LA CAPUCHINA

Usuario 4 SAN JOSE SUR

Usuario 5 VENECIA

28 Buenas praacutecticas para la publicacioacuten de datos

10 Asignar un identificador uacutenico que permita aumentar la consulta uso e interoperabilidad del dato publicado

Considere un identificador uacutenico como un texto que permite identificar inequiacutevocamente el

dato publicado Si usted va a publicar un dato buscando que este sea reutilizado por los

usuarios y por su propia entidad asignar un identificador facilitaraacute el descubrimiento y la

citacioacuten del dato a traveacutes del tiempo independientemente del estado la disponibilidad o el

formato de este

En la vida cotidiana mediante la ceacutedula de ciudadaniacutea se asigna a cada ciudadano un nuacutemero

de identificacioacuten uacutenico y a traveacutes de este identificador el ciudadano es reconocido a lo largo de

su vida e incluso despueacutes de su muerte por otras personas yo autoridades En el mundo de la

informacioacuten cada dato deberiacutea viajar con un identificador uacutenico que le permita ser encontrado

y reconocido faacutecilmente entre los demaacutes datos

Ahora bien si usted o su entidad publican continuamente datos establecer un sistema de

identificacioacuten comuacuten le permitiraacute identificar raacutepidamente los datos y los haraacute comparables por

cualquier usuario de manera confiable Esta condicioacuten es previa para lograr una correcta

gestioacuten y reutilizacioacuten de sus datos

iquestQueacute logro

Ampliar el espectro de usuarios que consultan utilizan y reutilizan mis datos

Que mis datos sean maacutes interoperables y maacutes procesados

Que mis datos sean compartidos en maacutes plataformas

Que mis datos puedan vincularse a otros datos en el entorno Web

Que mis datos sean encontrados usados y citados inequiacutevocamente

Garantizar y monitorear la reutilizacioacuten de mis datos

Reducir del uso erroacuteneo de mis datos

iexclRecomendaciones

Establezca un sistema de identificacioacuten comuacuten para los datos que va a publicar

Utilice siempre el identificador asignado para publicar sus datos

29 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo

IDECA ha dispuesto el Sistema de Registro de Iacutetems geograacuteficos

httpgeoitemsidecagovcogeoitemsano una herramienta web desarrollada para la

creacioacuten aprobacioacuten publicacioacuten y mantenimiento de iacutetems geograacuteficos que permite la

asignacioacuten concertada de identificadores y significados uacutenicos que contribuyen a la definicioacuten

de un lenguaje comuacuten para el desarrollo de nuevos sistema de informacioacuten en el Distrito

garantizando con ello su fiabilidad e interoperabilidad Adicionalmente permite almacenar

descripciones de la informacioacuten oficial producida e identificar su respectivo custodio jugando

asiacute un papel importante en el control y seguimiento de la produccioacuten de informacioacuten

geograacutefica

Este sistema asigna un identificador uacutenico a cada uno de los iacutetems creados Dentro de los iacutetems

publicados se reconoce el ID 65 como unidad de planeamiento y siempre que se hace

referencia a este objeto es suficiente nombrarlo asiacute para entender que se habla de ldquoUnidades

territoriales de anaacutelisis planeamiento y gestioacuten que tienen como propoacutesito definir y precisar el

planeamiento del suelo urbano de expansioacuten y ruralrdquo

30 Buenas praacutecticas para la publicacioacuten de datos

OBTENGA EL MAacuteS ALTO NIVEL EN PUBLICACIOacuteN DE DATOS

Hasta aquiacute hemos publicado las que consideramos como mejores praacutecticas de publicacioacuten de datos Ahora usted como publicador o como entidad debe evaluar si sus datos se estaacuten disponiendo con los maacutes altos y mejores estaacutendares de publicacioacuten

Lo invitamos a que valide en queacute nivel de publicacioacuten se encuentra su entidad teniendo en cuenta el siguiente listado

Nivel Baacutesico

En este nivel se encuentran aquellas entidades que publican sus datos en formatos estaacutendar y reutilizables (praacutectica 5) que integran a la publicacioacuten sus respectivos metadatos (praacutectica 1) y que acompantildean la publicacioacuten con una licencia asociada (praacutectica 2)

Nivel Intermedio

Este nivel lo alcanzan las entidades que superando el nivel baacutesico disponen un mayor volumen de informacioacuten gracias a que anonimizan sus datos (praacutectica 4) implementan medidas de calidad que aumentan la confianza en sus datos (praacutectica 8) incorporan el componente geograacutefico proporcionando valor agregado a sus datos (praacutectica 9) y publican un diccionario de datos que facilita la interpretacioacuten de los datos publicados (praacutectica 6)

Nivel Avanzado

Las entidades que superando el nivel intermedio utilizan vocabularios estandarizados en sus nuevas publicaciones (praacutectica 3) acompantildean la publicacioacuten de sus datos con enlaces a otros recursos (praacutectica 7) y asignan un identificador uacutenico para dato logrando asiacute aumentar su descubrimiento y reutilizacioacuten (praacutectica 10)

31 Buenas praacutecticas para la publicacioacuten de datos

REFERENCIAS

Bernadette Farias Loacutescio Caroline Burle Newton Calegari W3C Data on the Web Best

Practices 31 de enero de 2017 W3C Recommendation URL httpswwww3orgTRdwbp

Bernadette Hyland Ghislain Auguste Atemezing Boris Villazoacuten-Terrazas W3C Best Practices

for Publishing Linked Data 9 de enero de 2014 W3C Note URL httpswwww3orgTRld-bp

Dan Brickley Libby Miller FOAF project FOAF Vocabulary Specification 099 (Paddington

Edition) 14 de enero de 2014 URL httpxmlnscomfoafspec

Dublin Core metadata initiative DCMI Metadata Terms 14 de junio de 2012 DCMI

Recommendation URL httpdublincoreorgdocumentsdcmi-terms

Fadi Maali John Erickson W3C Data Catalog Vocabulary (DCAT) 16 de enero de 2014 W3C

Recommendation URL httpswwww3orgTRvocab-dcat

ISO 19115-12014 (E) Geographic information ndash Metadata Part1 Fundamentals 01 de abril de

2014 International Standard

ISO 191262009 (E) Geographic information -- Feature concept dictionaries and registers

noviembre de 2009 International Standard

ISO 191572013 (E) Geographic information ndash Data quality 15 de diciembre de 2013

International Standard

Jeremy Tandy Payam Barnaghi Linda van den Brink W3C Spatial Data on the Web Best

Practices 5 de enero 2017 W3C Note URL httpswwww3orgTRsdw-bp

T Berners-Lee R Fielding L Masinter IETF Uniform Resource Identifier (URI) Generic Syntax

Enero de 2005 Internet Standard URL httpstoolsietforghtmlrfc3986

World Wide Web Foundation Open Data Barometer URL httpopendatabarometerorg

W3C OWL Working Group W3C OWL 2 Web Ontology Language Document Overview (Second

Edition) 11 de diciembre de 2012 W3C Recommendation URL httpswwww3orgTRowl2-

overview

W3org Semantic Web - W3C URL httpswwww3orgstandardssemanticweb Consultado

el 12 de septiembre de 2018

Page 9: PARA LA PUBLICACIÓN DE DATOSideca.gov.co/.../files/documentacion/buenaspracticaspublicaciondat… · La obtención de datos la realiza cada entidad en el desarrollo de sus actividades

9 Buenas praacutecticas para la publicacioacuten de datos

2 Proporcionar una licencia en donde se especifiquen las limitaciones yo restricciones de acceso y uso de los datos

Una licencia entendida como las condiciones legales bajo las cuales estaacute disponible la obra2 es

un instrumento mediante el cual el propietario del dato autoriza o no a los usuarios para que

accedan a su contenido y tambieacuten lo faculta para su utilizacioacuten Existen diferentes tipos de

licencia para la distribucioacuten y explotacioacuten de obras y cuyo propoacutesito es regular las condiciones

de acceso y uso de los datos

Dependiendo el acceso autorizado a los datos las licencias pueden clasificarse en

Privativas o restrictivas Aquellas licencias conocidas como cerradas o no libres donde la mayoriacutea de las veces solo el autor puede usar la obra o en caso contrario se definen condiciones especiacuteficas que se deben cumplir para hacer uso de la informacioacuten

Semilibres Aquellas licencias que requieren autorizaciones para que los usuarios utilicen copien distribuyan o modifiquen su contenido

Libres o abiertas Aquellas licencias que en teacuterminos generales permiten usar distribuir y compartir los datos con muy pocas restricciones

Cuando un dato se publica acompantildeado de su licencia el usuario conoce las condiciones de

acceso uso y distribucioacuten de los datos que estaacute consumiendo de esta forma se garantiza que

los datos se distribuyan seguacuten los intereses de la entidad que los produce y se minimizan los

usos indebidos de los datos por parte de los usuarios

Ahora bien definir la licencia adecuada para cada dato dependeraacute de las condiciones que

establezca la entidad productora de este Revise los ejemplos y defina la licencia maacutes adecuada

para sus datos

Para maacutes informacioacuten consulte el Instructivo para la definicioacuten de licencias de datos

iquestQueacute logro

Que el usuario evaluacutee si puede o no usar mis datos

Que el usuario conozca las condiciones de acceso uso y manejo sobre los datos

disponibles

Dar claridad y potenciar el uso de los datos disponibles

Que el usuario de los reconocimientos respectivos a la entidad productora de los datos

Que se genere valor agregado sobre los datos disponibles en caso de asignar una

licencia abierta

2 Recuperado de httpsopendefinitionorgod21es

10 Buenas praacutecticas para la publicacioacuten de datos

iexclRecomendaciones

Identifique la licencia que mejor se acomode a su modelo de negocio Recuerde que

mediante la Ley 1712 de 2014 se reguloacute el derecho de acceso a la informacioacuten puacuteblica

y se incluyeron los principios de facilitacioacuten gratuidad y divulgacioacuten proactiva de la

informacioacuten

Disponga una licencia para su conjunto de datos a traveacutes de un enlace una copia

incorporada o dentro del metadato

Prefiera el uso de licencias abiertas de este modo sus datos seraacuten utilizados en una

mayor cantidad de productos servicios y mercados

Ejemplo 1

Mundialmente conocidas las licencias Creative Commons3 tienen como objetivo fortalecer a los

creadores para que sean quienes definan los teacuterminos en que sus obras pueden ser usadas queacute

derechos desean entregar y en queacute condiciones lo haraacuten A continuacioacuten encontraraacute los

enlaces de acceso para conocer las condiciones de cada una de las licencias disponibles

CC0 10 httpscreativecommonsorgpublicdomainzero10deedes

CC BY 40 httpscreativecommonsorglicensesby40

CC BY-SA 40 httpscreativecommonsorglicensesby-sa40

CC BY-ND 40 httpscreativecommonsorglicensesby-nd40

CC BY-NC 40 httpscreativecommonsorglicensesby-nc40

CC BY-NC-SA 40

httpscreativecommonsorglicensesby-nc-sa40

Ejemplo 2

Tambieacuten existen las licencias abiertas para datos Open Data Commons4 proporcionadas por la

mundialmente conocida red Open Knowledge Foundation Network ndash OKFN5 puede consultar

las condiciones ingresando a los siguientes enlaces

ODbL 10 httpsopendatacommonsorglicensesodblsummary

PDDL 10 httpsopendatacommonsorglicensespddlsummary

ODC-BY 10 httpsopendatacommonsorglicensesbysummary

3 httpcreativecommonsorg 4 httpopendatacommonsorg 5 httpsokfnorg

11 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo 3

El Mapa de referencia para Bogotaacute estaacute publicado en

httpswwwidecagovcoesserviciosmapa-de-referencia bajo las condiciones descritas en la

ldquoLICENCIA ABIERTA O CONDICIONES DE USO PARA DATOS ABIERTOS DE LA INFRAESTRUCTURA

INTEGRADA DE DATOS ESPACIALES PARA EL DISTRITO CAPITAL (IDECA)rdquo

httpswwwidecagovcoeslicenciaabierta

12 Buenas praacutecticas para la publicacioacuten de datos

3 Utilizar vocabularios estandarizados y reutilizables en la estructuracioacuten y publicacioacuten de los datos

Un vocabulario define los conceptos y las relaciones que se utilizan para describir y representar

un aacuterea de intereacutes6 Cuando se publican datos en la Web los vocabularios permiten integrar

datos cuando existen ambiguumledades en los teacuterminos utilizados en los diferentes conjuntos de

datos En la praacutectica un vocabulario es un conjunto de palabras que permiten a dos usuarios

comunicarse entre siacute La efectividad de dicha comunicacioacuten radica en que el significado de una

palabra para el usuario emisor sea el mismo que para el usuario receptor independientemente

de si utilizaron el mismo teacutermino

Cuando se habla de interoperabilidad de datos lo que se espera es que tanto los usuarios

como las aplicaciones informaacuteticas entiendan y comprendan la mayor cantidad de informacioacuten

que estaacuten consumiendo Para conseguir esto las comunidades de datos han identificado

vocablos palabras o teacuterminos de uso comuacuten los cuales cuentan con significados apropiados y

que actualmente se encuentran integrados y estructurados en diferentes estaacutendares

internacionales

Se recomienda utilizar vocabularios de este tipo para estandarizar los datos contenidos en la

informacioacuten publicada

iquestQueacute logro

Que mis datos sean consultados utilizados y reutilizados por maacutes usuarios Que se reduzca la ambiguumledad en la interpretacioacuten de mis datos Que mis datos sean interoperables Que mis datos sean procesados en entornos nacionales e internacionales Que mis datos puedan ser compartidos e intercambiados entre sistemas Que mis datos sean maacutes confiables

iexclRecomendaciones

Consulte normas locales o vocabularios internacionales para la estructuracioacuten7 de sus

datos

Apropie los vocabularios consultados y adapte sus datos a estos en los casos en que sea

posible

Incluya vocabularios ya definidos y reconocidos internacionalmente cuando vaya a

producir nuevos datos

6 httpswwww3orgstandardssemanticwebontology 7 Estructurar significa ajustar los datos a un esquema fijo

13 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo 1

A continuacioacuten se presentan algunos vocabularios internacionales que puede consultar y

apropiar para optimizar el intercambio de sus datos

Data Catalog Vocabulary (DCAT) httpswwww3orgTRvocab-dcatclass-catalog

FOAF Vocabulary Specification httpxmlnscomfoaf01

ISOTC 211 Geographic informationGeomatics Terminology

httpwwwisotc211orgTerminologyhtm

The RDF Data Cube Vocabulary httpswwww3orgTR2014REC-vocab-data-cube-20140116

ODRL Vocabulary amp Expression 22

httpswwww3orgTR2018REC-odrl-vocab-20180215

HTTP Vocabulary in RDF 10 httpswwww3orgTR2017NOTE-HTTP-in-RDF10-20170202

vCard Ontology - for describing People and Organizations

httpswwww3orgTRvcard-rdf

Ejemplo 2

En el contexto Nacional el Ministerio de Tecnologiacuteas de la Informacioacuten y las Comunicaciones ha

establecido el Lenguaje Comuacuten de Intercambio de como un instrumento de consulta que

contiene la definicioacuten de los elementos de datos conceptualizados por las entidades del

estado La consulta la puede realizar en httplenguajeminticgovco

14 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo 3

La especificacioacuten vCard disponible en httpswwww3orgTRvcard-rdf promueve un

vocabulario especiacutefico para describir personas y organizaciones

Uno de los vocablos que describe esta especificacioacuten es la ldquodireccioacuten de entregardquo llamado

dentro del vocabulario como ADR y definido como ldquola direccioacuten del objeto representado en

partes estructuradasrdquo

Ahora bien este vocabulario especifica los componentes de la direccioacuten de entrega para el

objeto asiacute el nombre del paiacutes la localidad el coacutedigo postal la regioacuten y la direccioacuten dada por

viacuteas (calles y carreras en el caso colombiano) Esto quiere decir que cualquiera de los

componentes descritos puede usarse como direccioacuten de entrega vaacutelida ya que son equivalentes

entre siacute

Aunque en el vocabulario la direccioacuten de entrega se llame ADR el usuario de la informacioacuten

entenderaacute que un nombre de paiacutes o un coacutedigo postal pueden interpretarse como ADR

15 Buenas praacutecticas para la publicacioacuten de datos

4 Anonimizar los datos de caraacutecter personal informacioacuten estadiacutestica informacioacuten indirectamente identificable e informacioacuten sensible o confidencial

Anonimizar es el proceso que impide la identificacioacuten de las unidades de estudio que son fuente

para los registros individuales de un conjunto8 de datos o maacutes claro es la aplicacioacuten de teacutecnicas

que permitan expresar un dato relativo a personas eliminando la referencia a su identidad9

Baacutesicamente lo que se busca es reducir los riesgos en el uso y procesamiento de datos

personales evitar la extraccioacuten de registros que identifican a una persona reducir la

combinacioacuten de dos o maacutes registros en una o varias bases de datos para identificar a una

persona y minimizar la deduccioacuten de datos personales partir de uno o varios datos publicados

iquestQueacute informacioacuten debo prioritariamente anonimizar

Datos personales Informacioacuten numeacuterica alfabeacutetica graacutefica fotograacutefica acuacutestica o

cualquier otro tipo susceptible de recogida registro tratamiento y transmisioacuten

concerniente a personas fiacutesicas identificadas o identificables (tales como nombre

apellidos estado civil sexo edad domicilio identificacioacuten personal nuacutemero de

teleacutefono etc)10

Informacioacuten sensible Informacioacuten considerada como estrictamente confidencial

Informacioacuten y caracteriacutesticas referentes a la edad procedencia salud raza religioacuten

ideologiacutea afiliacioacuten finanzas etc se consideran de caraacutecter sensible y requieren de

una proteccioacuten especial11

iquestQueacute logro

Garantizar que mis datos publicados cuentan con medidas de proteccioacuten de datos

personales

Eliminar de manera efectiva el riesgo de re-identificacioacuten

Evitar que el procesamiento de mis datos tenga consecuencias negativas para alguna

persona

Disponer muchos maacutes datos sin invadir la informacioacuten personal

iexclRecomendaciones

Implemente actividades de proteccioacuten de la privacidad de los datos personales antes

de publicarlos

Elimine cualquier identificador directo de la persona (nombre documento de

identidad etc)

8 httpswwwdanegovcofilessenlineamientosDSO_020_LIN_08pdf 9 httpdleraeesid=2jjMiRi 10 httpswwwdanegovcofilessenlineamientosDSO_020_LIN_08pdf 11 Ibidem

16 Buenas praacutecticas para la publicacioacuten de datos

Reemplace los identificadores directos por coacutedigos de referencia pseudoacutenimos

(algoritmos AES12 o un hash cifrado HMAC13) coacutedigos arbitrarios o aleatorios

Si reemplazando el identificador directo auacuten es faacutecil identificar a la persona elimine el

dato

Clasifique yo categorice los datos

Redondee los datos numeacutericos hacia arriba o hacia abajo

Evaluacutee antes durante y despueacutes de publicados los datos si la anonimizacioacuten de sus

datos es suficiente y evaluacutee regularmente los riesgos existentes

Para maacutes informacioacuten consulte los Lineamientos para la Anonimizacioacuten de micro datos

Ejemplo 1

Antes de publicar sus datos retire el identificador directo de la persona En este caso

reemplace en nuacutemero de documento que identifica al usuario y reemplaacutecelo por un

consecutivo

Usuario Beneficio Usuario Beneficio

80123456 Subsidio de vivienda Usuario 1 Subsidio de vivienda

51123456 Subsidio de alimentacioacuten Usuario 2 Subsidio de alimentacioacuten

19123456 Subsidio al adulto mayor Usuario 3 Subsidio al adulto mayor

53123456 Subsidio de desempleo Usuario 4 Subsidio de desempleo

Ejemplo 2

Clasifique o categorice sus datos En este ejemplo asigne rangos a la edad de manera tal que el

titular del registro no sea identificable por este dato

Usuario Edad Usuario Rango de edad

Usuario 1 11 antildeos Usuario 1 Entre 10 y 15 antildeos

Usuario 2 22 antildeos Usuario 2 Entre 20 y 25 antildeos

Usuario 3 36 antildeos Usuario 3 Entre 35 y 40 antildeos

Usuario 4 63 antildeos Usuario 4 Entre 60 y 65 antildeos

12 Advanced Encryption Standard puede consultar como ha sido implementado este algoritmo en httpsrevistasudistritaleducoojsindexphpTecnuraarticleview72368892 13 Hash-based Message Authentication Code puede consultar como se crea este cifrado en httpsdocsoraclecomcdE19253-01819-7804wanboottasks2-51indexhtml

17 Buenas praacutecticas para la publicacioacuten de datos

5 Publicar los datos en formatos estaacutendar reutilizables y legibles por aplicaciones informaacuteticas

Un formato puede ser definido como la estructura de un disco dividido en campos y pistas

seguacuten un determinado sistema operativo lo que permite almacenar en eacutel informacioacuten14

baacutesicamente es la forma en que se codifican los datos en un archivo informaacutetico

Actualmente conocemos formatos comunes de almacenamiento como el doc una extensioacuten

de Word que almacena texto y cuyo propietario es la compantildeiacutea Microsoft Pero iquestqueacute pasa si un

usuario quiere abrir un documento doc en un procesador de texto diferente a Word

difiacutecilmente va a poder conocer el contenido de dicho documento sin tener esta licencia

Lo que queremos lograr con la implementacioacuten de esta praacutectica es que todos los usuarios que

encuentren mis datos puedan accederlos sin necesidad de contar con un software o aplicacioacuten

informaacutetica especiacutefica

iquestQueacute logro

Que mis datos sean consultados utilizados y reutilizados por maacutes usuarios

Que mis datos sean maacutes interoperables y maacutes procesados

Que mis datos puedan ser extraiacutedos transformados y procesados por aplicaciones

informaacuteticas

Que mis datos puedan ser compartidos e intercambiados entre sistemas

Disminuir los costos y los tiempos en el uso y la transformacioacuten de mis datos

iexclRecomendaciones

Prefiera publicar su conjunto de datos en formatos abiertos o no propietario ya que

estos facilitan el uso re-uso y distribucioacuten de estos Se busca que un mayor nuacutemero de

aplicaciones informaacuteticas pueda extraer leer y transformar los datos generando mayor

uso y re-uso por los usuarios

Disponga sus datos en muacuteltiples formatos con el fin de incrementar el acceso a los

mismos Se busca que el mayor nuacutemero de usuarios pueda utilizar los datos sin tener

que transformarlos primero en su formato preferido

Utilice Web Services para mejorar el intercambio e interoperabilidad de los datos

publicados

14 httpdleraeessrvsearchm=30ampw=formato

18 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo 1

A continuacioacuten encontraraacute extensiones de formato propietario y no propietario prefiera para

la publicacioacuten de sus datos las extensiones de la derecha

FORMATO PROPIETARIO FORMATO NO PROPIETARIO

DOC GDB TXT ASCII Grid KML RDF

XLS DWG CSV GeoJSON DXF XML

PPT SHP JSON GML ODF

Ejemplo 2

Si no fue posible utilizar una extensioacuten de formato no propietario publique sus datos en una

variedad de formatos que le permita al usuario acceder a los datos desde diferentes

aplicaciones informaacuteticas

Ejemplo 3

Para publicar sus datos conozca diferentes tipos de Web Services que viajan en la red utilizando extensiones XML

SOAP httpswwww3orgTRsoap

REST httprestelksteinorg

WMS httpwwwopengeospatialorgstandardswms

WFS httpwwwopengeospatialorgstandardswfs

WCS httpwwwopengeospatialorgstandardswcs

19 Buenas praacutecticas para la publicacioacuten de datos

6 Proporcionar un diccionario de datos que facilite el uso e interpretacioacuten de los datos publicados

Un diccionario estaacute definido como un repertorio en forma de libro o en soporte electroacutenico en el

que se recogen seguacuten un orden determinado las palabras o expresiones de una o maacutes lenguas

o de una materia concreta acompantildeadas de su definicioacuten equivalencia o explicacioacuten15

especiacuteficamente en un diccionario de datos se encuentran los conceptos de los datos y sus

propiedades (atributos dominios asociaciones y operaciones) acompantildeados de una definicioacuten

en donde se identifica el propoacutesito alcance y campo de aplicacioacuten del dato publicado

Lograr que los usuarios de mis datos entiendan la informacioacuten que estaacute publicada le permitiraacute

decidir si satisfacen o no su necesidad y le facilitaraacute la decisioacuten para explotar lo datos

Para maacutes informacioacuten consulte el Instructivo Diccionario de Datos

iquestQueacute logro

Que mis datos sean consultados utilizados y reutilizados por maacutes usuarios

Que se eviten ambiguumledades en la interpretacioacuten de mis datos

Que mis datos publicados esteacuten unificados y consistentes

Que los usuarios comprendan mejor y dispongan de claridad sobre los conceptos de

mis datos

iexclRecomendaciones

Publique como miacutenimo un diccionario de datos que contenga la caracterizacioacuten del

conjunto de datos producidos por su entidad

Cree el diccionario de datos teniendo en cuenta como miacutenimo la siguiente informacioacuten

Nombre del atributo Nombre que identifica de manera clara un atributo

Definicioacuten Descripcioacuten del atributo

Tipo de dato Tipo de valor del atributo

Unidad de medida Expresa la unidad de medida del atributo

Dominio Determina si el atributo tiene asociado un dominio

15 httpdleraeesw=diccionario

20 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo

Para el conjunto de datos ldquoEstablecimientos Educativos en Bogotaacuterdquo publicariacuteamos un

diccionario de datos similar al siguiente

Nombre del atributo Definicioacuten Tipo de dato

Unidad de Medida

Dominio

Coacutedigo del establecimiento

Coacutedigo DANE asignado al Institucioacuten Educativa Decimal

Nombre del establecimiento

Nombre de la Institucioacuten Educativa Cadena de Caracteres

Aacuterea construida del establecimiento

Aacuterea construida de la Institucioacuten Educativa Decimal Metros

cuadrados

Sector

Clasificacioacuten asignada seguacuten la naturaleza juriacutedica la cual define las principales caracteriacutesticas que desde lo juriacutedico - administrativo y tiene que ver con el origen de su creacioacuten

Entero

EESector

No podriacuteamos olvidar detallar el dominio asociado

Atributo Nombre del Dominio Coacutedigo Definicioacuten

EESector

Oficial 1

Es una institucioacuten donde su naturaleza de servicio puacuteblico cultural y su funcioacuten social le es inherente cumpliendo con las disposiciones legales y estatutarias que las rigen donde sus rentas se conservan y se aplican debidamente

Privado 2

Es una institucioacuten constituida como persona juriacutedica de utilidad comuacuten donde sus rentas se conservan y se aplican debidamente y que en todo lo esencial se cumple con la voluntad de sus fundadores

21 Buenas praacutecticas para la publicacioacuten de datos

7 Acompantildear la publicacioacuten de los datos con enlaces a otros recursos

Un enlace es definido como una secuencia de caracteres que se utiliza como direccioacuten para

acceder a informacioacuten adicional16 maacutes sencillo puede definirse como una expresioacuten que

conecta una cierta informacioacuten con otra17Ahora bien un recurso se puede entender como

cualquier medio que satisfaga una necesidad por ejemplo datos servicios documentos o

software

En teacuterminos generales se sugiere que para facilitar al usuario la comprensioacuten de los datos

publicados se proporcionen recursos o documentos adicionales que puedan ser consultados

yo descargados traveacutes de enlaces o links de otro sitio Web

Dentro de los recursos adicionales que pueden publicarse para acompantildear el dato estaacuten los

procedimientos de captura del dato los cataacutelogos de objetos las especificaciones teacutecnicas los

documentos normativos los cataacutelogos de simbologiacutea los reportes de evaluacioacuten de calidad

entre otros

iquestQueacute logro

Mejorar la consulta utilizacioacuten y reutilizacioacuten de mis datos

Que los usuarios comprendan mejor mis datos

Que mis datos sean compartidos e intercambiados por un mayor nuacutemero de usuarios

iexclRecomendaciones

Disponga informacioacuten adicional de sus datos que le permita a los usuarios ampliar el

horizonte de las aplicaciones y funcionalidades en las que pueda utilizar y explotar del

dato

No olvide vincular o registrar esta informacioacuten en el metadato

16 httpdleraeesid=FTVRKyj 17 httpssistemascomenlacephp

22 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo 1

El ldquoMapa de Referencia para Bogotaacuterdquo publicado en httpswwwidecagovcoesserviciosmapa-de-referencia tiene publicados varios enlaces a otros recursos

Especificacioacuten teacutecnica para la elaboracioacuten del Mapa de Referencia para Bogotaacute DC V0318

Cataacutelogo de Objetos del Mapa de Referencia de Bogotaacute DC V 57

Cataacutelogo de Representacioacuten del Mapa de Referencia de Bogotaacute DC V30

Reporte de evaluacioacuten de calidad generado al Mapa de Referencia del Distrito Capital V1217

Ejemplo 2

La informacioacuten de los ldquohumedales de Bogotaacuterdquo publicada en

httpambientebogotagovcowebsdahumedales tiene publicados enlaces a otros recursos

o Gestioacuten de los humedales

o Poliacutetica de Humedales del Distrito Capital

o Normatividad

o Planes de Manejo Ambiental

o Comiteacute distrital de humedales documentos de consulta normatividad

23 Buenas praacutecticas para la publicacioacuten de datos

8 Depurar sus datos antes de publicarlos para garantizar su calidad y aumentar su confianza

La calidad estaacute definida como el conjunto de propiedades inherentes a algo que permiten

juzgar su valor18 para el caso que nos concierne este algo hace referencia al dato publicado

Ahora bien la calidad tambieacuten es entendida como la capacidad del dato publicado para

satisfacer los requerimientos y las necesidades de los usuarios respetando una serie de normas

y especificaciones establecidas

Actualmente existen muacuteltiples elementos de calidad de los datos que identifican las cualidades

de estos sin embargo en este aparte citaremos los elementos principales que usted o su

entidad deben tener en cuenta para publicar sus datos con un estaacutendar miacutenimo de calidad

Para maacutes informacioacuten consulte el Procedimiento para evaluar y reportar la calidad de

los datos espaciales

iquestQueacute logro

Que mis datos sean consultados utilizados y reutilizados por maacutes usuarios

Que los usuarios hablen bien de mis datos

Que mis datos sean maacutes interoperables y maacutes procesados

Que mis datos sean maacutes compartidos

Que mis datos sean maacutes confiables

Recomendacioacuten 1

Establezca si dentro de su conjunto de datos existen capos vaciacuteos o nulos con informacioacuten

descontextualizada sobrante o duplicada Si existen compleacutetelos o elimiacutenelos seguacuten

corresponda antes de la publicacioacuten El elemento de calidad asociado se denomina ldquototalidadrdquo

Localidad Atendidos Localidad Atendidos

Suba 200 Suba 200

Suba 200 Tunjuelito 500

Ameacutericas 100

850

Tunjuelito 500

18 httpdleraeesid=6nVpk8P|6nXVL1Z

Campo duplicado

Campo inconsistente

Campo vaciacuteo

24 Buenas praacutecticas para la publicacioacuten de datos

Recomendacioacuten 2

Identifique y transforme si es necesario los datos que hayan sido registrados en un formato

diferente al establecido para su conjunto de datos Es decir estandarice el formato de salida

del dato que va a publicar El elemento de calidad asociado se denomina ldquoconsistencia de

formatordquo

Localidad Atendidos Localidad Atendidos

Suba 200 Suba 200

Tunjuelito 5008 Tunjuelito 500

Fontiboacuten 40 Fontiboacuten 430

Tunjuelito 500 Tunjuelito 500

Recomendacioacuten 3

Si sus datos tienen alguacuten tipo de clasificacioacuten o rangos previo a la publicacioacuten valide que estos

se hayan registrado correctamente El elemento de calidad asociado se denomina ldquoexactitud de

clasificacioacutenrdquo

Geacutenero Edad Rango de Edad Geacutenero Edad Rango de Edad

Femenino 5 0 lt Edad le 10 Femenino 5 0 lt Edad le 10

Masculino 15 0 lt Edad le 10 Masculino 15 10 lt Edad le 20

Femenino 35 40 lt Edad le 50 Femenino 35 30 lt Edad le 40

Recomendacioacuten 4

Si sus datos representan atributos cuantitativos verifique antes de la publicacioacuten que estos

correspondan a valores conocidos como verdaderos El elemento de calidad asociado se

denomina ldquoexactitud de atributos cuantitativosrdquo

Localidad Mes Temperatura Localidad Mes Temperatura

Chapinero Enero 7degC Chapinero Enero 7degC

Suba Agosto -15degC Suba Agosto 15degC

Tunjuelito Abril 60degC Tunjuelito Abril 16degC

Clasificacioacuten inconsistente

Formato inconsistente

Valor inconsistente

25 Buenas praacutecticas para la publicacioacuten de datos

Recomendacioacuten 5

Si los datos a publicar tienen asociadas fechas de captura o recoleccioacuten de informacioacuten (Por

ejemplo registro de incidentes registro de vacunacioacuten conteo de vehiacuteculos etc) valide que

las fechas registradas coincidan con la fecha del evento capturado El elemento de calidad

asociado se denomina ldquoexactitud de la medicioacuten del tiempordquo

Precipitacioacuten (mm) Fecha de registro Precipitacioacuten (mm) Fecha de registro

00 20580101 00 20180101

01 20180102 01 20180102

126 20510403 126 20180103

20 20180104 20 20180104

Recomendacioacuten 6

Cuando sus datos reflejen informacioacuten determinada por un orden de eventos garantice antes

de la publicacioacuten que este orden sea el adecuado El elemento de calidad asociado se

denomina ldquoconsistencia temporalrdquo

Usuario Escolaridad Periodo de Estudio Usuario Escolaridad Periodo de Estudio

Usuario 1 Preescolar 20030101 ndash 20051231 Usuario 1 Preescolar 20030101 ndash 20051231

Usuario 1 Primaria 20030101 ndash 20101231 Usuario 1 Primaria 20060101 ndash 20101231

Usuario 1 Secundaria 20060101 ndash 20163112 Usuario 1 Secundaria 20110101 ndash 20143112

Usuario 1 Media 20150101 - 20163112 Usuario 1 Media 20150101 - 20163112

Recomendacioacuten 7

Si sus datos incluyen alguna ubicacioacuten (direccioacuten lugar coordenadas) verifique que esta

corresponda a la ubicacioacuten real El elemento de calidad asociado se denomina ldquoexactitud

posicionalrdquo

Eventos Deportivos Lugar Eventos Deportivos Lugar

Evento 1 AK 30 25 90 Evento 1 AK 30 25 90

Evento 2 AC 63 215 20 Evento 2 Parque La Florida

Evento 3 Parque Simoacuten Boliacutevar Evento 3 Parque Simoacuten Boliacutevar

Fecha

inconsistente

Fechas no secuenciales

Lugar inexistente

26 Buenas praacutecticas para la publicacioacuten de datos

9 Incorporar el componente geograacutefico en los datos publicados para optimizar su comprensioacuten uso re-uso y visualizacioacuten

El espacio geograacutefico es un punto de la superficie terrestre que se vea afectado o que afecte de

alguna manera a la humanidad19 Este punto de la superficie puede ser la direccioacuten de una

institucioacuten educativa la ubicacioacuten de un centro de vacunacioacuten el lugar donde se miden las

variaciones de traacutensito en la ciudad los parques de Bogotaacute el edificio en donde se llevan a

cabo los traacutemites de una entidad etc

Los datos que usted captura o recolecta en su quehacer misional siempre estaacuten asociados a un

espacio geograacutefico por lo tanto este componente deberiacutea ser incluido en los datos publicados

Tenga en cuenta que el componente geograacutefico lo puede incorporar incluyendo una ubicacioacuten

asociada a una direccioacuten a un lugar a una localidad a un barrio al nombre de un

establecimiento puacuteblicamente reconocido o a cualquier punto que permita al usuario

identificar la localizacioacuten del dato publicado

iquestQueacute logro

Ampliar el espectro de usuarios que consultan utilizan y reutilizan mis datos

Que mis datos sean maacutes interoperables y maacutes procesados

Que mis datos sean puedan compartir en maacutes plataformas

Que los usuarios puedan visualizar mis datos en un mapa

iexclRecomendaciones

Disponga sus datos agregando un atributo de ubicacioacuten como direcciones coordenadas o

lugares geograacuteficos

Ejemplo 1

Incluya direcciones que permitan localizar espacialmente sus datos

Programa Direccioacuten

Registro de atencioacuten a la ciudadaniacutea CL 138 108 16

Centro de autocuidado KR 18 D 77 A 11 SUR

Familias con un nintildeo en cupos cofinanciados CL 70 A SUR 20 46

Centro de autocuidado KR 18 D 73 A 33 SUR

19 httpenciclopediabanrepculturalorgindexphptitle=Espacio_geogrC3A1fico

27 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo 2

Utilice coordenadas para indicar la ubicacioacuten de sus datos

EPS Coordenada X Coordenada Y

EPS Convida 9087496334 1051342164

Capital Salud EPS 986321006 954875808

EPS Famisanar 9742508812 8837031501

Aliansalud EPS 9716943356 9659706891

Salud Total EPS 9215624975 9625189518

Tenga en cuenta que para publicar datos con coordenadas tendraacute que incluir dentro

de su metadato el Sistema de referencia empleado

MAGNA ndash SIRGAS EPSG 4686 httpsepsgio4686

MAGNA ndash SIRGAS EPSG 3116 httpsepsgio3116

MAGNA ndash BOGOTAacute SR-ORG 7458 httpspatialreferenceorgrefsr-org7458

Ejemplo 3

Tambieacuten puede incluir lugares geograacuteficos descriptivos asiacute

Usuario Vacunado Lugar de Vacunacioacuten

Usuario 1 BOSQUE IZQUIERDO

Usuario 2 LAGUNITAS URBANO

Usuario 3 LA CAPUCHINA

Usuario 4 SAN JOSE SUR

Usuario 5 VENECIA

28 Buenas praacutecticas para la publicacioacuten de datos

10 Asignar un identificador uacutenico que permita aumentar la consulta uso e interoperabilidad del dato publicado

Considere un identificador uacutenico como un texto que permite identificar inequiacutevocamente el

dato publicado Si usted va a publicar un dato buscando que este sea reutilizado por los

usuarios y por su propia entidad asignar un identificador facilitaraacute el descubrimiento y la

citacioacuten del dato a traveacutes del tiempo independientemente del estado la disponibilidad o el

formato de este

En la vida cotidiana mediante la ceacutedula de ciudadaniacutea se asigna a cada ciudadano un nuacutemero

de identificacioacuten uacutenico y a traveacutes de este identificador el ciudadano es reconocido a lo largo de

su vida e incluso despueacutes de su muerte por otras personas yo autoridades En el mundo de la

informacioacuten cada dato deberiacutea viajar con un identificador uacutenico que le permita ser encontrado

y reconocido faacutecilmente entre los demaacutes datos

Ahora bien si usted o su entidad publican continuamente datos establecer un sistema de

identificacioacuten comuacuten le permitiraacute identificar raacutepidamente los datos y los haraacute comparables por

cualquier usuario de manera confiable Esta condicioacuten es previa para lograr una correcta

gestioacuten y reutilizacioacuten de sus datos

iquestQueacute logro

Ampliar el espectro de usuarios que consultan utilizan y reutilizan mis datos

Que mis datos sean maacutes interoperables y maacutes procesados

Que mis datos sean compartidos en maacutes plataformas

Que mis datos puedan vincularse a otros datos en el entorno Web

Que mis datos sean encontrados usados y citados inequiacutevocamente

Garantizar y monitorear la reutilizacioacuten de mis datos

Reducir del uso erroacuteneo de mis datos

iexclRecomendaciones

Establezca un sistema de identificacioacuten comuacuten para los datos que va a publicar

Utilice siempre el identificador asignado para publicar sus datos

29 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo

IDECA ha dispuesto el Sistema de Registro de Iacutetems geograacuteficos

httpgeoitemsidecagovcogeoitemsano una herramienta web desarrollada para la

creacioacuten aprobacioacuten publicacioacuten y mantenimiento de iacutetems geograacuteficos que permite la

asignacioacuten concertada de identificadores y significados uacutenicos que contribuyen a la definicioacuten

de un lenguaje comuacuten para el desarrollo de nuevos sistema de informacioacuten en el Distrito

garantizando con ello su fiabilidad e interoperabilidad Adicionalmente permite almacenar

descripciones de la informacioacuten oficial producida e identificar su respectivo custodio jugando

asiacute un papel importante en el control y seguimiento de la produccioacuten de informacioacuten

geograacutefica

Este sistema asigna un identificador uacutenico a cada uno de los iacutetems creados Dentro de los iacutetems

publicados se reconoce el ID 65 como unidad de planeamiento y siempre que se hace

referencia a este objeto es suficiente nombrarlo asiacute para entender que se habla de ldquoUnidades

territoriales de anaacutelisis planeamiento y gestioacuten que tienen como propoacutesito definir y precisar el

planeamiento del suelo urbano de expansioacuten y ruralrdquo

30 Buenas praacutecticas para la publicacioacuten de datos

OBTENGA EL MAacuteS ALTO NIVEL EN PUBLICACIOacuteN DE DATOS

Hasta aquiacute hemos publicado las que consideramos como mejores praacutecticas de publicacioacuten de datos Ahora usted como publicador o como entidad debe evaluar si sus datos se estaacuten disponiendo con los maacutes altos y mejores estaacutendares de publicacioacuten

Lo invitamos a que valide en queacute nivel de publicacioacuten se encuentra su entidad teniendo en cuenta el siguiente listado

Nivel Baacutesico

En este nivel se encuentran aquellas entidades que publican sus datos en formatos estaacutendar y reutilizables (praacutectica 5) que integran a la publicacioacuten sus respectivos metadatos (praacutectica 1) y que acompantildean la publicacioacuten con una licencia asociada (praacutectica 2)

Nivel Intermedio

Este nivel lo alcanzan las entidades que superando el nivel baacutesico disponen un mayor volumen de informacioacuten gracias a que anonimizan sus datos (praacutectica 4) implementan medidas de calidad que aumentan la confianza en sus datos (praacutectica 8) incorporan el componente geograacutefico proporcionando valor agregado a sus datos (praacutectica 9) y publican un diccionario de datos que facilita la interpretacioacuten de los datos publicados (praacutectica 6)

Nivel Avanzado

Las entidades que superando el nivel intermedio utilizan vocabularios estandarizados en sus nuevas publicaciones (praacutectica 3) acompantildean la publicacioacuten de sus datos con enlaces a otros recursos (praacutectica 7) y asignan un identificador uacutenico para dato logrando asiacute aumentar su descubrimiento y reutilizacioacuten (praacutectica 10)

31 Buenas praacutecticas para la publicacioacuten de datos

REFERENCIAS

Bernadette Farias Loacutescio Caroline Burle Newton Calegari W3C Data on the Web Best

Practices 31 de enero de 2017 W3C Recommendation URL httpswwww3orgTRdwbp

Bernadette Hyland Ghislain Auguste Atemezing Boris Villazoacuten-Terrazas W3C Best Practices

for Publishing Linked Data 9 de enero de 2014 W3C Note URL httpswwww3orgTRld-bp

Dan Brickley Libby Miller FOAF project FOAF Vocabulary Specification 099 (Paddington

Edition) 14 de enero de 2014 URL httpxmlnscomfoafspec

Dublin Core metadata initiative DCMI Metadata Terms 14 de junio de 2012 DCMI

Recommendation URL httpdublincoreorgdocumentsdcmi-terms

Fadi Maali John Erickson W3C Data Catalog Vocabulary (DCAT) 16 de enero de 2014 W3C

Recommendation URL httpswwww3orgTRvocab-dcat

ISO 19115-12014 (E) Geographic information ndash Metadata Part1 Fundamentals 01 de abril de

2014 International Standard

ISO 191262009 (E) Geographic information -- Feature concept dictionaries and registers

noviembre de 2009 International Standard

ISO 191572013 (E) Geographic information ndash Data quality 15 de diciembre de 2013

International Standard

Jeremy Tandy Payam Barnaghi Linda van den Brink W3C Spatial Data on the Web Best

Practices 5 de enero 2017 W3C Note URL httpswwww3orgTRsdw-bp

T Berners-Lee R Fielding L Masinter IETF Uniform Resource Identifier (URI) Generic Syntax

Enero de 2005 Internet Standard URL httpstoolsietforghtmlrfc3986

World Wide Web Foundation Open Data Barometer URL httpopendatabarometerorg

W3C OWL Working Group W3C OWL 2 Web Ontology Language Document Overview (Second

Edition) 11 de diciembre de 2012 W3C Recommendation URL httpswwww3orgTRowl2-

overview

W3org Semantic Web - W3C URL httpswwww3orgstandardssemanticweb Consultado

el 12 de septiembre de 2018

Page 10: PARA LA PUBLICACIÓN DE DATOSideca.gov.co/.../files/documentacion/buenaspracticaspublicaciondat… · La obtención de datos la realiza cada entidad en el desarrollo de sus actividades

10 Buenas praacutecticas para la publicacioacuten de datos

iexclRecomendaciones

Identifique la licencia que mejor se acomode a su modelo de negocio Recuerde que

mediante la Ley 1712 de 2014 se reguloacute el derecho de acceso a la informacioacuten puacuteblica

y se incluyeron los principios de facilitacioacuten gratuidad y divulgacioacuten proactiva de la

informacioacuten

Disponga una licencia para su conjunto de datos a traveacutes de un enlace una copia

incorporada o dentro del metadato

Prefiera el uso de licencias abiertas de este modo sus datos seraacuten utilizados en una

mayor cantidad de productos servicios y mercados

Ejemplo 1

Mundialmente conocidas las licencias Creative Commons3 tienen como objetivo fortalecer a los

creadores para que sean quienes definan los teacuterminos en que sus obras pueden ser usadas queacute

derechos desean entregar y en queacute condiciones lo haraacuten A continuacioacuten encontraraacute los

enlaces de acceso para conocer las condiciones de cada una de las licencias disponibles

CC0 10 httpscreativecommonsorgpublicdomainzero10deedes

CC BY 40 httpscreativecommonsorglicensesby40

CC BY-SA 40 httpscreativecommonsorglicensesby-sa40

CC BY-ND 40 httpscreativecommonsorglicensesby-nd40

CC BY-NC 40 httpscreativecommonsorglicensesby-nc40

CC BY-NC-SA 40

httpscreativecommonsorglicensesby-nc-sa40

Ejemplo 2

Tambieacuten existen las licencias abiertas para datos Open Data Commons4 proporcionadas por la

mundialmente conocida red Open Knowledge Foundation Network ndash OKFN5 puede consultar

las condiciones ingresando a los siguientes enlaces

ODbL 10 httpsopendatacommonsorglicensesodblsummary

PDDL 10 httpsopendatacommonsorglicensespddlsummary

ODC-BY 10 httpsopendatacommonsorglicensesbysummary

3 httpcreativecommonsorg 4 httpopendatacommonsorg 5 httpsokfnorg

11 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo 3

El Mapa de referencia para Bogotaacute estaacute publicado en

httpswwwidecagovcoesserviciosmapa-de-referencia bajo las condiciones descritas en la

ldquoLICENCIA ABIERTA O CONDICIONES DE USO PARA DATOS ABIERTOS DE LA INFRAESTRUCTURA

INTEGRADA DE DATOS ESPACIALES PARA EL DISTRITO CAPITAL (IDECA)rdquo

httpswwwidecagovcoeslicenciaabierta

12 Buenas praacutecticas para la publicacioacuten de datos

3 Utilizar vocabularios estandarizados y reutilizables en la estructuracioacuten y publicacioacuten de los datos

Un vocabulario define los conceptos y las relaciones que se utilizan para describir y representar

un aacuterea de intereacutes6 Cuando se publican datos en la Web los vocabularios permiten integrar

datos cuando existen ambiguumledades en los teacuterminos utilizados en los diferentes conjuntos de

datos En la praacutectica un vocabulario es un conjunto de palabras que permiten a dos usuarios

comunicarse entre siacute La efectividad de dicha comunicacioacuten radica en que el significado de una

palabra para el usuario emisor sea el mismo que para el usuario receptor independientemente

de si utilizaron el mismo teacutermino

Cuando se habla de interoperabilidad de datos lo que se espera es que tanto los usuarios

como las aplicaciones informaacuteticas entiendan y comprendan la mayor cantidad de informacioacuten

que estaacuten consumiendo Para conseguir esto las comunidades de datos han identificado

vocablos palabras o teacuterminos de uso comuacuten los cuales cuentan con significados apropiados y

que actualmente se encuentran integrados y estructurados en diferentes estaacutendares

internacionales

Se recomienda utilizar vocabularios de este tipo para estandarizar los datos contenidos en la

informacioacuten publicada

iquestQueacute logro

Que mis datos sean consultados utilizados y reutilizados por maacutes usuarios Que se reduzca la ambiguumledad en la interpretacioacuten de mis datos Que mis datos sean interoperables Que mis datos sean procesados en entornos nacionales e internacionales Que mis datos puedan ser compartidos e intercambiados entre sistemas Que mis datos sean maacutes confiables

iexclRecomendaciones

Consulte normas locales o vocabularios internacionales para la estructuracioacuten7 de sus

datos

Apropie los vocabularios consultados y adapte sus datos a estos en los casos en que sea

posible

Incluya vocabularios ya definidos y reconocidos internacionalmente cuando vaya a

producir nuevos datos

6 httpswwww3orgstandardssemanticwebontology 7 Estructurar significa ajustar los datos a un esquema fijo

13 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo 1

A continuacioacuten se presentan algunos vocabularios internacionales que puede consultar y

apropiar para optimizar el intercambio de sus datos

Data Catalog Vocabulary (DCAT) httpswwww3orgTRvocab-dcatclass-catalog

FOAF Vocabulary Specification httpxmlnscomfoaf01

ISOTC 211 Geographic informationGeomatics Terminology

httpwwwisotc211orgTerminologyhtm

The RDF Data Cube Vocabulary httpswwww3orgTR2014REC-vocab-data-cube-20140116

ODRL Vocabulary amp Expression 22

httpswwww3orgTR2018REC-odrl-vocab-20180215

HTTP Vocabulary in RDF 10 httpswwww3orgTR2017NOTE-HTTP-in-RDF10-20170202

vCard Ontology - for describing People and Organizations

httpswwww3orgTRvcard-rdf

Ejemplo 2

En el contexto Nacional el Ministerio de Tecnologiacuteas de la Informacioacuten y las Comunicaciones ha

establecido el Lenguaje Comuacuten de Intercambio de como un instrumento de consulta que

contiene la definicioacuten de los elementos de datos conceptualizados por las entidades del

estado La consulta la puede realizar en httplenguajeminticgovco

14 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo 3

La especificacioacuten vCard disponible en httpswwww3orgTRvcard-rdf promueve un

vocabulario especiacutefico para describir personas y organizaciones

Uno de los vocablos que describe esta especificacioacuten es la ldquodireccioacuten de entregardquo llamado

dentro del vocabulario como ADR y definido como ldquola direccioacuten del objeto representado en

partes estructuradasrdquo

Ahora bien este vocabulario especifica los componentes de la direccioacuten de entrega para el

objeto asiacute el nombre del paiacutes la localidad el coacutedigo postal la regioacuten y la direccioacuten dada por

viacuteas (calles y carreras en el caso colombiano) Esto quiere decir que cualquiera de los

componentes descritos puede usarse como direccioacuten de entrega vaacutelida ya que son equivalentes

entre siacute

Aunque en el vocabulario la direccioacuten de entrega se llame ADR el usuario de la informacioacuten

entenderaacute que un nombre de paiacutes o un coacutedigo postal pueden interpretarse como ADR

15 Buenas praacutecticas para la publicacioacuten de datos

4 Anonimizar los datos de caraacutecter personal informacioacuten estadiacutestica informacioacuten indirectamente identificable e informacioacuten sensible o confidencial

Anonimizar es el proceso que impide la identificacioacuten de las unidades de estudio que son fuente

para los registros individuales de un conjunto8 de datos o maacutes claro es la aplicacioacuten de teacutecnicas

que permitan expresar un dato relativo a personas eliminando la referencia a su identidad9

Baacutesicamente lo que se busca es reducir los riesgos en el uso y procesamiento de datos

personales evitar la extraccioacuten de registros que identifican a una persona reducir la

combinacioacuten de dos o maacutes registros en una o varias bases de datos para identificar a una

persona y minimizar la deduccioacuten de datos personales partir de uno o varios datos publicados

iquestQueacute informacioacuten debo prioritariamente anonimizar

Datos personales Informacioacuten numeacuterica alfabeacutetica graacutefica fotograacutefica acuacutestica o

cualquier otro tipo susceptible de recogida registro tratamiento y transmisioacuten

concerniente a personas fiacutesicas identificadas o identificables (tales como nombre

apellidos estado civil sexo edad domicilio identificacioacuten personal nuacutemero de

teleacutefono etc)10

Informacioacuten sensible Informacioacuten considerada como estrictamente confidencial

Informacioacuten y caracteriacutesticas referentes a la edad procedencia salud raza religioacuten

ideologiacutea afiliacioacuten finanzas etc se consideran de caraacutecter sensible y requieren de

una proteccioacuten especial11

iquestQueacute logro

Garantizar que mis datos publicados cuentan con medidas de proteccioacuten de datos

personales

Eliminar de manera efectiva el riesgo de re-identificacioacuten

Evitar que el procesamiento de mis datos tenga consecuencias negativas para alguna

persona

Disponer muchos maacutes datos sin invadir la informacioacuten personal

iexclRecomendaciones

Implemente actividades de proteccioacuten de la privacidad de los datos personales antes

de publicarlos

Elimine cualquier identificador directo de la persona (nombre documento de

identidad etc)

8 httpswwwdanegovcofilessenlineamientosDSO_020_LIN_08pdf 9 httpdleraeesid=2jjMiRi 10 httpswwwdanegovcofilessenlineamientosDSO_020_LIN_08pdf 11 Ibidem

16 Buenas praacutecticas para la publicacioacuten de datos

Reemplace los identificadores directos por coacutedigos de referencia pseudoacutenimos

(algoritmos AES12 o un hash cifrado HMAC13) coacutedigos arbitrarios o aleatorios

Si reemplazando el identificador directo auacuten es faacutecil identificar a la persona elimine el

dato

Clasifique yo categorice los datos

Redondee los datos numeacutericos hacia arriba o hacia abajo

Evaluacutee antes durante y despueacutes de publicados los datos si la anonimizacioacuten de sus

datos es suficiente y evaluacutee regularmente los riesgos existentes

Para maacutes informacioacuten consulte los Lineamientos para la Anonimizacioacuten de micro datos

Ejemplo 1

Antes de publicar sus datos retire el identificador directo de la persona En este caso

reemplace en nuacutemero de documento que identifica al usuario y reemplaacutecelo por un

consecutivo

Usuario Beneficio Usuario Beneficio

80123456 Subsidio de vivienda Usuario 1 Subsidio de vivienda

51123456 Subsidio de alimentacioacuten Usuario 2 Subsidio de alimentacioacuten

19123456 Subsidio al adulto mayor Usuario 3 Subsidio al adulto mayor

53123456 Subsidio de desempleo Usuario 4 Subsidio de desempleo

Ejemplo 2

Clasifique o categorice sus datos En este ejemplo asigne rangos a la edad de manera tal que el

titular del registro no sea identificable por este dato

Usuario Edad Usuario Rango de edad

Usuario 1 11 antildeos Usuario 1 Entre 10 y 15 antildeos

Usuario 2 22 antildeos Usuario 2 Entre 20 y 25 antildeos

Usuario 3 36 antildeos Usuario 3 Entre 35 y 40 antildeos

Usuario 4 63 antildeos Usuario 4 Entre 60 y 65 antildeos

12 Advanced Encryption Standard puede consultar como ha sido implementado este algoritmo en httpsrevistasudistritaleducoojsindexphpTecnuraarticleview72368892 13 Hash-based Message Authentication Code puede consultar como se crea este cifrado en httpsdocsoraclecomcdE19253-01819-7804wanboottasks2-51indexhtml

17 Buenas praacutecticas para la publicacioacuten de datos

5 Publicar los datos en formatos estaacutendar reutilizables y legibles por aplicaciones informaacuteticas

Un formato puede ser definido como la estructura de un disco dividido en campos y pistas

seguacuten un determinado sistema operativo lo que permite almacenar en eacutel informacioacuten14

baacutesicamente es la forma en que se codifican los datos en un archivo informaacutetico

Actualmente conocemos formatos comunes de almacenamiento como el doc una extensioacuten

de Word que almacena texto y cuyo propietario es la compantildeiacutea Microsoft Pero iquestqueacute pasa si un

usuario quiere abrir un documento doc en un procesador de texto diferente a Word

difiacutecilmente va a poder conocer el contenido de dicho documento sin tener esta licencia

Lo que queremos lograr con la implementacioacuten de esta praacutectica es que todos los usuarios que

encuentren mis datos puedan accederlos sin necesidad de contar con un software o aplicacioacuten

informaacutetica especiacutefica

iquestQueacute logro

Que mis datos sean consultados utilizados y reutilizados por maacutes usuarios

Que mis datos sean maacutes interoperables y maacutes procesados

Que mis datos puedan ser extraiacutedos transformados y procesados por aplicaciones

informaacuteticas

Que mis datos puedan ser compartidos e intercambiados entre sistemas

Disminuir los costos y los tiempos en el uso y la transformacioacuten de mis datos

iexclRecomendaciones

Prefiera publicar su conjunto de datos en formatos abiertos o no propietario ya que

estos facilitan el uso re-uso y distribucioacuten de estos Se busca que un mayor nuacutemero de

aplicaciones informaacuteticas pueda extraer leer y transformar los datos generando mayor

uso y re-uso por los usuarios

Disponga sus datos en muacuteltiples formatos con el fin de incrementar el acceso a los

mismos Se busca que el mayor nuacutemero de usuarios pueda utilizar los datos sin tener

que transformarlos primero en su formato preferido

Utilice Web Services para mejorar el intercambio e interoperabilidad de los datos

publicados

14 httpdleraeessrvsearchm=30ampw=formato

18 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo 1

A continuacioacuten encontraraacute extensiones de formato propietario y no propietario prefiera para

la publicacioacuten de sus datos las extensiones de la derecha

FORMATO PROPIETARIO FORMATO NO PROPIETARIO

DOC GDB TXT ASCII Grid KML RDF

XLS DWG CSV GeoJSON DXF XML

PPT SHP JSON GML ODF

Ejemplo 2

Si no fue posible utilizar una extensioacuten de formato no propietario publique sus datos en una

variedad de formatos que le permita al usuario acceder a los datos desde diferentes

aplicaciones informaacuteticas

Ejemplo 3

Para publicar sus datos conozca diferentes tipos de Web Services que viajan en la red utilizando extensiones XML

SOAP httpswwww3orgTRsoap

REST httprestelksteinorg

WMS httpwwwopengeospatialorgstandardswms

WFS httpwwwopengeospatialorgstandardswfs

WCS httpwwwopengeospatialorgstandardswcs

19 Buenas praacutecticas para la publicacioacuten de datos

6 Proporcionar un diccionario de datos que facilite el uso e interpretacioacuten de los datos publicados

Un diccionario estaacute definido como un repertorio en forma de libro o en soporte electroacutenico en el

que se recogen seguacuten un orden determinado las palabras o expresiones de una o maacutes lenguas

o de una materia concreta acompantildeadas de su definicioacuten equivalencia o explicacioacuten15

especiacuteficamente en un diccionario de datos se encuentran los conceptos de los datos y sus

propiedades (atributos dominios asociaciones y operaciones) acompantildeados de una definicioacuten

en donde se identifica el propoacutesito alcance y campo de aplicacioacuten del dato publicado

Lograr que los usuarios de mis datos entiendan la informacioacuten que estaacute publicada le permitiraacute

decidir si satisfacen o no su necesidad y le facilitaraacute la decisioacuten para explotar lo datos

Para maacutes informacioacuten consulte el Instructivo Diccionario de Datos

iquestQueacute logro

Que mis datos sean consultados utilizados y reutilizados por maacutes usuarios

Que se eviten ambiguumledades en la interpretacioacuten de mis datos

Que mis datos publicados esteacuten unificados y consistentes

Que los usuarios comprendan mejor y dispongan de claridad sobre los conceptos de

mis datos

iexclRecomendaciones

Publique como miacutenimo un diccionario de datos que contenga la caracterizacioacuten del

conjunto de datos producidos por su entidad

Cree el diccionario de datos teniendo en cuenta como miacutenimo la siguiente informacioacuten

Nombre del atributo Nombre que identifica de manera clara un atributo

Definicioacuten Descripcioacuten del atributo

Tipo de dato Tipo de valor del atributo

Unidad de medida Expresa la unidad de medida del atributo

Dominio Determina si el atributo tiene asociado un dominio

15 httpdleraeesw=diccionario

20 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo

Para el conjunto de datos ldquoEstablecimientos Educativos en Bogotaacuterdquo publicariacuteamos un

diccionario de datos similar al siguiente

Nombre del atributo Definicioacuten Tipo de dato

Unidad de Medida

Dominio

Coacutedigo del establecimiento

Coacutedigo DANE asignado al Institucioacuten Educativa Decimal

Nombre del establecimiento

Nombre de la Institucioacuten Educativa Cadena de Caracteres

Aacuterea construida del establecimiento

Aacuterea construida de la Institucioacuten Educativa Decimal Metros

cuadrados

Sector

Clasificacioacuten asignada seguacuten la naturaleza juriacutedica la cual define las principales caracteriacutesticas que desde lo juriacutedico - administrativo y tiene que ver con el origen de su creacioacuten

Entero

EESector

No podriacuteamos olvidar detallar el dominio asociado

Atributo Nombre del Dominio Coacutedigo Definicioacuten

EESector

Oficial 1

Es una institucioacuten donde su naturaleza de servicio puacuteblico cultural y su funcioacuten social le es inherente cumpliendo con las disposiciones legales y estatutarias que las rigen donde sus rentas se conservan y se aplican debidamente

Privado 2

Es una institucioacuten constituida como persona juriacutedica de utilidad comuacuten donde sus rentas se conservan y se aplican debidamente y que en todo lo esencial se cumple con la voluntad de sus fundadores

21 Buenas praacutecticas para la publicacioacuten de datos

7 Acompantildear la publicacioacuten de los datos con enlaces a otros recursos

Un enlace es definido como una secuencia de caracteres que se utiliza como direccioacuten para

acceder a informacioacuten adicional16 maacutes sencillo puede definirse como una expresioacuten que

conecta una cierta informacioacuten con otra17Ahora bien un recurso se puede entender como

cualquier medio que satisfaga una necesidad por ejemplo datos servicios documentos o

software

En teacuterminos generales se sugiere que para facilitar al usuario la comprensioacuten de los datos

publicados se proporcionen recursos o documentos adicionales que puedan ser consultados

yo descargados traveacutes de enlaces o links de otro sitio Web

Dentro de los recursos adicionales que pueden publicarse para acompantildear el dato estaacuten los

procedimientos de captura del dato los cataacutelogos de objetos las especificaciones teacutecnicas los

documentos normativos los cataacutelogos de simbologiacutea los reportes de evaluacioacuten de calidad

entre otros

iquestQueacute logro

Mejorar la consulta utilizacioacuten y reutilizacioacuten de mis datos

Que los usuarios comprendan mejor mis datos

Que mis datos sean compartidos e intercambiados por un mayor nuacutemero de usuarios

iexclRecomendaciones

Disponga informacioacuten adicional de sus datos que le permita a los usuarios ampliar el

horizonte de las aplicaciones y funcionalidades en las que pueda utilizar y explotar del

dato

No olvide vincular o registrar esta informacioacuten en el metadato

16 httpdleraeesid=FTVRKyj 17 httpssistemascomenlacephp

22 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo 1

El ldquoMapa de Referencia para Bogotaacuterdquo publicado en httpswwwidecagovcoesserviciosmapa-de-referencia tiene publicados varios enlaces a otros recursos

Especificacioacuten teacutecnica para la elaboracioacuten del Mapa de Referencia para Bogotaacute DC V0318

Cataacutelogo de Objetos del Mapa de Referencia de Bogotaacute DC V 57

Cataacutelogo de Representacioacuten del Mapa de Referencia de Bogotaacute DC V30

Reporte de evaluacioacuten de calidad generado al Mapa de Referencia del Distrito Capital V1217

Ejemplo 2

La informacioacuten de los ldquohumedales de Bogotaacuterdquo publicada en

httpambientebogotagovcowebsdahumedales tiene publicados enlaces a otros recursos

o Gestioacuten de los humedales

o Poliacutetica de Humedales del Distrito Capital

o Normatividad

o Planes de Manejo Ambiental

o Comiteacute distrital de humedales documentos de consulta normatividad

23 Buenas praacutecticas para la publicacioacuten de datos

8 Depurar sus datos antes de publicarlos para garantizar su calidad y aumentar su confianza

La calidad estaacute definida como el conjunto de propiedades inherentes a algo que permiten

juzgar su valor18 para el caso que nos concierne este algo hace referencia al dato publicado

Ahora bien la calidad tambieacuten es entendida como la capacidad del dato publicado para

satisfacer los requerimientos y las necesidades de los usuarios respetando una serie de normas

y especificaciones establecidas

Actualmente existen muacuteltiples elementos de calidad de los datos que identifican las cualidades

de estos sin embargo en este aparte citaremos los elementos principales que usted o su

entidad deben tener en cuenta para publicar sus datos con un estaacutendar miacutenimo de calidad

Para maacutes informacioacuten consulte el Procedimiento para evaluar y reportar la calidad de

los datos espaciales

iquestQueacute logro

Que mis datos sean consultados utilizados y reutilizados por maacutes usuarios

Que los usuarios hablen bien de mis datos

Que mis datos sean maacutes interoperables y maacutes procesados

Que mis datos sean maacutes compartidos

Que mis datos sean maacutes confiables

Recomendacioacuten 1

Establezca si dentro de su conjunto de datos existen capos vaciacuteos o nulos con informacioacuten

descontextualizada sobrante o duplicada Si existen compleacutetelos o elimiacutenelos seguacuten

corresponda antes de la publicacioacuten El elemento de calidad asociado se denomina ldquototalidadrdquo

Localidad Atendidos Localidad Atendidos

Suba 200 Suba 200

Suba 200 Tunjuelito 500

Ameacutericas 100

850

Tunjuelito 500

18 httpdleraeesid=6nVpk8P|6nXVL1Z

Campo duplicado

Campo inconsistente

Campo vaciacuteo

24 Buenas praacutecticas para la publicacioacuten de datos

Recomendacioacuten 2

Identifique y transforme si es necesario los datos que hayan sido registrados en un formato

diferente al establecido para su conjunto de datos Es decir estandarice el formato de salida

del dato que va a publicar El elemento de calidad asociado se denomina ldquoconsistencia de

formatordquo

Localidad Atendidos Localidad Atendidos

Suba 200 Suba 200

Tunjuelito 5008 Tunjuelito 500

Fontiboacuten 40 Fontiboacuten 430

Tunjuelito 500 Tunjuelito 500

Recomendacioacuten 3

Si sus datos tienen alguacuten tipo de clasificacioacuten o rangos previo a la publicacioacuten valide que estos

se hayan registrado correctamente El elemento de calidad asociado se denomina ldquoexactitud de

clasificacioacutenrdquo

Geacutenero Edad Rango de Edad Geacutenero Edad Rango de Edad

Femenino 5 0 lt Edad le 10 Femenino 5 0 lt Edad le 10

Masculino 15 0 lt Edad le 10 Masculino 15 10 lt Edad le 20

Femenino 35 40 lt Edad le 50 Femenino 35 30 lt Edad le 40

Recomendacioacuten 4

Si sus datos representan atributos cuantitativos verifique antes de la publicacioacuten que estos

correspondan a valores conocidos como verdaderos El elemento de calidad asociado se

denomina ldquoexactitud de atributos cuantitativosrdquo

Localidad Mes Temperatura Localidad Mes Temperatura

Chapinero Enero 7degC Chapinero Enero 7degC

Suba Agosto -15degC Suba Agosto 15degC

Tunjuelito Abril 60degC Tunjuelito Abril 16degC

Clasificacioacuten inconsistente

Formato inconsistente

Valor inconsistente

25 Buenas praacutecticas para la publicacioacuten de datos

Recomendacioacuten 5

Si los datos a publicar tienen asociadas fechas de captura o recoleccioacuten de informacioacuten (Por

ejemplo registro de incidentes registro de vacunacioacuten conteo de vehiacuteculos etc) valide que

las fechas registradas coincidan con la fecha del evento capturado El elemento de calidad

asociado se denomina ldquoexactitud de la medicioacuten del tiempordquo

Precipitacioacuten (mm) Fecha de registro Precipitacioacuten (mm) Fecha de registro

00 20580101 00 20180101

01 20180102 01 20180102

126 20510403 126 20180103

20 20180104 20 20180104

Recomendacioacuten 6

Cuando sus datos reflejen informacioacuten determinada por un orden de eventos garantice antes

de la publicacioacuten que este orden sea el adecuado El elemento de calidad asociado se

denomina ldquoconsistencia temporalrdquo

Usuario Escolaridad Periodo de Estudio Usuario Escolaridad Periodo de Estudio

Usuario 1 Preescolar 20030101 ndash 20051231 Usuario 1 Preescolar 20030101 ndash 20051231

Usuario 1 Primaria 20030101 ndash 20101231 Usuario 1 Primaria 20060101 ndash 20101231

Usuario 1 Secundaria 20060101 ndash 20163112 Usuario 1 Secundaria 20110101 ndash 20143112

Usuario 1 Media 20150101 - 20163112 Usuario 1 Media 20150101 - 20163112

Recomendacioacuten 7

Si sus datos incluyen alguna ubicacioacuten (direccioacuten lugar coordenadas) verifique que esta

corresponda a la ubicacioacuten real El elemento de calidad asociado se denomina ldquoexactitud

posicionalrdquo

Eventos Deportivos Lugar Eventos Deportivos Lugar

Evento 1 AK 30 25 90 Evento 1 AK 30 25 90

Evento 2 AC 63 215 20 Evento 2 Parque La Florida

Evento 3 Parque Simoacuten Boliacutevar Evento 3 Parque Simoacuten Boliacutevar

Fecha

inconsistente

Fechas no secuenciales

Lugar inexistente

26 Buenas praacutecticas para la publicacioacuten de datos

9 Incorporar el componente geograacutefico en los datos publicados para optimizar su comprensioacuten uso re-uso y visualizacioacuten

El espacio geograacutefico es un punto de la superficie terrestre que se vea afectado o que afecte de

alguna manera a la humanidad19 Este punto de la superficie puede ser la direccioacuten de una

institucioacuten educativa la ubicacioacuten de un centro de vacunacioacuten el lugar donde se miden las

variaciones de traacutensito en la ciudad los parques de Bogotaacute el edificio en donde se llevan a

cabo los traacutemites de una entidad etc

Los datos que usted captura o recolecta en su quehacer misional siempre estaacuten asociados a un

espacio geograacutefico por lo tanto este componente deberiacutea ser incluido en los datos publicados

Tenga en cuenta que el componente geograacutefico lo puede incorporar incluyendo una ubicacioacuten

asociada a una direccioacuten a un lugar a una localidad a un barrio al nombre de un

establecimiento puacuteblicamente reconocido o a cualquier punto que permita al usuario

identificar la localizacioacuten del dato publicado

iquestQueacute logro

Ampliar el espectro de usuarios que consultan utilizan y reutilizan mis datos

Que mis datos sean maacutes interoperables y maacutes procesados

Que mis datos sean puedan compartir en maacutes plataformas

Que los usuarios puedan visualizar mis datos en un mapa

iexclRecomendaciones

Disponga sus datos agregando un atributo de ubicacioacuten como direcciones coordenadas o

lugares geograacuteficos

Ejemplo 1

Incluya direcciones que permitan localizar espacialmente sus datos

Programa Direccioacuten

Registro de atencioacuten a la ciudadaniacutea CL 138 108 16

Centro de autocuidado KR 18 D 77 A 11 SUR

Familias con un nintildeo en cupos cofinanciados CL 70 A SUR 20 46

Centro de autocuidado KR 18 D 73 A 33 SUR

19 httpenciclopediabanrepculturalorgindexphptitle=Espacio_geogrC3A1fico

27 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo 2

Utilice coordenadas para indicar la ubicacioacuten de sus datos

EPS Coordenada X Coordenada Y

EPS Convida 9087496334 1051342164

Capital Salud EPS 986321006 954875808

EPS Famisanar 9742508812 8837031501

Aliansalud EPS 9716943356 9659706891

Salud Total EPS 9215624975 9625189518

Tenga en cuenta que para publicar datos con coordenadas tendraacute que incluir dentro

de su metadato el Sistema de referencia empleado

MAGNA ndash SIRGAS EPSG 4686 httpsepsgio4686

MAGNA ndash SIRGAS EPSG 3116 httpsepsgio3116

MAGNA ndash BOGOTAacute SR-ORG 7458 httpspatialreferenceorgrefsr-org7458

Ejemplo 3

Tambieacuten puede incluir lugares geograacuteficos descriptivos asiacute

Usuario Vacunado Lugar de Vacunacioacuten

Usuario 1 BOSQUE IZQUIERDO

Usuario 2 LAGUNITAS URBANO

Usuario 3 LA CAPUCHINA

Usuario 4 SAN JOSE SUR

Usuario 5 VENECIA

28 Buenas praacutecticas para la publicacioacuten de datos

10 Asignar un identificador uacutenico que permita aumentar la consulta uso e interoperabilidad del dato publicado

Considere un identificador uacutenico como un texto que permite identificar inequiacutevocamente el

dato publicado Si usted va a publicar un dato buscando que este sea reutilizado por los

usuarios y por su propia entidad asignar un identificador facilitaraacute el descubrimiento y la

citacioacuten del dato a traveacutes del tiempo independientemente del estado la disponibilidad o el

formato de este

En la vida cotidiana mediante la ceacutedula de ciudadaniacutea se asigna a cada ciudadano un nuacutemero

de identificacioacuten uacutenico y a traveacutes de este identificador el ciudadano es reconocido a lo largo de

su vida e incluso despueacutes de su muerte por otras personas yo autoridades En el mundo de la

informacioacuten cada dato deberiacutea viajar con un identificador uacutenico que le permita ser encontrado

y reconocido faacutecilmente entre los demaacutes datos

Ahora bien si usted o su entidad publican continuamente datos establecer un sistema de

identificacioacuten comuacuten le permitiraacute identificar raacutepidamente los datos y los haraacute comparables por

cualquier usuario de manera confiable Esta condicioacuten es previa para lograr una correcta

gestioacuten y reutilizacioacuten de sus datos

iquestQueacute logro

Ampliar el espectro de usuarios que consultan utilizan y reutilizan mis datos

Que mis datos sean maacutes interoperables y maacutes procesados

Que mis datos sean compartidos en maacutes plataformas

Que mis datos puedan vincularse a otros datos en el entorno Web

Que mis datos sean encontrados usados y citados inequiacutevocamente

Garantizar y monitorear la reutilizacioacuten de mis datos

Reducir del uso erroacuteneo de mis datos

iexclRecomendaciones

Establezca un sistema de identificacioacuten comuacuten para los datos que va a publicar

Utilice siempre el identificador asignado para publicar sus datos

29 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo

IDECA ha dispuesto el Sistema de Registro de Iacutetems geograacuteficos

httpgeoitemsidecagovcogeoitemsano una herramienta web desarrollada para la

creacioacuten aprobacioacuten publicacioacuten y mantenimiento de iacutetems geograacuteficos que permite la

asignacioacuten concertada de identificadores y significados uacutenicos que contribuyen a la definicioacuten

de un lenguaje comuacuten para el desarrollo de nuevos sistema de informacioacuten en el Distrito

garantizando con ello su fiabilidad e interoperabilidad Adicionalmente permite almacenar

descripciones de la informacioacuten oficial producida e identificar su respectivo custodio jugando

asiacute un papel importante en el control y seguimiento de la produccioacuten de informacioacuten

geograacutefica

Este sistema asigna un identificador uacutenico a cada uno de los iacutetems creados Dentro de los iacutetems

publicados se reconoce el ID 65 como unidad de planeamiento y siempre que se hace

referencia a este objeto es suficiente nombrarlo asiacute para entender que se habla de ldquoUnidades

territoriales de anaacutelisis planeamiento y gestioacuten que tienen como propoacutesito definir y precisar el

planeamiento del suelo urbano de expansioacuten y ruralrdquo

30 Buenas praacutecticas para la publicacioacuten de datos

OBTENGA EL MAacuteS ALTO NIVEL EN PUBLICACIOacuteN DE DATOS

Hasta aquiacute hemos publicado las que consideramos como mejores praacutecticas de publicacioacuten de datos Ahora usted como publicador o como entidad debe evaluar si sus datos se estaacuten disponiendo con los maacutes altos y mejores estaacutendares de publicacioacuten

Lo invitamos a que valide en queacute nivel de publicacioacuten se encuentra su entidad teniendo en cuenta el siguiente listado

Nivel Baacutesico

En este nivel se encuentran aquellas entidades que publican sus datos en formatos estaacutendar y reutilizables (praacutectica 5) que integran a la publicacioacuten sus respectivos metadatos (praacutectica 1) y que acompantildean la publicacioacuten con una licencia asociada (praacutectica 2)

Nivel Intermedio

Este nivel lo alcanzan las entidades que superando el nivel baacutesico disponen un mayor volumen de informacioacuten gracias a que anonimizan sus datos (praacutectica 4) implementan medidas de calidad que aumentan la confianza en sus datos (praacutectica 8) incorporan el componente geograacutefico proporcionando valor agregado a sus datos (praacutectica 9) y publican un diccionario de datos que facilita la interpretacioacuten de los datos publicados (praacutectica 6)

Nivel Avanzado

Las entidades que superando el nivel intermedio utilizan vocabularios estandarizados en sus nuevas publicaciones (praacutectica 3) acompantildean la publicacioacuten de sus datos con enlaces a otros recursos (praacutectica 7) y asignan un identificador uacutenico para dato logrando asiacute aumentar su descubrimiento y reutilizacioacuten (praacutectica 10)

31 Buenas praacutecticas para la publicacioacuten de datos

REFERENCIAS

Bernadette Farias Loacutescio Caroline Burle Newton Calegari W3C Data on the Web Best

Practices 31 de enero de 2017 W3C Recommendation URL httpswwww3orgTRdwbp

Bernadette Hyland Ghislain Auguste Atemezing Boris Villazoacuten-Terrazas W3C Best Practices

for Publishing Linked Data 9 de enero de 2014 W3C Note URL httpswwww3orgTRld-bp

Dan Brickley Libby Miller FOAF project FOAF Vocabulary Specification 099 (Paddington

Edition) 14 de enero de 2014 URL httpxmlnscomfoafspec

Dublin Core metadata initiative DCMI Metadata Terms 14 de junio de 2012 DCMI

Recommendation URL httpdublincoreorgdocumentsdcmi-terms

Fadi Maali John Erickson W3C Data Catalog Vocabulary (DCAT) 16 de enero de 2014 W3C

Recommendation URL httpswwww3orgTRvocab-dcat

ISO 19115-12014 (E) Geographic information ndash Metadata Part1 Fundamentals 01 de abril de

2014 International Standard

ISO 191262009 (E) Geographic information -- Feature concept dictionaries and registers

noviembre de 2009 International Standard

ISO 191572013 (E) Geographic information ndash Data quality 15 de diciembre de 2013

International Standard

Jeremy Tandy Payam Barnaghi Linda van den Brink W3C Spatial Data on the Web Best

Practices 5 de enero 2017 W3C Note URL httpswwww3orgTRsdw-bp

T Berners-Lee R Fielding L Masinter IETF Uniform Resource Identifier (URI) Generic Syntax

Enero de 2005 Internet Standard URL httpstoolsietforghtmlrfc3986

World Wide Web Foundation Open Data Barometer URL httpopendatabarometerorg

W3C OWL Working Group W3C OWL 2 Web Ontology Language Document Overview (Second

Edition) 11 de diciembre de 2012 W3C Recommendation URL httpswwww3orgTRowl2-

overview

W3org Semantic Web - W3C URL httpswwww3orgstandardssemanticweb Consultado

el 12 de septiembre de 2018

Page 11: PARA LA PUBLICACIÓN DE DATOSideca.gov.co/.../files/documentacion/buenaspracticaspublicaciondat… · La obtención de datos la realiza cada entidad en el desarrollo de sus actividades

11 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo 3

El Mapa de referencia para Bogotaacute estaacute publicado en

httpswwwidecagovcoesserviciosmapa-de-referencia bajo las condiciones descritas en la

ldquoLICENCIA ABIERTA O CONDICIONES DE USO PARA DATOS ABIERTOS DE LA INFRAESTRUCTURA

INTEGRADA DE DATOS ESPACIALES PARA EL DISTRITO CAPITAL (IDECA)rdquo

httpswwwidecagovcoeslicenciaabierta

12 Buenas praacutecticas para la publicacioacuten de datos

3 Utilizar vocabularios estandarizados y reutilizables en la estructuracioacuten y publicacioacuten de los datos

Un vocabulario define los conceptos y las relaciones que se utilizan para describir y representar

un aacuterea de intereacutes6 Cuando se publican datos en la Web los vocabularios permiten integrar

datos cuando existen ambiguumledades en los teacuterminos utilizados en los diferentes conjuntos de

datos En la praacutectica un vocabulario es un conjunto de palabras que permiten a dos usuarios

comunicarse entre siacute La efectividad de dicha comunicacioacuten radica en que el significado de una

palabra para el usuario emisor sea el mismo que para el usuario receptor independientemente

de si utilizaron el mismo teacutermino

Cuando se habla de interoperabilidad de datos lo que se espera es que tanto los usuarios

como las aplicaciones informaacuteticas entiendan y comprendan la mayor cantidad de informacioacuten

que estaacuten consumiendo Para conseguir esto las comunidades de datos han identificado

vocablos palabras o teacuterminos de uso comuacuten los cuales cuentan con significados apropiados y

que actualmente se encuentran integrados y estructurados en diferentes estaacutendares

internacionales

Se recomienda utilizar vocabularios de este tipo para estandarizar los datos contenidos en la

informacioacuten publicada

iquestQueacute logro

Que mis datos sean consultados utilizados y reutilizados por maacutes usuarios Que se reduzca la ambiguumledad en la interpretacioacuten de mis datos Que mis datos sean interoperables Que mis datos sean procesados en entornos nacionales e internacionales Que mis datos puedan ser compartidos e intercambiados entre sistemas Que mis datos sean maacutes confiables

iexclRecomendaciones

Consulte normas locales o vocabularios internacionales para la estructuracioacuten7 de sus

datos

Apropie los vocabularios consultados y adapte sus datos a estos en los casos en que sea

posible

Incluya vocabularios ya definidos y reconocidos internacionalmente cuando vaya a

producir nuevos datos

6 httpswwww3orgstandardssemanticwebontology 7 Estructurar significa ajustar los datos a un esquema fijo

13 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo 1

A continuacioacuten se presentan algunos vocabularios internacionales que puede consultar y

apropiar para optimizar el intercambio de sus datos

Data Catalog Vocabulary (DCAT) httpswwww3orgTRvocab-dcatclass-catalog

FOAF Vocabulary Specification httpxmlnscomfoaf01

ISOTC 211 Geographic informationGeomatics Terminology

httpwwwisotc211orgTerminologyhtm

The RDF Data Cube Vocabulary httpswwww3orgTR2014REC-vocab-data-cube-20140116

ODRL Vocabulary amp Expression 22

httpswwww3orgTR2018REC-odrl-vocab-20180215

HTTP Vocabulary in RDF 10 httpswwww3orgTR2017NOTE-HTTP-in-RDF10-20170202

vCard Ontology - for describing People and Organizations

httpswwww3orgTRvcard-rdf

Ejemplo 2

En el contexto Nacional el Ministerio de Tecnologiacuteas de la Informacioacuten y las Comunicaciones ha

establecido el Lenguaje Comuacuten de Intercambio de como un instrumento de consulta que

contiene la definicioacuten de los elementos de datos conceptualizados por las entidades del

estado La consulta la puede realizar en httplenguajeminticgovco

14 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo 3

La especificacioacuten vCard disponible en httpswwww3orgTRvcard-rdf promueve un

vocabulario especiacutefico para describir personas y organizaciones

Uno de los vocablos que describe esta especificacioacuten es la ldquodireccioacuten de entregardquo llamado

dentro del vocabulario como ADR y definido como ldquola direccioacuten del objeto representado en

partes estructuradasrdquo

Ahora bien este vocabulario especifica los componentes de la direccioacuten de entrega para el

objeto asiacute el nombre del paiacutes la localidad el coacutedigo postal la regioacuten y la direccioacuten dada por

viacuteas (calles y carreras en el caso colombiano) Esto quiere decir que cualquiera de los

componentes descritos puede usarse como direccioacuten de entrega vaacutelida ya que son equivalentes

entre siacute

Aunque en el vocabulario la direccioacuten de entrega se llame ADR el usuario de la informacioacuten

entenderaacute que un nombre de paiacutes o un coacutedigo postal pueden interpretarse como ADR

15 Buenas praacutecticas para la publicacioacuten de datos

4 Anonimizar los datos de caraacutecter personal informacioacuten estadiacutestica informacioacuten indirectamente identificable e informacioacuten sensible o confidencial

Anonimizar es el proceso que impide la identificacioacuten de las unidades de estudio que son fuente

para los registros individuales de un conjunto8 de datos o maacutes claro es la aplicacioacuten de teacutecnicas

que permitan expresar un dato relativo a personas eliminando la referencia a su identidad9

Baacutesicamente lo que se busca es reducir los riesgos en el uso y procesamiento de datos

personales evitar la extraccioacuten de registros que identifican a una persona reducir la

combinacioacuten de dos o maacutes registros en una o varias bases de datos para identificar a una

persona y minimizar la deduccioacuten de datos personales partir de uno o varios datos publicados

iquestQueacute informacioacuten debo prioritariamente anonimizar

Datos personales Informacioacuten numeacuterica alfabeacutetica graacutefica fotograacutefica acuacutestica o

cualquier otro tipo susceptible de recogida registro tratamiento y transmisioacuten

concerniente a personas fiacutesicas identificadas o identificables (tales como nombre

apellidos estado civil sexo edad domicilio identificacioacuten personal nuacutemero de

teleacutefono etc)10

Informacioacuten sensible Informacioacuten considerada como estrictamente confidencial

Informacioacuten y caracteriacutesticas referentes a la edad procedencia salud raza religioacuten

ideologiacutea afiliacioacuten finanzas etc se consideran de caraacutecter sensible y requieren de

una proteccioacuten especial11

iquestQueacute logro

Garantizar que mis datos publicados cuentan con medidas de proteccioacuten de datos

personales

Eliminar de manera efectiva el riesgo de re-identificacioacuten

Evitar que el procesamiento de mis datos tenga consecuencias negativas para alguna

persona

Disponer muchos maacutes datos sin invadir la informacioacuten personal

iexclRecomendaciones

Implemente actividades de proteccioacuten de la privacidad de los datos personales antes

de publicarlos

Elimine cualquier identificador directo de la persona (nombre documento de

identidad etc)

8 httpswwwdanegovcofilessenlineamientosDSO_020_LIN_08pdf 9 httpdleraeesid=2jjMiRi 10 httpswwwdanegovcofilessenlineamientosDSO_020_LIN_08pdf 11 Ibidem

16 Buenas praacutecticas para la publicacioacuten de datos

Reemplace los identificadores directos por coacutedigos de referencia pseudoacutenimos

(algoritmos AES12 o un hash cifrado HMAC13) coacutedigos arbitrarios o aleatorios

Si reemplazando el identificador directo auacuten es faacutecil identificar a la persona elimine el

dato

Clasifique yo categorice los datos

Redondee los datos numeacutericos hacia arriba o hacia abajo

Evaluacutee antes durante y despueacutes de publicados los datos si la anonimizacioacuten de sus

datos es suficiente y evaluacutee regularmente los riesgos existentes

Para maacutes informacioacuten consulte los Lineamientos para la Anonimizacioacuten de micro datos

Ejemplo 1

Antes de publicar sus datos retire el identificador directo de la persona En este caso

reemplace en nuacutemero de documento que identifica al usuario y reemplaacutecelo por un

consecutivo

Usuario Beneficio Usuario Beneficio

80123456 Subsidio de vivienda Usuario 1 Subsidio de vivienda

51123456 Subsidio de alimentacioacuten Usuario 2 Subsidio de alimentacioacuten

19123456 Subsidio al adulto mayor Usuario 3 Subsidio al adulto mayor

53123456 Subsidio de desempleo Usuario 4 Subsidio de desempleo

Ejemplo 2

Clasifique o categorice sus datos En este ejemplo asigne rangos a la edad de manera tal que el

titular del registro no sea identificable por este dato

Usuario Edad Usuario Rango de edad

Usuario 1 11 antildeos Usuario 1 Entre 10 y 15 antildeos

Usuario 2 22 antildeos Usuario 2 Entre 20 y 25 antildeos

Usuario 3 36 antildeos Usuario 3 Entre 35 y 40 antildeos

Usuario 4 63 antildeos Usuario 4 Entre 60 y 65 antildeos

12 Advanced Encryption Standard puede consultar como ha sido implementado este algoritmo en httpsrevistasudistritaleducoojsindexphpTecnuraarticleview72368892 13 Hash-based Message Authentication Code puede consultar como se crea este cifrado en httpsdocsoraclecomcdE19253-01819-7804wanboottasks2-51indexhtml

17 Buenas praacutecticas para la publicacioacuten de datos

5 Publicar los datos en formatos estaacutendar reutilizables y legibles por aplicaciones informaacuteticas

Un formato puede ser definido como la estructura de un disco dividido en campos y pistas

seguacuten un determinado sistema operativo lo que permite almacenar en eacutel informacioacuten14

baacutesicamente es la forma en que se codifican los datos en un archivo informaacutetico

Actualmente conocemos formatos comunes de almacenamiento como el doc una extensioacuten

de Word que almacena texto y cuyo propietario es la compantildeiacutea Microsoft Pero iquestqueacute pasa si un

usuario quiere abrir un documento doc en un procesador de texto diferente a Word

difiacutecilmente va a poder conocer el contenido de dicho documento sin tener esta licencia

Lo que queremos lograr con la implementacioacuten de esta praacutectica es que todos los usuarios que

encuentren mis datos puedan accederlos sin necesidad de contar con un software o aplicacioacuten

informaacutetica especiacutefica

iquestQueacute logro

Que mis datos sean consultados utilizados y reutilizados por maacutes usuarios

Que mis datos sean maacutes interoperables y maacutes procesados

Que mis datos puedan ser extraiacutedos transformados y procesados por aplicaciones

informaacuteticas

Que mis datos puedan ser compartidos e intercambiados entre sistemas

Disminuir los costos y los tiempos en el uso y la transformacioacuten de mis datos

iexclRecomendaciones

Prefiera publicar su conjunto de datos en formatos abiertos o no propietario ya que

estos facilitan el uso re-uso y distribucioacuten de estos Se busca que un mayor nuacutemero de

aplicaciones informaacuteticas pueda extraer leer y transformar los datos generando mayor

uso y re-uso por los usuarios

Disponga sus datos en muacuteltiples formatos con el fin de incrementar el acceso a los

mismos Se busca que el mayor nuacutemero de usuarios pueda utilizar los datos sin tener

que transformarlos primero en su formato preferido

Utilice Web Services para mejorar el intercambio e interoperabilidad de los datos

publicados

14 httpdleraeessrvsearchm=30ampw=formato

18 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo 1

A continuacioacuten encontraraacute extensiones de formato propietario y no propietario prefiera para

la publicacioacuten de sus datos las extensiones de la derecha

FORMATO PROPIETARIO FORMATO NO PROPIETARIO

DOC GDB TXT ASCII Grid KML RDF

XLS DWG CSV GeoJSON DXF XML

PPT SHP JSON GML ODF

Ejemplo 2

Si no fue posible utilizar una extensioacuten de formato no propietario publique sus datos en una

variedad de formatos que le permita al usuario acceder a los datos desde diferentes

aplicaciones informaacuteticas

Ejemplo 3

Para publicar sus datos conozca diferentes tipos de Web Services que viajan en la red utilizando extensiones XML

SOAP httpswwww3orgTRsoap

REST httprestelksteinorg

WMS httpwwwopengeospatialorgstandardswms

WFS httpwwwopengeospatialorgstandardswfs

WCS httpwwwopengeospatialorgstandardswcs

19 Buenas praacutecticas para la publicacioacuten de datos

6 Proporcionar un diccionario de datos que facilite el uso e interpretacioacuten de los datos publicados

Un diccionario estaacute definido como un repertorio en forma de libro o en soporte electroacutenico en el

que se recogen seguacuten un orden determinado las palabras o expresiones de una o maacutes lenguas

o de una materia concreta acompantildeadas de su definicioacuten equivalencia o explicacioacuten15

especiacuteficamente en un diccionario de datos se encuentran los conceptos de los datos y sus

propiedades (atributos dominios asociaciones y operaciones) acompantildeados de una definicioacuten

en donde se identifica el propoacutesito alcance y campo de aplicacioacuten del dato publicado

Lograr que los usuarios de mis datos entiendan la informacioacuten que estaacute publicada le permitiraacute

decidir si satisfacen o no su necesidad y le facilitaraacute la decisioacuten para explotar lo datos

Para maacutes informacioacuten consulte el Instructivo Diccionario de Datos

iquestQueacute logro

Que mis datos sean consultados utilizados y reutilizados por maacutes usuarios

Que se eviten ambiguumledades en la interpretacioacuten de mis datos

Que mis datos publicados esteacuten unificados y consistentes

Que los usuarios comprendan mejor y dispongan de claridad sobre los conceptos de

mis datos

iexclRecomendaciones

Publique como miacutenimo un diccionario de datos que contenga la caracterizacioacuten del

conjunto de datos producidos por su entidad

Cree el diccionario de datos teniendo en cuenta como miacutenimo la siguiente informacioacuten

Nombre del atributo Nombre que identifica de manera clara un atributo

Definicioacuten Descripcioacuten del atributo

Tipo de dato Tipo de valor del atributo

Unidad de medida Expresa la unidad de medida del atributo

Dominio Determina si el atributo tiene asociado un dominio

15 httpdleraeesw=diccionario

20 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo

Para el conjunto de datos ldquoEstablecimientos Educativos en Bogotaacuterdquo publicariacuteamos un

diccionario de datos similar al siguiente

Nombre del atributo Definicioacuten Tipo de dato

Unidad de Medida

Dominio

Coacutedigo del establecimiento

Coacutedigo DANE asignado al Institucioacuten Educativa Decimal

Nombre del establecimiento

Nombre de la Institucioacuten Educativa Cadena de Caracteres

Aacuterea construida del establecimiento

Aacuterea construida de la Institucioacuten Educativa Decimal Metros

cuadrados

Sector

Clasificacioacuten asignada seguacuten la naturaleza juriacutedica la cual define las principales caracteriacutesticas que desde lo juriacutedico - administrativo y tiene que ver con el origen de su creacioacuten

Entero

EESector

No podriacuteamos olvidar detallar el dominio asociado

Atributo Nombre del Dominio Coacutedigo Definicioacuten

EESector

Oficial 1

Es una institucioacuten donde su naturaleza de servicio puacuteblico cultural y su funcioacuten social le es inherente cumpliendo con las disposiciones legales y estatutarias que las rigen donde sus rentas se conservan y se aplican debidamente

Privado 2

Es una institucioacuten constituida como persona juriacutedica de utilidad comuacuten donde sus rentas se conservan y se aplican debidamente y que en todo lo esencial se cumple con la voluntad de sus fundadores

21 Buenas praacutecticas para la publicacioacuten de datos

7 Acompantildear la publicacioacuten de los datos con enlaces a otros recursos

Un enlace es definido como una secuencia de caracteres que se utiliza como direccioacuten para

acceder a informacioacuten adicional16 maacutes sencillo puede definirse como una expresioacuten que

conecta una cierta informacioacuten con otra17Ahora bien un recurso se puede entender como

cualquier medio que satisfaga una necesidad por ejemplo datos servicios documentos o

software

En teacuterminos generales se sugiere que para facilitar al usuario la comprensioacuten de los datos

publicados se proporcionen recursos o documentos adicionales que puedan ser consultados

yo descargados traveacutes de enlaces o links de otro sitio Web

Dentro de los recursos adicionales que pueden publicarse para acompantildear el dato estaacuten los

procedimientos de captura del dato los cataacutelogos de objetos las especificaciones teacutecnicas los

documentos normativos los cataacutelogos de simbologiacutea los reportes de evaluacioacuten de calidad

entre otros

iquestQueacute logro

Mejorar la consulta utilizacioacuten y reutilizacioacuten de mis datos

Que los usuarios comprendan mejor mis datos

Que mis datos sean compartidos e intercambiados por un mayor nuacutemero de usuarios

iexclRecomendaciones

Disponga informacioacuten adicional de sus datos que le permita a los usuarios ampliar el

horizonte de las aplicaciones y funcionalidades en las que pueda utilizar y explotar del

dato

No olvide vincular o registrar esta informacioacuten en el metadato

16 httpdleraeesid=FTVRKyj 17 httpssistemascomenlacephp

22 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo 1

El ldquoMapa de Referencia para Bogotaacuterdquo publicado en httpswwwidecagovcoesserviciosmapa-de-referencia tiene publicados varios enlaces a otros recursos

Especificacioacuten teacutecnica para la elaboracioacuten del Mapa de Referencia para Bogotaacute DC V0318

Cataacutelogo de Objetos del Mapa de Referencia de Bogotaacute DC V 57

Cataacutelogo de Representacioacuten del Mapa de Referencia de Bogotaacute DC V30

Reporte de evaluacioacuten de calidad generado al Mapa de Referencia del Distrito Capital V1217

Ejemplo 2

La informacioacuten de los ldquohumedales de Bogotaacuterdquo publicada en

httpambientebogotagovcowebsdahumedales tiene publicados enlaces a otros recursos

o Gestioacuten de los humedales

o Poliacutetica de Humedales del Distrito Capital

o Normatividad

o Planes de Manejo Ambiental

o Comiteacute distrital de humedales documentos de consulta normatividad

23 Buenas praacutecticas para la publicacioacuten de datos

8 Depurar sus datos antes de publicarlos para garantizar su calidad y aumentar su confianza

La calidad estaacute definida como el conjunto de propiedades inherentes a algo que permiten

juzgar su valor18 para el caso que nos concierne este algo hace referencia al dato publicado

Ahora bien la calidad tambieacuten es entendida como la capacidad del dato publicado para

satisfacer los requerimientos y las necesidades de los usuarios respetando una serie de normas

y especificaciones establecidas

Actualmente existen muacuteltiples elementos de calidad de los datos que identifican las cualidades

de estos sin embargo en este aparte citaremos los elementos principales que usted o su

entidad deben tener en cuenta para publicar sus datos con un estaacutendar miacutenimo de calidad

Para maacutes informacioacuten consulte el Procedimiento para evaluar y reportar la calidad de

los datos espaciales

iquestQueacute logro

Que mis datos sean consultados utilizados y reutilizados por maacutes usuarios

Que los usuarios hablen bien de mis datos

Que mis datos sean maacutes interoperables y maacutes procesados

Que mis datos sean maacutes compartidos

Que mis datos sean maacutes confiables

Recomendacioacuten 1

Establezca si dentro de su conjunto de datos existen capos vaciacuteos o nulos con informacioacuten

descontextualizada sobrante o duplicada Si existen compleacutetelos o elimiacutenelos seguacuten

corresponda antes de la publicacioacuten El elemento de calidad asociado se denomina ldquototalidadrdquo

Localidad Atendidos Localidad Atendidos

Suba 200 Suba 200

Suba 200 Tunjuelito 500

Ameacutericas 100

850

Tunjuelito 500

18 httpdleraeesid=6nVpk8P|6nXVL1Z

Campo duplicado

Campo inconsistente

Campo vaciacuteo

24 Buenas praacutecticas para la publicacioacuten de datos

Recomendacioacuten 2

Identifique y transforme si es necesario los datos que hayan sido registrados en un formato

diferente al establecido para su conjunto de datos Es decir estandarice el formato de salida

del dato que va a publicar El elemento de calidad asociado se denomina ldquoconsistencia de

formatordquo

Localidad Atendidos Localidad Atendidos

Suba 200 Suba 200

Tunjuelito 5008 Tunjuelito 500

Fontiboacuten 40 Fontiboacuten 430

Tunjuelito 500 Tunjuelito 500

Recomendacioacuten 3

Si sus datos tienen alguacuten tipo de clasificacioacuten o rangos previo a la publicacioacuten valide que estos

se hayan registrado correctamente El elemento de calidad asociado se denomina ldquoexactitud de

clasificacioacutenrdquo

Geacutenero Edad Rango de Edad Geacutenero Edad Rango de Edad

Femenino 5 0 lt Edad le 10 Femenino 5 0 lt Edad le 10

Masculino 15 0 lt Edad le 10 Masculino 15 10 lt Edad le 20

Femenino 35 40 lt Edad le 50 Femenino 35 30 lt Edad le 40

Recomendacioacuten 4

Si sus datos representan atributos cuantitativos verifique antes de la publicacioacuten que estos

correspondan a valores conocidos como verdaderos El elemento de calidad asociado se

denomina ldquoexactitud de atributos cuantitativosrdquo

Localidad Mes Temperatura Localidad Mes Temperatura

Chapinero Enero 7degC Chapinero Enero 7degC

Suba Agosto -15degC Suba Agosto 15degC

Tunjuelito Abril 60degC Tunjuelito Abril 16degC

Clasificacioacuten inconsistente

Formato inconsistente

Valor inconsistente

25 Buenas praacutecticas para la publicacioacuten de datos

Recomendacioacuten 5

Si los datos a publicar tienen asociadas fechas de captura o recoleccioacuten de informacioacuten (Por

ejemplo registro de incidentes registro de vacunacioacuten conteo de vehiacuteculos etc) valide que

las fechas registradas coincidan con la fecha del evento capturado El elemento de calidad

asociado se denomina ldquoexactitud de la medicioacuten del tiempordquo

Precipitacioacuten (mm) Fecha de registro Precipitacioacuten (mm) Fecha de registro

00 20580101 00 20180101

01 20180102 01 20180102

126 20510403 126 20180103

20 20180104 20 20180104

Recomendacioacuten 6

Cuando sus datos reflejen informacioacuten determinada por un orden de eventos garantice antes

de la publicacioacuten que este orden sea el adecuado El elemento de calidad asociado se

denomina ldquoconsistencia temporalrdquo

Usuario Escolaridad Periodo de Estudio Usuario Escolaridad Periodo de Estudio

Usuario 1 Preescolar 20030101 ndash 20051231 Usuario 1 Preescolar 20030101 ndash 20051231

Usuario 1 Primaria 20030101 ndash 20101231 Usuario 1 Primaria 20060101 ndash 20101231

Usuario 1 Secundaria 20060101 ndash 20163112 Usuario 1 Secundaria 20110101 ndash 20143112

Usuario 1 Media 20150101 - 20163112 Usuario 1 Media 20150101 - 20163112

Recomendacioacuten 7

Si sus datos incluyen alguna ubicacioacuten (direccioacuten lugar coordenadas) verifique que esta

corresponda a la ubicacioacuten real El elemento de calidad asociado se denomina ldquoexactitud

posicionalrdquo

Eventos Deportivos Lugar Eventos Deportivos Lugar

Evento 1 AK 30 25 90 Evento 1 AK 30 25 90

Evento 2 AC 63 215 20 Evento 2 Parque La Florida

Evento 3 Parque Simoacuten Boliacutevar Evento 3 Parque Simoacuten Boliacutevar

Fecha

inconsistente

Fechas no secuenciales

Lugar inexistente

26 Buenas praacutecticas para la publicacioacuten de datos

9 Incorporar el componente geograacutefico en los datos publicados para optimizar su comprensioacuten uso re-uso y visualizacioacuten

El espacio geograacutefico es un punto de la superficie terrestre que se vea afectado o que afecte de

alguna manera a la humanidad19 Este punto de la superficie puede ser la direccioacuten de una

institucioacuten educativa la ubicacioacuten de un centro de vacunacioacuten el lugar donde se miden las

variaciones de traacutensito en la ciudad los parques de Bogotaacute el edificio en donde se llevan a

cabo los traacutemites de una entidad etc

Los datos que usted captura o recolecta en su quehacer misional siempre estaacuten asociados a un

espacio geograacutefico por lo tanto este componente deberiacutea ser incluido en los datos publicados

Tenga en cuenta que el componente geograacutefico lo puede incorporar incluyendo una ubicacioacuten

asociada a una direccioacuten a un lugar a una localidad a un barrio al nombre de un

establecimiento puacuteblicamente reconocido o a cualquier punto que permita al usuario

identificar la localizacioacuten del dato publicado

iquestQueacute logro

Ampliar el espectro de usuarios que consultan utilizan y reutilizan mis datos

Que mis datos sean maacutes interoperables y maacutes procesados

Que mis datos sean puedan compartir en maacutes plataformas

Que los usuarios puedan visualizar mis datos en un mapa

iexclRecomendaciones

Disponga sus datos agregando un atributo de ubicacioacuten como direcciones coordenadas o

lugares geograacuteficos

Ejemplo 1

Incluya direcciones que permitan localizar espacialmente sus datos

Programa Direccioacuten

Registro de atencioacuten a la ciudadaniacutea CL 138 108 16

Centro de autocuidado KR 18 D 77 A 11 SUR

Familias con un nintildeo en cupos cofinanciados CL 70 A SUR 20 46

Centro de autocuidado KR 18 D 73 A 33 SUR

19 httpenciclopediabanrepculturalorgindexphptitle=Espacio_geogrC3A1fico

27 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo 2

Utilice coordenadas para indicar la ubicacioacuten de sus datos

EPS Coordenada X Coordenada Y

EPS Convida 9087496334 1051342164

Capital Salud EPS 986321006 954875808

EPS Famisanar 9742508812 8837031501

Aliansalud EPS 9716943356 9659706891

Salud Total EPS 9215624975 9625189518

Tenga en cuenta que para publicar datos con coordenadas tendraacute que incluir dentro

de su metadato el Sistema de referencia empleado

MAGNA ndash SIRGAS EPSG 4686 httpsepsgio4686

MAGNA ndash SIRGAS EPSG 3116 httpsepsgio3116

MAGNA ndash BOGOTAacute SR-ORG 7458 httpspatialreferenceorgrefsr-org7458

Ejemplo 3

Tambieacuten puede incluir lugares geograacuteficos descriptivos asiacute

Usuario Vacunado Lugar de Vacunacioacuten

Usuario 1 BOSQUE IZQUIERDO

Usuario 2 LAGUNITAS URBANO

Usuario 3 LA CAPUCHINA

Usuario 4 SAN JOSE SUR

Usuario 5 VENECIA

28 Buenas praacutecticas para la publicacioacuten de datos

10 Asignar un identificador uacutenico que permita aumentar la consulta uso e interoperabilidad del dato publicado

Considere un identificador uacutenico como un texto que permite identificar inequiacutevocamente el

dato publicado Si usted va a publicar un dato buscando que este sea reutilizado por los

usuarios y por su propia entidad asignar un identificador facilitaraacute el descubrimiento y la

citacioacuten del dato a traveacutes del tiempo independientemente del estado la disponibilidad o el

formato de este

En la vida cotidiana mediante la ceacutedula de ciudadaniacutea se asigna a cada ciudadano un nuacutemero

de identificacioacuten uacutenico y a traveacutes de este identificador el ciudadano es reconocido a lo largo de

su vida e incluso despueacutes de su muerte por otras personas yo autoridades En el mundo de la

informacioacuten cada dato deberiacutea viajar con un identificador uacutenico que le permita ser encontrado

y reconocido faacutecilmente entre los demaacutes datos

Ahora bien si usted o su entidad publican continuamente datos establecer un sistema de

identificacioacuten comuacuten le permitiraacute identificar raacutepidamente los datos y los haraacute comparables por

cualquier usuario de manera confiable Esta condicioacuten es previa para lograr una correcta

gestioacuten y reutilizacioacuten de sus datos

iquestQueacute logro

Ampliar el espectro de usuarios que consultan utilizan y reutilizan mis datos

Que mis datos sean maacutes interoperables y maacutes procesados

Que mis datos sean compartidos en maacutes plataformas

Que mis datos puedan vincularse a otros datos en el entorno Web

Que mis datos sean encontrados usados y citados inequiacutevocamente

Garantizar y monitorear la reutilizacioacuten de mis datos

Reducir del uso erroacuteneo de mis datos

iexclRecomendaciones

Establezca un sistema de identificacioacuten comuacuten para los datos que va a publicar

Utilice siempre el identificador asignado para publicar sus datos

29 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo

IDECA ha dispuesto el Sistema de Registro de Iacutetems geograacuteficos

httpgeoitemsidecagovcogeoitemsano una herramienta web desarrollada para la

creacioacuten aprobacioacuten publicacioacuten y mantenimiento de iacutetems geograacuteficos que permite la

asignacioacuten concertada de identificadores y significados uacutenicos que contribuyen a la definicioacuten

de un lenguaje comuacuten para el desarrollo de nuevos sistema de informacioacuten en el Distrito

garantizando con ello su fiabilidad e interoperabilidad Adicionalmente permite almacenar

descripciones de la informacioacuten oficial producida e identificar su respectivo custodio jugando

asiacute un papel importante en el control y seguimiento de la produccioacuten de informacioacuten

geograacutefica

Este sistema asigna un identificador uacutenico a cada uno de los iacutetems creados Dentro de los iacutetems

publicados se reconoce el ID 65 como unidad de planeamiento y siempre que se hace

referencia a este objeto es suficiente nombrarlo asiacute para entender que se habla de ldquoUnidades

territoriales de anaacutelisis planeamiento y gestioacuten que tienen como propoacutesito definir y precisar el

planeamiento del suelo urbano de expansioacuten y ruralrdquo

30 Buenas praacutecticas para la publicacioacuten de datos

OBTENGA EL MAacuteS ALTO NIVEL EN PUBLICACIOacuteN DE DATOS

Hasta aquiacute hemos publicado las que consideramos como mejores praacutecticas de publicacioacuten de datos Ahora usted como publicador o como entidad debe evaluar si sus datos se estaacuten disponiendo con los maacutes altos y mejores estaacutendares de publicacioacuten

Lo invitamos a que valide en queacute nivel de publicacioacuten se encuentra su entidad teniendo en cuenta el siguiente listado

Nivel Baacutesico

En este nivel se encuentran aquellas entidades que publican sus datos en formatos estaacutendar y reutilizables (praacutectica 5) que integran a la publicacioacuten sus respectivos metadatos (praacutectica 1) y que acompantildean la publicacioacuten con una licencia asociada (praacutectica 2)

Nivel Intermedio

Este nivel lo alcanzan las entidades que superando el nivel baacutesico disponen un mayor volumen de informacioacuten gracias a que anonimizan sus datos (praacutectica 4) implementan medidas de calidad que aumentan la confianza en sus datos (praacutectica 8) incorporan el componente geograacutefico proporcionando valor agregado a sus datos (praacutectica 9) y publican un diccionario de datos que facilita la interpretacioacuten de los datos publicados (praacutectica 6)

Nivel Avanzado

Las entidades que superando el nivel intermedio utilizan vocabularios estandarizados en sus nuevas publicaciones (praacutectica 3) acompantildean la publicacioacuten de sus datos con enlaces a otros recursos (praacutectica 7) y asignan un identificador uacutenico para dato logrando asiacute aumentar su descubrimiento y reutilizacioacuten (praacutectica 10)

31 Buenas praacutecticas para la publicacioacuten de datos

REFERENCIAS

Bernadette Farias Loacutescio Caroline Burle Newton Calegari W3C Data on the Web Best

Practices 31 de enero de 2017 W3C Recommendation URL httpswwww3orgTRdwbp

Bernadette Hyland Ghislain Auguste Atemezing Boris Villazoacuten-Terrazas W3C Best Practices

for Publishing Linked Data 9 de enero de 2014 W3C Note URL httpswwww3orgTRld-bp

Dan Brickley Libby Miller FOAF project FOAF Vocabulary Specification 099 (Paddington

Edition) 14 de enero de 2014 URL httpxmlnscomfoafspec

Dublin Core metadata initiative DCMI Metadata Terms 14 de junio de 2012 DCMI

Recommendation URL httpdublincoreorgdocumentsdcmi-terms

Fadi Maali John Erickson W3C Data Catalog Vocabulary (DCAT) 16 de enero de 2014 W3C

Recommendation URL httpswwww3orgTRvocab-dcat

ISO 19115-12014 (E) Geographic information ndash Metadata Part1 Fundamentals 01 de abril de

2014 International Standard

ISO 191262009 (E) Geographic information -- Feature concept dictionaries and registers

noviembre de 2009 International Standard

ISO 191572013 (E) Geographic information ndash Data quality 15 de diciembre de 2013

International Standard

Jeremy Tandy Payam Barnaghi Linda van den Brink W3C Spatial Data on the Web Best

Practices 5 de enero 2017 W3C Note URL httpswwww3orgTRsdw-bp

T Berners-Lee R Fielding L Masinter IETF Uniform Resource Identifier (URI) Generic Syntax

Enero de 2005 Internet Standard URL httpstoolsietforghtmlrfc3986

World Wide Web Foundation Open Data Barometer URL httpopendatabarometerorg

W3C OWL Working Group W3C OWL 2 Web Ontology Language Document Overview (Second

Edition) 11 de diciembre de 2012 W3C Recommendation URL httpswwww3orgTRowl2-

overview

W3org Semantic Web - W3C URL httpswwww3orgstandardssemanticweb Consultado

el 12 de septiembre de 2018

Page 12: PARA LA PUBLICACIÓN DE DATOSideca.gov.co/.../files/documentacion/buenaspracticaspublicaciondat… · La obtención de datos la realiza cada entidad en el desarrollo de sus actividades

12 Buenas praacutecticas para la publicacioacuten de datos

3 Utilizar vocabularios estandarizados y reutilizables en la estructuracioacuten y publicacioacuten de los datos

Un vocabulario define los conceptos y las relaciones que se utilizan para describir y representar

un aacuterea de intereacutes6 Cuando se publican datos en la Web los vocabularios permiten integrar

datos cuando existen ambiguumledades en los teacuterminos utilizados en los diferentes conjuntos de

datos En la praacutectica un vocabulario es un conjunto de palabras que permiten a dos usuarios

comunicarse entre siacute La efectividad de dicha comunicacioacuten radica en que el significado de una

palabra para el usuario emisor sea el mismo que para el usuario receptor independientemente

de si utilizaron el mismo teacutermino

Cuando se habla de interoperabilidad de datos lo que se espera es que tanto los usuarios

como las aplicaciones informaacuteticas entiendan y comprendan la mayor cantidad de informacioacuten

que estaacuten consumiendo Para conseguir esto las comunidades de datos han identificado

vocablos palabras o teacuterminos de uso comuacuten los cuales cuentan con significados apropiados y

que actualmente se encuentran integrados y estructurados en diferentes estaacutendares

internacionales

Se recomienda utilizar vocabularios de este tipo para estandarizar los datos contenidos en la

informacioacuten publicada

iquestQueacute logro

Que mis datos sean consultados utilizados y reutilizados por maacutes usuarios Que se reduzca la ambiguumledad en la interpretacioacuten de mis datos Que mis datos sean interoperables Que mis datos sean procesados en entornos nacionales e internacionales Que mis datos puedan ser compartidos e intercambiados entre sistemas Que mis datos sean maacutes confiables

iexclRecomendaciones

Consulte normas locales o vocabularios internacionales para la estructuracioacuten7 de sus

datos

Apropie los vocabularios consultados y adapte sus datos a estos en los casos en que sea

posible

Incluya vocabularios ya definidos y reconocidos internacionalmente cuando vaya a

producir nuevos datos

6 httpswwww3orgstandardssemanticwebontology 7 Estructurar significa ajustar los datos a un esquema fijo

13 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo 1

A continuacioacuten se presentan algunos vocabularios internacionales que puede consultar y

apropiar para optimizar el intercambio de sus datos

Data Catalog Vocabulary (DCAT) httpswwww3orgTRvocab-dcatclass-catalog

FOAF Vocabulary Specification httpxmlnscomfoaf01

ISOTC 211 Geographic informationGeomatics Terminology

httpwwwisotc211orgTerminologyhtm

The RDF Data Cube Vocabulary httpswwww3orgTR2014REC-vocab-data-cube-20140116

ODRL Vocabulary amp Expression 22

httpswwww3orgTR2018REC-odrl-vocab-20180215

HTTP Vocabulary in RDF 10 httpswwww3orgTR2017NOTE-HTTP-in-RDF10-20170202

vCard Ontology - for describing People and Organizations

httpswwww3orgTRvcard-rdf

Ejemplo 2

En el contexto Nacional el Ministerio de Tecnologiacuteas de la Informacioacuten y las Comunicaciones ha

establecido el Lenguaje Comuacuten de Intercambio de como un instrumento de consulta que

contiene la definicioacuten de los elementos de datos conceptualizados por las entidades del

estado La consulta la puede realizar en httplenguajeminticgovco

14 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo 3

La especificacioacuten vCard disponible en httpswwww3orgTRvcard-rdf promueve un

vocabulario especiacutefico para describir personas y organizaciones

Uno de los vocablos que describe esta especificacioacuten es la ldquodireccioacuten de entregardquo llamado

dentro del vocabulario como ADR y definido como ldquola direccioacuten del objeto representado en

partes estructuradasrdquo

Ahora bien este vocabulario especifica los componentes de la direccioacuten de entrega para el

objeto asiacute el nombre del paiacutes la localidad el coacutedigo postal la regioacuten y la direccioacuten dada por

viacuteas (calles y carreras en el caso colombiano) Esto quiere decir que cualquiera de los

componentes descritos puede usarse como direccioacuten de entrega vaacutelida ya que son equivalentes

entre siacute

Aunque en el vocabulario la direccioacuten de entrega se llame ADR el usuario de la informacioacuten

entenderaacute que un nombre de paiacutes o un coacutedigo postal pueden interpretarse como ADR

15 Buenas praacutecticas para la publicacioacuten de datos

4 Anonimizar los datos de caraacutecter personal informacioacuten estadiacutestica informacioacuten indirectamente identificable e informacioacuten sensible o confidencial

Anonimizar es el proceso que impide la identificacioacuten de las unidades de estudio que son fuente

para los registros individuales de un conjunto8 de datos o maacutes claro es la aplicacioacuten de teacutecnicas

que permitan expresar un dato relativo a personas eliminando la referencia a su identidad9

Baacutesicamente lo que se busca es reducir los riesgos en el uso y procesamiento de datos

personales evitar la extraccioacuten de registros que identifican a una persona reducir la

combinacioacuten de dos o maacutes registros en una o varias bases de datos para identificar a una

persona y minimizar la deduccioacuten de datos personales partir de uno o varios datos publicados

iquestQueacute informacioacuten debo prioritariamente anonimizar

Datos personales Informacioacuten numeacuterica alfabeacutetica graacutefica fotograacutefica acuacutestica o

cualquier otro tipo susceptible de recogida registro tratamiento y transmisioacuten

concerniente a personas fiacutesicas identificadas o identificables (tales como nombre

apellidos estado civil sexo edad domicilio identificacioacuten personal nuacutemero de

teleacutefono etc)10

Informacioacuten sensible Informacioacuten considerada como estrictamente confidencial

Informacioacuten y caracteriacutesticas referentes a la edad procedencia salud raza religioacuten

ideologiacutea afiliacioacuten finanzas etc se consideran de caraacutecter sensible y requieren de

una proteccioacuten especial11

iquestQueacute logro

Garantizar que mis datos publicados cuentan con medidas de proteccioacuten de datos

personales

Eliminar de manera efectiva el riesgo de re-identificacioacuten

Evitar que el procesamiento de mis datos tenga consecuencias negativas para alguna

persona

Disponer muchos maacutes datos sin invadir la informacioacuten personal

iexclRecomendaciones

Implemente actividades de proteccioacuten de la privacidad de los datos personales antes

de publicarlos

Elimine cualquier identificador directo de la persona (nombre documento de

identidad etc)

8 httpswwwdanegovcofilessenlineamientosDSO_020_LIN_08pdf 9 httpdleraeesid=2jjMiRi 10 httpswwwdanegovcofilessenlineamientosDSO_020_LIN_08pdf 11 Ibidem

16 Buenas praacutecticas para la publicacioacuten de datos

Reemplace los identificadores directos por coacutedigos de referencia pseudoacutenimos

(algoritmos AES12 o un hash cifrado HMAC13) coacutedigos arbitrarios o aleatorios

Si reemplazando el identificador directo auacuten es faacutecil identificar a la persona elimine el

dato

Clasifique yo categorice los datos

Redondee los datos numeacutericos hacia arriba o hacia abajo

Evaluacutee antes durante y despueacutes de publicados los datos si la anonimizacioacuten de sus

datos es suficiente y evaluacutee regularmente los riesgos existentes

Para maacutes informacioacuten consulte los Lineamientos para la Anonimizacioacuten de micro datos

Ejemplo 1

Antes de publicar sus datos retire el identificador directo de la persona En este caso

reemplace en nuacutemero de documento que identifica al usuario y reemplaacutecelo por un

consecutivo

Usuario Beneficio Usuario Beneficio

80123456 Subsidio de vivienda Usuario 1 Subsidio de vivienda

51123456 Subsidio de alimentacioacuten Usuario 2 Subsidio de alimentacioacuten

19123456 Subsidio al adulto mayor Usuario 3 Subsidio al adulto mayor

53123456 Subsidio de desempleo Usuario 4 Subsidio de desempleo

Ejemplo 2

Clasifique o categorice sus datos En este ejemplo asigne rangos a la edad de manera tal que el

titular del registro no sea identificable por este dato

Usuario Edad Usuario Rango de edad

Usuario 1 11 antildeos Usuario 1 Entre 10 y 15 antildeos

Usuario 2 22 antildeos Usuario 2 Entre 20 y 25 antildeos

Usuario 3 36 antildeos Usuario 3 Entre 35 y 40 antildeos

Usuario 4 63 antildeos Usuario 4 Entre 60 y 65 antildeos

12 Advanced Encryption Standard puede consultar como ha sido implementado este algoritmo en httpsrevistasudistritaleducoojsindexphpTecnuraarticleview72368892 13 Hash-based Message Authentication Code puede consultar como se crea este cifrado en httpsdocsoraclecomcdE19253-01819-7804wanboottasks2-51indexhtml

17 Buenas praacutecticas para la publicacioacuten de datos

5 Publicar los datos en formatos estaacutendar reutilizables y legibles por aplicaciones informaacuteticas

Un formato puede ser definido como la estructura de un disco dividido en campos y pistas

seguacuten un determinado sistema operativo lo que permite almacenar en eacutel informacioacuten14

baacutesicamente es la forma en que se codifican los datos en un archivo informaacutetico

Actualmente conocemos formatos comunes de almacenamiento como el doc una extensioacuten

de Word que almacena texto y cuyo propietario es la compantildeiacutea Microsoft Pero iquestqueacute pasa si un

usuario quiere abrir un documento doc en un procesador de texto diferente a Word

difiacutecilmente va a poder conocer el contenido de dicho documento sin tener esta licencia

Lo que queremos lograr con la implementacioacuten de esta praacutectica es que todos los usuarios que

encuentren mis datos puedan accederlos sin necesidad de contar con un software o aplicacioacuten

informaacutetica especiacutefica

iquestQueacute logro

Que mis datos sean consultados utilizados y reutilizados por maacutes usuarios

Que mis datos sean maacutes interoperables y maacutes procesados

Que mis datos puedan ser extraiacutedos transformados y procesados por aplicaciones

informaacuteticas

Que mis datos puedan ser compartidos e intercambiados entre sistemas

Disminuir los costos y los tiempos en el uso y la transformacioacuten de mis datos

iexclRecomendaciones

Prefiera publicar su conjunto de datos en formatos abiertos o no propietario ya que

estos facilitan el uso re-uso y distribucioacuten de estos Se busca que un mayor nuacutemero de

aplicaciones informaacuteticas pueda extraer leer y transformar los datos generando mayor

uso y re-uso por los usuarios

Disponga sus datos en muacuteltiples formatos con el fin de incrementar el acceso a los

mismos Se busca que el mayor nuacutemero de usuarios pueda utilizar los datos sin tener

que transformarlos primero en su formato preferido

Utilice Web Services para mejorar el intercambio e interoperabilidad de los datos

publicados

14 httpdleraeessrvsearchm=30ampw=formato

18 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo 1

A continuacioacuten encontraraacute extensiones de formato propietario y no propietario prefiera para

la publicacioacuten de sus datos las extensiones de la derecha

FORMATO PROPIETARIO FORMATO NO PROPIETARIO

DOC GDB TXT ASCII Grid KML RDF

XLS DWG CSV GeoJSON DXF XML

PPT SHP JSON GML ODF

Ejemplo 2

Si no fue posible utilizar una extensioacuten de formato no propietario publique sus datos en una

variedad de formatos que le permita al usuario acceder a los datos desde diferentes

aplicaciones informaacuteticas

Ejemplo 3

Para publicar sus datos conozca diferentes tipos de Web Services que viajan en la red utilizando extensiones XML

SOAP httpswwww3orgTRsoap

REST httprestelksteinorg

WMS httpwwwopengeospatialorgstandardswms

WFS httpwwwopengeospatialorgstandardswfs

WCS httpwwwopengeospatialorgstandardswcs

19 Buenas praacutecticas para la publicacioacuten de datos

6 Proporcionar un diccionario de datos que facilite el uso e interpretacioacuten de los datos publicados

Un diccionario estaacute definido como un repertorio en forma de libro o en soporte electroacutenico en el

que se recogen seguacuten un orden determinado las palabras o expresiones de una o maacutes lenguas

o de una materia concreta acompantildeadas de su definicioacuten equivalencia o explicacioacuten15

especiacuteficamente en un diccionario de datos se encuentran los conceptos de los datos y sus

propiedades (atributos dominios asociaciones y operaciones) acompantildeados de una definicioacuten

en donde se identifica el propoacutesito alcance y campo de aplicacioacuten del dato publicado

Lograr que los usuarios de mis datos entiendan la informacioacuten que estaacute publicada le permitiraacute

decidir si satisfacen o no su necesidad y le facilitaraacute la decisioacuten para explotar lo datos

Para maacutes informacioacuten consulte el Instructivo Diccionario de Datos

iquestQueacute logro

Que mis datos sean consultados utilizados y reutilizados por maacutes usuarios

Que se eviten ambiguumledades en la interpretacioacuten de mis datos

Que mis datos publicados esteacuten unificados y consistentes

Que los usuarios comprendan mejor y dispongan de claridad sobre los conceptos de

mis datos

iexclRecomendaciones

Publique como miacutenimo un diccionario de datos que contenga la caracterizacioacuten del

conjunto de datos producidos por su entidad

Cree el diccionario de datos teniendo en cuenta como miacutenimo la siguiente informacioacuten

Nombre del atributo Nombre que identifica de manera clara un atributo

Definicioacuten Descripcioacuten del atributo

Tipo de dato Tipo de valor del atributo

Unidad de medida Expresa la unidad de medida del atributo

Dominio Determina si el atributo tiene asociado un dominio

15 httpdleraeesw=diccionario

20 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo

Para el conjunto de datos ldquoEstablecimientos Educativos en Bogotaacuterdquo publicariacuteamos un

diccionario de datos similar al siguiente

Nombre del atributo Definicioacuten Tipo de dato

Unidad de Medida

Dominio

Coacutedigo del establecimiento

Coacutedigo DANE asignado al Institucioacuten Educativa Decimal

Nombre del establecimiento

Nombre de la Institucioacuten Educativa Cadena de Caracteres

Aacuterea construida del establecimiento

Aacuterea construida de la Institucioacuten Educativa Decimal Metros

cuadrados

Sector

Clasificacioacuten asignada seguacuten la naturaleza juriacutedica la cual define las principales caracteriacutesticas que desde lo juriacutedico - administrativo y tiene que ver con el origen de su creacioacuten

Entero

EESector

No podriacuteamos olvidar detallar el dominio asociado

Atributo Nombre del Dominio Coacutedigo Definicioacuten

EESector

Oficial 1

Es una institucioacuten donde su naturaleza de servicio puacuteblico cultural y su funcioacuten social le es inherente cumpliendo con las disposiciones legales y estatutarias que las rigen donde sus rentas se conservan y se aplican debidamente

Privado 2

Es una institucioacuten constituida como persona juriacutedica de utilidad comuacuten donde sus rentas se conservan y se aplican debidamente y que en todo lo esencial se cumple con la voluntad de sus fundadores

21 Buenas praacutecticas para la publicacioacuten de datos

7 Acompantildear la publicacioacuten de los datos con enlaces a otros recursos

Un enlace es definido como una secuencia de caracteres que se utiliza como direccioacuten para

acceder a informacioacuten adicional16 maacutes sencillo puede definirse como una expresioacuten que

conecta una cierta informacioacuten con otra17Ahora bien un recurso se puede entender como

cualquier medio que satisfaga una necesidad por ejemplo datos servicios documentos o

software

En teacuterminos generales se sugiere que para facilitar al usuario la comprensioacuten de los datos

publicados se proporcionen recursos o documentos adicionales que puedan ser consultados

yo descargados traveacutes de enlaces o links de otro sitio Web

Dentro de los recursos adicionales que pueden publicarse para acompantildear el dato estaacuten los

procedimientos de captura del dato los cataacutelogos de objetos las especificaciones teacutecnicas los

documentos normativos los cataacutelogos de simbologiacutea los reportes de evaluacioacuten de calidad

entre otros

iquestQueacute logro

Mejorar la consulta utilizacioacuten y reutilizacioacuten de mis datos

Que los usuarios comprendan mejor mis datos

Que mis datos sean compartidos e intercambiados por un mayor nuacutemero de usuarios

iexclRecomendaciones

Disponga informacioacuten adicional de sus datos que le permita a los usuarios ampliar el

horizonte de las aplicaciones y funcionalidades en las que pueda utilizar y explotar del

dato

No olvide vincular o registrar esta informacioacuten en el metadato

16 httpdleraeesid=FTVRKyj 17 httpssistemascomenlacephp

22 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo 1

El ldquoMapa de Referencia para Bogotaacuterdquo publicado en httpswwwidecagovcoesserviciosmapa-de-referencia tiene publicados varios enlaces a otros recursos

Especificacioacuten teacutecnica para la elaboracioacuten del Mapa de Referencia para Bogotaacute DC V0318

Cataacutelogo de Objetos del Mapa de Referencia de Bogotaacute DC V 57

Cataacutelogo de Representacioacuten del Mapa de Referencia de Bogotaacute DC V30

Reporte de evaluacioacuten de calidad generado al Mapa de Referencia del Distrito Capital V1217

Ejemplo 2

La informacioacuten de los ldquohumedales de Bogotaacuterdquo publicada en

httpambientebogotagovcowebsdahumedales tiene publicados enlaces a otros recursos

o Gestioacuten de los humedales

o Poliacutetica de Humedales del Distrito Capital

o Normatividad

o Planes de Manejo Ambiental

o Comiteacute distrital de humedales documentos de consulta normatividad

23 Buenas praacutecticas para la publicacioacuten de datos

8 Depurar sus datos antes de publicarlos para garantizar su calidad y aumentar su confianza

La calidad estaacute definida como el conjunto de propiedades inherentes a algo que permiten

juzgar su valor18 para el caso que nos concierne este algo hace referencia al dato publicado

Ahora bien la calidad tambieacuten es entendida como la capacidad del dato publicado para

satisfacer los requerimientos y las necesidades de los usuarios respetando una serie de normas

y especificaciones establecidas

Actualmente existen muacuteltiples elementos de calidad de los datos que identifican las cualidades

de estos sin embargo en este aparte citaremos los elementos principales que usted o su

entidad deben tener en cuenta para publicar sus datos con un estaacutendar miacutenimo de calidad

Para maacutes informacioacuten consulte el Procedimiento para evaluar y reportar la calidad de

los datos espaciales

iquestQueacute logro

Que mis datos sean consultados utilizados y reutilizados por maacutes usuarios

Que los usuarios hablen bien de mis datos

Que mis datos sean maacutes interoperables y maacutes procesados

Que mis datos sean maacutes compartidos

Que mis datos sean maacutes confiables

Recomendacioacuten 1

Establezca si dentro de su conjunto de datos existen capos vaciacuteos o nulos con informacioacuten

descontextualizada sobrante o duplicada Si existen compleacutetelos o elimiacutenelos seguacuten

corresponda antes de la publicacioacuten El elemento de calidad asociado se denomina ldquototalidadrdquo

Localidad Atendidos Localidad Atendidos

Suba 200 Suba 200

Suba 200 Tunjuelito 500

Ameacutericas 100

850

Tunjuelito 500

18 httpdleraeesid=6nVpk8P|6nXVL1Z

Campo duplicado

Campo inconsistente

Campo vaciacuteo

24 Buenas praacutecticas para la publicacioacuten de datos

Recomendacioacuten 2

Identifique y transforme si es necesario los datos que hayan sido registrados en un formato

diferente al establecido para su conjunto de datos Es decir estandarice el formato de salida

del dato que va a publicar El elemento de calidad asociado se denomina ldquoconsistencia de

formatordquo

Localidad Atendidos Localidad Atendidos

Suba 200 Suba 200

Tunjuelito 5008 Tunjuelito 500

Fontiboacuten 40 Fontiboacuten 430

Tunjuelito 500 Tunjuelito 500

Recomendacioacuten 3

Si sus datos tienen alguacuten tipo de clasificacioacuten o rangos previo a la publicacioacuten valide que estos

se hayan registrado correctamente El elemento de calidad asociado se denomina ldquoexactitud de

clasificacioacutenrdquo

Geacutenero Edad Rango de Edad Geacutenero Edad Rango de Edad

Femenino 5 0 lt Edad le 10 Femenino 5 0 lt Edad le 10

Masculino 15 0 lt Edad le 10 Masculino 15 10 lt Edad le 20

Femenino 35 40 lt Edad le 50 Femenino 35 30 lt Edad le 40

Recomendacioacuten 4

Si sus datos representan atributos cuantitativos verifique antes de la publicacioacuten que estos

correspondan a valores conocidos como verdaderos El elemento de calidad asociado se

denomina ldquoexactitud de atributos cuantitativosrdquo

Localidad Mes Temperatura Localidad Mes Temperatura

Chapinero Enero 7degC Chapinero Enero 7degC

Suba Agosto -15degC Suba Agosto 15degC

Tunjuelito Abril 60degC Tunjuelito Abril 16degC

Clasificacioacuten inconsistente

Formato inconsistente

Valor inconsistente

25 Buenas praacutecticas para la publicacioacuten de datos

Recomendacioacuten 5

Si los datos a publicar tienen asociadas fechas de captura o recoleccioacuten de informacioacuten (Por

ejemplo registro de incidentes registro de vacunacioacuten conteo de vehiacuteculos etc) valide que

las fechas registradas coincidan con la fecha del evento capturado El elemento de calidad

asociado se denomina ldquoexactitud de la medicioacuten del tiempordquo

Precipitacioacuten (mm) Fecha de registro Precipitacioacuten (mm) Fecha de registro

00 20580101 00 20180101

01 20180102 01 20180102

126 20510403 126 20180103

20 20180104 20 20180104

Recomendacioacuten 6

Cuando sus datos reflejen informacioacuten determinada por un orden de eventos garantice antes

de la publicacioacuten que este orden sea el adecuado El elemento de calidad asociado se

denomina ldquoconsistencia temporalrdquo

Usuario Escolaridad Periodo de Estudio Usuario Escolaridad Periodo de Estudio

Usuario 1 Preescolar 20030101 ndash 20051231 Usuario 1 Preescolar 20030101 ndash 20051231

Usuario 1 Primaria 20030101 ndash 20101231 Usuario 1 Primaria 20060101 ndash 20101231

Usuario 1 Secundaria 20060101 ndash 20163112 Usuario 1 Secundaria 20110101 ndash 20143112

Usuario 1 Media 20150101 - 20163112 Usuario 1 Media 20150101 - 20163112

Recomendacioacuten 7

Si sus datos incluyen alguna ubicacioacuten (direccioacuten lugar coordenadas) verifique que esta

corresponda a la ubicacioacuten real El elemento de calidad asociado se denomina ldquoexactitud

posicionalrdquo

Eventos Deportivos Lugar Eventos Deportivos Lugar

Evento 1 AK 30 25 90 Evento 1 AK 30 25 90

Evento 2 AC 63 215 20 Evento 2 Parque La Florida

Evento 3 Parque Simoacuten Boliacutevar Evento 3 Parque Simoacuten Boliacutevar

Fecha

inconsistente

Fechas no secuenciales

Lugar inexistente

26 Buenas praacutecticas para la publicacioacuten de datos

9 Incorporar el componente geograacutefico en los datos publicados para optimizar su comprensioacuten uso re-uso y visualizacioacuten

El espacio geograacutefico es un punto de la superficie terrestre que se vea afectado o que afecte de

alguna manera a la humanidad19 Este punto de la superficie puede ser la direccioacuten de una

institucioacuten educativa la ubicacioacuten de un centro de vacunacioacuten el lugar donde se miden las

variaciones de traacutensito en la ciudad los parques de Bogotaacute el edificio en donde se llevan a

cabo los traacutemites de una entidad etc

Los datos que usted captura o recolecta en su quehacer misional siempre estaacuten asociados a un

espacio geograacutefico por lo tanto este componente deberiacutea ser incluido en los datos publicados

Tenga en cuenta que el componente geograacutefico lo puede incorporar incluyendo una ubicacioacuten

asociada a una direccioacuten a un lugar a una localidad a un barrio al nombre de un

establecimiento puacuteblicamente reconocido o a cualquier punto que permita al usuario

identificar la localizacioacuten del dato publicado

iquestQueacute logro

Ampliar el espectro de usuarios que consultan utilizan y reutilizan mis datos

Que mis datos sean maacutes interoperables y maacutes procesados

Que mis datos sean puedan compartir en maacutes plataformas

Que los usuarios puedan visualizar mis datos en un mapa

iexclRecomendaciones

Disponga sus datos agregando un atributo de ubicacioacuten como direcciones coordenadas o

lugares geograacuteficos

Ejemplo 1

Incluya direcciones que permitan localizar espacialmente sus datos

Programa Direccioacuten

Registro de atencioacuten a la ciudadaniacutea CL 138 108 16

Centro de autocuidado KR 18 D 77 A 11 SUR

Familias con un nintildeo en cupos cofinanciados CL 70 A SUR 20 46

Centro de autocuidado KR 18 D 73 A 33 SUR

19 httpenciclopediabanrepculturalorgindexphptitle=Espacio_geogrC3A1fico

27 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo 2

Utilice coordenadas para indicar la ubicacioacuten de sus datos

EPS Coordenada X Coordenada Y

EPS Convida 9087496334 1051342164

Capital Salud EPS 986321006 954875808

EPS Famisanar 9742508812 8837031501

Aliansalud EPS 9716943356 9659706891

Salud Total EPS 9215624975 9625189518

Tenga en cuenta que para publicar datos con coordenadas tendraacute que incluir dentro

de su metadato el Sistema de referencia empleado

MAGNA ndash SIRGAS EPSG 4686 httpsepsgio4686

MAGNA ndash SIRGAS EPSG 3116 httpsepsgio3116

MAGNA ndash BOGOTAacute SR-ORG 7458 httpspatialreferenceorgrefsr-org7458

Ejemplo 3

Tambieacuten puede incluir lugares geograacuteficos descriptivos asiacute

Usuario Vacunado Lugar de Vacunacioacuten

Usuario 1 BOSQUE IZQUIERDO

Usuario 2 LAGUNITAS URBANO

Usuario 3 LA CAPUCHINA

Usuario 4 SAN JOSE SUR

Usuario 5 VENECIA

28 Buenas praacutecticas para la publicacioacuten de datos

10 Asignar un identificador uacutenico que permita aumentar la consulta uso e interoperabilidad del dato publicado

Considere un identificador uacutenico como un texto que permite identificar inequiacutevocamente el

dato publicado Si usted va a publicar un dato buscando que este sea reutilizado por los

usuarios y por su propia entidad asignar un identificador facilitaraacute el descubrimiento y la

citacioacuten del dato a traveacutes del tiempo independientemente del estado la disponibilidad o el

formato de este

En la vida cotidiana mediante la ceacutedula de ciudadaniacutea se asigna a cada ciudadano un nuacutemero

de identificacioacuten uacutenico y a traveacutes de este identificador el ciudadano es reconocido a lo largo de

su vida e incluso despueacutes de su muerte por otras personas yo autoridades En el mundo de la

informacioacuten cada dato deberiacutea viajar con un identificador uacutenico que le permita ser encontrado

y reconocido faacutecilmente entre los demaacutes datos

Ahora bien si usted o su entidad publican continuamente datos establecer un sistema de

identificacioacuten comuacuten le permitiraacute identificar raacutepidamente los datos y los haraacute comparables por

cualquier usuario de manera confiable Esta condicioacuten es previa para lograr una correcta

gestioacuten y reutilizacioacuten de sus datos

iquestQueacute logro

Ampliar el espectro de usuarios que consultan utilizan y reutilizan mis datos

Que mis datos sean maacutes interoperables y maacutes procesados

Que mis datos sean compartidos en maacutes plataformas

Que mis datos puedan vincularse a otros datos en el entorno Web

Que mis datos sean encontrados usados y citados inequiacutevocamente

Garantizar y monitorear la reutilizacioacuten de mis datos

Reducir del uso erroacuteneo de mis datos

iexclRecomendaciones

Establezca un sistema de identificacioacuten comuacuten para los datos que va a publicar

Utilice siempre el identificador asignado para publicar sus datos

29 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo

IDECA ha dispuesto el Sistema de Registro de Iacutetems geograacuteficos

httpgeoitemsidecagovcogeoitemsano una herramienta web desarrollada para la

creacioacuten aprobacioacuten publicacioacuten y mantenimiento de iacutetems geograacuteficos que permite la

asignacioacuten concertada de identificadores y significados uacutenicos que contribuyen a la definicioacuten

de un lenguaje comuacuten para el desarrollo de nuevos sistema de informacioacuten en el Distrito

garantizando con ello su fiabilidad e interoperabilidad Adicionalmente permite almacenar

descripciones de la informacioacuten oficial producida e identificar su respectivo custodio jugando

asiacute un papel importante en el control y seguimiento de la produccioacuten de informacioacuten

geograacutefica

Este sistema asigna un identificador uacutenico a cada uno de los iacutetems creados Dentro de los iacutetems

publicados se reconoce el ID 65 como unidad de planeamiento y siempre que se hace

referencia a este objeto es suficiente nombrarlo asiacute para entender que se habla de ldquoUnidades

territoriales de anaacutelisis planeamiento y gestioacuten que tienen como propoacutesito definir y precisar el

planeamiento del suelo urbano de expansioacuten y ruralrdquo

30 Buenas praacutecticas para la publicacioacuten de datos

OBTENGA EL MAacuteS ALTO NIVEL EN PUBLICACIOacuteN DE DATOS

Hasta aquiacute hemos publicado las que consideramos como mejores praacutecticas de publicacioacuten de datos Ahora usted como publicador o como entidad debe evaluar si sus datos se estaacuten disponiendo con los maacutes altos y mejores estaacutendares de publicacioacuten

Lo invitamos a que valide en queacute nivel de publicacioacuten se encuentra su entidad teniendo en cuenta el siguiente listado

Nivel Baacutesico

En este nivel se encuentran aquellas entidades que publican sus datos en formatos estaacutendar y reutilizables (praacutectica 5) que integran a la publicacioacuten sus respectivos metadatos (praacutectica 1) y que acompantildean la publicacioacuten con una licencia asociada (praacutectica 2)

Nivel Intermedio

Este nivel lo alcanzan las entidades que superando el nivel baacutesico disponen un mayor volumen de informacioacuten gracias a que anonimizan sus datos (praacutectica 4) implementan medidas de calidad que aumentan la confianza en sus datos (praacutectica 8) incorporan el componente geograacutefico proporcionando valor agregado a sus datos (praacutectica 9) y publican un diccionario de datos que facilita la interpretacioacuten de los datos publicados (praacutectica 6)

Nivel Avanzado

Las entidades que superando el nivel intermedio utilizan vocabularios estandarizados en sus nuevas publicaciones (praacutectica 3) acompantildean la publicacioacuten de sus datos con enlaces a otros recursos (praacutectica 7) y asignan un identificador uacutenico para dato logrando asiacute aumentar su descubrimiento y reutilizacioacuten (praacutectica 10)

31 Buenas praacutecticas para la publicacioacuten de datos

REFERENCIAS

Bernadette Farias Loacutescio Caroline Burle Newton Calegari W3C Data on the Web Best

Practices 31 de enero de 2017 W3C Recommendation URL httpswwww3orgTRdwbp

Bernadette Hyland Ghislain Auguste Atemezing Boris Villazoacuten-Terrazas W3C Best Practices

for Publishing Linked Data 9 de enero de 2014 W3C Note URL httpswwww3orgTRld-bp

Dan Brickley Libby Miller FOAF project FOAF Vocabulary Specification 099 (Paddington

Edition) 14 de enero de 2014 URL httpxmlnscomfoafspec

Dublin Core metadata initiative DCMI Metadata Terms 14 de junio de 2012 DCMI

Recommendation URL httpdublincoreorgdocumentsdcmi-terms

Fadi Maali John Erickson W3C Data Catalog Vocabulary (DCAT) 16 de enero de 2014 W3C

Recommendation URL httpswwww3orgTRvocab-dcat

ISO 19115-12014 (E) Geographic information ndash Metadata Part1 Fundamentals 01 de abril de

2014 International Standard

ISO 191262009 (E) Geographic information -- Feature concept dictionaries and registers

noviembre de 2009 International Standard

ISO 191572013 (E) Geographic information ndash Data quality 15 de diciembre de 2013

International Standard

Jeremy Tandy Payam Barnaghi Linda van den Brink W3C Spatial Data on the Web Best

Practices 5 de enero 2017 W3C Note URL httpswwww3orgTRsdw-bp

T Berners-Lee R Fielding L Masinter IETF Uniform Resource Identifier (URI) Generic Syntax

Enero de 2005 Internet Standard URL httpstoolsietforghtmlrfc3986

World Wide Web Foundation Open Data Barometer URL httpopendatabarometerorg

W3C OWL Working Group W3C OWL 2 Web Ontology Language Document Overview (Second

Edition) 11 de diciembre de 2012 W3C Recommendation URL httpswwww3orgTRowl2-

overview

W3org Semantic Web - W3C URL httpswwww3orgstandardssemanticweb Consultado

el 12 de septiembre de 2018

Page 13: PARA LA PUBLICACIÓN DE DATOSideca.gov.co/.../files/documentacion/buenaspracticaspublicaciondat… · La obtención de datos la realiza cada entidad en el desarrollo de sus actividades

13 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo 1

A continuacioacuten se presentan algunos vocabularios internacionales que puede consultar y

apropiar para optimizar el intercambio de sus datos

Data Catalog Vocabulary (DCAT) httpswwww3orgTRvocab-dcatclass-catalog

FOAF Vocabulary Specification httpxmlnscomfoaf01

ISOTC 211 Geographic informationGeomatics Terminology

httpwwwisotc211orgTerminologyhtm

The RDF Data Cube Vocabulary httpswwww3orgTR2014REC-vocab-data-cube-20140116

ODRL Vocabulary amp Expression 22

httpswwww3orgTR2018REC-odrl-vocab-20180215

HTTP Vocabulary in RDF 10 httpswwww3orgTR2017NOTE-HTTP-in-RDF10-20170202

vCard Ontology - for describing People and Organizations

httpswwww3orgTRvcard-rdf

Ejemplo 2

En el contexto Nacional el Ministerio de Tecnologiacuteas de la Informacioacuten y las Comunicaciones ha

establecido el Lenguaje Comuacuten de Intercambio de como un instrumento de consulta que

contiene la definicioacuten de los elementos de datos conceptualizados por las entidades del

estado La consulta la puede realizar en httplenguajeminticgovco

14 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo 3

La especificacioacuten vCard disponible en httpswwww3orgTRvcard-rdf promueve un

vocabulario especiacutefico para describir personas y organizaciones

Uno de los vocablos que describe esta especificacioacuten es la ldquodireccioacuten de entregardquo llamado

dentro del vocabulario como ADR y definido como ldquola direccioacuten del objeto representado en

partes estructuradasrdquo

Ahora bien este vocabulario especifica los componentes de la direccioacuten de entrega para el

objeto asiacute el nombre del paiacutes la localidad el coacutedigo postal la regioacuten y la direccioacuten dada por

viacuteas (calles y carreras en el caso colombiano) Esto quiere decir que cualquiera de los

componentes descritos puede usarse como direccioacuten de entrega vaacutelida ya que son equivalentes

entre siacute

Aunque en el vocabulario la direccioacuten de entrega se llame ADR el usuario de la informacioacuten

entenderaacute que un nombre de paiacutes o un coacutedigo postal pueden interpretarse como ADR

15 Buenas praacutecticas para la publicacioacuten de datos

4 Anonimizar los datos de caraacutecter personal informacioacuten estadiacutestica informacioacuten indirectamente identificable e informacioacuten sensible o confidencial

Anonimizar es el proceso que impide la identificacioacuten de las unidades de estudio que son fuente

para los registros individuales de un conjunto8 de datos o maacutes claro es la aplicacioacuten de teacutecnicas

que permitan expresar un dato relativo a personas eliminando la referencia a su identidad9

Baacutesicamente lo que se busca es reducir los riesgos en el uso y procesamiento de datos

personales evitar la extraccioacuten de registros que identifican a una persona reducir la

combinacioacuten de dos o maacutes registros en una o varias bases de datos para identificar a una

persona y minimizar la deduccioacuten de datos personales partir de uno o varios datos publicados

iquestQueacute informacioacuten debo prioritariamente anonimizar

Datos personales Informacioacuten numeacuterica alfabeacutetica graacutefica fotograacutefica acuacutestica o

cualquier otro tipo susceptible de recogida registro tratamiento y transmisioacuten

concerniente a personas fiacutesicas identificadas o identificables (tales como nombre

apellidos estado civil sexo edad domicilio identificacioacuten personal nuacutemero de

teleacutefono etc)10

Informacioacuten sensible Informacioacuten considerada como estrictamente confidencial

Informacioacuten y caracteriacutesticas referentes a la edad procedencia salud raza religioacuten

ideologiacutea afiliacioacuten finanzas etc se consideran de caraacutecter sensible y requieren de

una proteccioacuten especial11

iquestQueacute logro

Garantizar que mis datos publicados cuentan con medidas de proteccioacuten de datos

personales

Eliminar de manera efectiva el riesgo de re-identificacioacuten

Evitar que el procesamiento de mis datos tenga consecuencias negativas para alguna

persona

Disponer muchos maacutes datos sin invadir la informacioacuten personal

iexclRecomendaciones

Implemente actividades de proteccioacuten de la privacidad de los datos personales antes

de publicarlos

Elimine cualquier identificador directo de la persona (nombre documento de

identidad etc)

8 httpswwwdanegovcofilessenlineamientosDSO_020_LIN_08pdf 9 httpdleraeesid=2jjMiRi 10 httpswwwdanegovcofilessenlineamientosDSO_020_LIN_08pdf 11 Ibidem

16 Buenas praacutecticas para la publicacioacuten de datos

Reemplace los identificadores directos por coacutedigos de referencia pseudoacutenimos

(algoritmos AES12 o un hash cifrado HMAC13) coacutedigos arbitrarios o aleatorios

Si reemplazando el identificador directo auacuten es faacutecil identificar a la persona elimine el

dato

Clasifique yo categorice los datos

Redondee los datos numeacutericos hacia arriba o hacia abajo

Evaluacutee antes durante y despueacutes de publicados los datos si la anonimizacioacuten de sus

datos es suficiente y evaluacutee regularmente los riesgos existentes

Para maacutes informacioacuten consulte los Lineamientos para la Anonimizacioacuten de micro datos

Ejemplo 1

Antes de publicar sus datos retire el identificador directo de la persona En este caso

reemplace en nuacutemero de documento que identifica al usuario y reemplaacutecelo por un

consecutivo

Usuario Beneficio Usuario Beneficio

80123456 Subsidio de vivienda Usuario 1 Subsidio de vivienda

51123456 Subsidio de alimentacioacuten Usuario 2 Subsidio de alimentacioacuten

19123456 Subsidio al adulto mayor Usuario 3 Subsidio al adulto mayor

53123456 Subsidio de desempleo Usuario 4 Subsidio de desempleo

Ejemplo 2

Clasifique o categorice sus datos En este ejemplo asigne rangos a la edad de manera tal que el

titular del registro no sea identificable por este dato

Usuario Edad Usuario Rango de edad

Usuario 1 11 antildeos Usuario 1 Entre 10 y 15 antildeos

Usuario 2 22 antildeos Usuario 2 Entre 20 y 25 antildeos

Usuario 3 36 antildeos Usuario 3 Entre 35 y 40 antildeos

Usuario 4 63 antildeos Usuario 4 Entre 60 y 65 antildeos

12 Advanced Encryption Standard puede consultar como ha sido implementado este algoritmo en httpsrevistasudistritaleducoojsindexphpTecnuraarticleview72368892 13 Hash-based Message Authentication Code puede consultar como se crea este cifrado en httpsdocsoraclecomcdE19253-01819-7804wanboottasks2-51indexhtml

17 Buenas praacutecticas para la publicacioacuten de datos

5 Publicar los datos en formatos estaacutendar reutilizables y legibles por aplicaciones informaacuteticas

Un formato puede ser definido como la estructura de un disco dividido en campos y pistas

seguacuten un determinado sistema operativo lo que permite almacenar en eacutel informacioacuten14

baacutesicamente es la forma en que se codifican los datos en un archivo informaacutetico

Actualmente conocemos formatos comunes de almacenamiento como el doc una extensioacuten

de Word que almacena texto y cuyo propietario es la compantildeiacutea Microsoft Pero iquestqueacute pasa si un

usuario quiere abrir un documento doc en un procesador de texto diferente a Word

difiacutecilmente va a poder conocer el contenido de dicho documento sin tener esta licencia

Lo que queremos lograr con la implementacioacuten de esta praacutectica es que todos los usuarios que

encuentren mis datos puedan accederlos sin necesidad de contar con un software o aplicacioacuten

informaacutetica especiacutefica

iquestQueacute logro

Que mis datos sean consultados utilizados y reutilizados por maacutes usuarios

Que mis datos sean maacutes interoperables y maacutes procesados

Que mis datos puedan ser extraiacutedos transformados y procesados por aplicaciones

informaacuteticas

Que mis datos puedan ser compartidos e intercambiados entre sistemas

Disminuir los costos y los tiempos en el uso y la transformacioacuten de mis datos

iexclRecomendaciones

Prefiera publicar su conjunto de datos en formatos abiertos o no propietario ya que

estos facilitan el uso re-uso y distribucioacuten de estos Se busca que un mayor nuacutemero de

aplicaciones informaacuteticas pueda extraer leer y transformar los datos generando mayor

uso y re-uso por los usuarios

Disponga sus datos en muacuteltiples formatos con el fin de incrementar el acceso a los

mismos Se busca que el mayor nuacutemero de usuarios pueda utilizar los datos sin tener

que transformarlos primero en su formato preferido

Utilice Web Services para mejorar el intercambio e interoperabilidad de los datos

publicados

14 httpdleraeessrvsearchm=30ampw=formato

18 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo 1

A continuacioacuten encontraraacute extensiones de formato propietario y no propietario prefiera para

la publicacioacuten de sus datos las extensiones de la derecha

FORMATO PROPIETARIO FORMATO NO PROPIETARIO

DOC GDB TXT ASCII Grid KML RDF

XLS DWG CSV GeoJSON DXF XML

PPT SHP JSON GML ODF

Ejemplo 2

Si no fue posible utilizar una extensioacuten de formato no propietario publique sus datos en una

variedad de formatos que le permita al usuario acceder a los datos desde diferentes

aplicaciones informaacuteticas

Ejemplo 3

Para publicar sus datos conozca diferentes tipos de Web Services que viajan en la red utilizando extensiones XML

SOAP httpswwww3orgTRsoap

REST httprestelksteinorg

WMS httpwwwopengeospatialorgstandardswms

WFS httpwwwopengeospatialorgstandardswfs

WCS httpwwwopengeospatialorgstandardswcs

19 Buenas praacutecticas para la publicacioacuten de datos

6 Proporcionar un diccionario de datos que facilite el uso e interpretacioacuten de los datos publicados

Un diccionario estaacute definido como un repertorio en forma de libro o en soporte electroacutenico en el

que se recogen seguacuten un orden determinado las palabras o expresiones de una o maacutes lenguas

o de una materia concreta acompantildeadas de su definicioacuten equivalencia o explicacioacuten15

especiacuteficamente en un diccionario de datos se encuentran los conceptos de los datos y sus

propiedades (atributos dominios asociaciones y operaciones) acompantildeados de una definicioacuten

en donde se identifica el propoacutesito alcance y campo de aplicacioacuten del dato publicado

Lograr que los usuarios de mis datos entiendan la informacioacuten que estaacute publicada le permitiraacute

decidir si satisfacen o no su necesidad y le facilitaraacute la decisioacuten para explotar lo datos

Para maacutes informacioacuten consulte el Instructivo Diccionario de Datos

iquestQueacute logro

Que mis datos sean consultados utilizados y reutilizados por maacutes usuarios

Que se eviten ambiguumledades en la interpretacioacuten de mis datos

Que mis datos publicados esteacuten unificados y consistentes

Que los usuarios comprendan mejor y dispongan de claridad sobre los conceptos de

mis datos

iexclRecomendaciones

Publique como miacutenimo un diccionario de datos que contenga la caracterizacioacuten del

conjunto de datos producidos por su entidad

Cree el diccionario de datos teniendo en cuenta como miacutenimo la siguiente informacioacuten

Nombre del atributo Nombre que identifica de manera clara un atributo

Definicioacuten Descripcioacuten del atributo

Tipo de dato Tipo de valor del atributo

Unidad de medida Expresa la unidad de medida del atributo

Dominio Determina si el atributo tiene asociado un dominio

15 httpdleraeesw=diccionario

20 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo

Para el conjunto de datos ldquoEstablecimientos Educativos en Bogotaacuterdquo publicariacuteamos un

diccionario de datos similar al siguiente

Nombre del atributo Definicioacuten Tipo de dato

Unidad de Medida

Dominio

Coacutedigo del establecimiento

Coacutedigo DANE asignado al Institucioacuten Educativa Decimal

Nombre del establecimiento

Nombre de la Institucioacuten Educativa Cadena de Caracteres

Aacuterea construida del establecimiento

Aacuterea construida de la Institucioacuten Educativa Decimal Metros

cuadrados

Sector

Clasificacioacuten asignada seguacuten la naturaleza juriacutedica la cual define las principales caracteriacutesticas que desde lo juriacutedico - administrativo y tiene que ver con el origen de su creacioacuten

Entero

EESector

No podriacuteamos olvidar detallar el dominio asociado

Atributo Nombre del Dominio Coacutedigo Definicioacuten

EESector

Oficial 1

Es una institucioacuten donde su naturaleza de servicio puacuteblico cultural y su funcioacuten social le es inherente cumpliendo con las disposiciones legales y estatutarias que las rigen donde sus rentas se conservan y se aplican debidamente

Privado 2

Es una institucioacuten constituida como persona juriacutedica de utilidad comuacuten donde sus rentas se conservan y se aplican debidamente y que en todo lo esencial se cumple con la voluntad de sus fundadores

21 Buenas praacutecticas para la publicacioacuten de datos

7 Acompantildear la publicacioacuten de los datos con enlaces a otros recursos

Un enlace es definido como una secuencia de caracteres que se utiliza como direccioacuten para

acceder a informacioacuten adicional16 maacutes sencillo puede definirse como una expresioacuten que

conecta una cierta informacioacuten con otra17Ahora bien un recurso se puede entender como

cualquier medio que satisfaga una necesidad por ejemplo datos servicios documentos o

software

En teacuterminos generales se sugiere que para facilitar al usuario la comprensioacuten de los datos

publicados se proporcionen recursos o documentos adicionales que puedan ser consultados

yo descargados traveacutes de enlaces o links de otro sitio Web

Dentro de los recursos adicionales que pueden publicarse para acompantildear el dato estaacuten los

procedimientos de captura del dato los cataacutelogos de objetos las especificaciones teacutecnicas los

documentos normativos los cataacutelogos de simbologiacutea los reportes de evaluacioacuten de calidad

entre otros

iquestQueacute logro

Mejorar la consulta utilizacioacuten y reutilizacioacuten de mis datos

Que los usuarios comprendan mejor mis datos

Que mis datos sean compartidos e intercambiados por un mayor nuacutemero de usuarios

iexclRecomendaciones

Disponga informacioacuten adicional de sus datos que le permita a los usuarios ampliar el

horizonte de las aplicaciones y funcionalidades en las que pueda utilizar y explotar del

dato

No olvide vincular o registrar esta informacioacuten en el metadato

16 httpdleraeesid=FTVRKyj 17 httpssistemascomenlacephp

22 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo 1

El ldquoMapa de Referencia para Bogotaacuterdquo publicado en httpswwwidecagovcoesserviciosmapa-de-referencia tiene publicados varios enlaces a otros recursos

Especificacioacuten teacutecnica para la elaboracioacuten del Mapa de Referencia para Bogotaacute DC V0318

Cataacutelogo de Objetos del Mapa de Referencia de Bogotaacute DC V 57

Cataacutelogo de Representacioacuten del Mapa de Referencia de Bogotaacute DC V30

Reporte de evaluacioacuten de calidad generado al Mapa de Referencia del Distrito Capital V1217

Ejemplo 2

La informacioacuten de los ldquohumedales de Bogotaacuterdquo publicada en

httpambientebogotagovcowebsdahumedales tiene publicados enlaces a otros recursos

o Gestioacuten de los humedales

o Poliacutetica de Humedales del Distrito Capital

o Normatividad

o Planes de Manejo Ambiental

o Comiteacute distrital de humedales documentos de consulta normatividad

23 Buenas praacutecticas para la publicacioacuten de datos

8 Depurar sus datos antes de publicarlos para garantizar su calidad y aumentar su confianza

La calidad estaacute definida como el conjunto de propiedades inherentes a algo que permiten

juzgar su valor18 para el caso que nos concierne este algo hace referencia al dato publicado

Ahora bien la calidad tambieacuten es entendida como la capacidad del dato publicado para

satisfacer los requerimientos y las necesidades de los usuarios respetando una serie de normas

y especificaciones establecidas

Actualmente existen muacuteltiples elementos de calidad de los datos que identifican las cualidades

de estos sin embargo en este aparte citaremos los elementos principales que usted o su

entidad deben tener en cuenta para publicar sus datos con un estaacutendar miacutenimo de calidad

Para maacutes informacioacuten consulte el Procedimiento para evaluar y reportar la calidad de

los datos espaciales

iquestQueacute logro

Que mis datos sean consultados utilizados y reutilizados por maacutes usuarios

Que los usuarios hablen bien de mis datos

Que mis datos sean maacutes interoperables y maacutes procesados

Que mis datos sean maacutes compartidos

Que mis datos sean maacutes confiables

Recomendacioacuten 1

Establezca si dentro de su conjunto de datos existen capos vaciacuteos o nulos con informacioacuten

descontextualizada sobrante o duplicada Si existen compleacutetelos o elimiacutenelos seguacuten

corresponda antes de la publicacioacuten El elemento de calidad asociado se denomina ldquototalidadrdquo

Localidad Atendidos Localidad Atendidos

Suba 200 Suba 200

Suba 200 Tunjuelito 500

Ameacutericas 100

850

Tunjuelito 500

18 httpdleraeesid=6nVpk8P|6nXVL1Z

Campo duplicado

Campo inconsistente

Campo vaciacuteo

24 Buenas praacutecticas para la publicacioacuten de datos

Recomendacioacuten 2

Identifique y transforme si es necesario los datos que hayan sido registrados en un formato

diferente al establecido para su conjunto de datos Es decir estandarice el formato de salida

del dato que va a publicar El elemento de calidad asociado se denomina ldquoconsistencia de

formatordquo

Localidad Atendidos Localidad Atendidos

Suba 200 Suba 200

Tunjuelito 5008 Tunjuelito 500

Fontiboacuten 40 Fontiboacuten 430

Tunjuelito 500 Tunjuelito 500

Recomendacioacuten 3

Si sus datos tienen alguacuten tipo de clasificacioacuten o rangos previo a la publicacioacuten valide que estos

se hayan registrado correctamente El elemento de calidad asociado se denomina ldquoexactitud de

clasificacioacutenrdquo

Geacutenero Edad Rango de Edad Geacutenero Edad Rango de Edad

Femenino 5 0 lt Edad le 10 Femenino 5 0 lt Edad le 10

Masculino 15 0 lt Edad le 10 Masculino 15 10 lt Edad le 20

Femenino 35 40 lt Edad le 50 Femenino 35 30 lt Edad le 40

Recomendacioacuten 4

Si sus datos representan atributos cuantitativos verifique antes de la publicacioacuten que estos

correspondan a valores conocidos como verdaderos El elemento de calidad asociado se

denomina ldquoexactitud de atributos cuantitativosrdquo

Localidad Mes Temperatura Localidad Mes Temperatura

Chapinero Enero 7degC Chapinero Enero 7degC

Suba Agosto -15degC Suba Agosto 15degC

Tunjuelito Abril 60degC Tunjuelito Abril 16degC

Clasificacioacuten inconsistente

Formato inconsistente

Valor inconsistente

25 Buenas praacutecticas para la publicacioacuten de datos

Recomendacioacuten 5

Si los datos a publicar tienen asociadas fechas de captura o recoleccioacuten de informacioacuten (Por

ejemplo registro de incidentes registro de vacunacioacuten conteo de vehiacuteculos etc) valide que

las fechas registradas coincidan con la fecha del evento capturado El elemento de calidad

asociado se denomina ldquoexactitud de la medicioacuten del tiempordquo

Precipitacioacuten (mm) Fecha de registro Precipitacioacuten (mm) Fecha de registro

00 20580101 00 20180101

01 20180102 01 20180102

126 20510403 126 20180103

20 20180104 20 20180104

Recomendacioacuten 6

Cuando sus datos reflejen informacioacuten determinada por un orden de eventos garantice antes

de la publicacioacuten que este orden sea el adecuado El elemento de calidad asociado se

denomina ldquoconsistencia temporalrdquo

Usuario Escolaridad Periodo de Estudio Usuario Escolaridad Periodo de Estudio

Usuario 1 Preescolar 20030101 ndash 20051231 Usuario 1 Preescolar 20030101 ndash 20051231

Usuario 1 Primaria 20030101 ndash 20101231 Usuario 1 Primaria 20060101 ndash 20101231

Usuario 1 Secundaria 20060101 ndash 20163112 Usuario 1 Secundaria 20110101 ndash 20143112

Usuario 1 Media 20150101 - 20163112 Usuario 1 Media 20150101 - 20163112

Recomendacioacuten 7

Si sus datos incluyen alguna ubicacioacuten (direccioacuten lugar coordenadas) verifique que esta

corresponda a la ubicacioacuten real El elemento de calidad asociado se denomina ldquoexactitud

posicionalrdquo

Eventos Deportivos Lugar Eventos Deportivos Lugar

Evento 1 AK 30 25 90 Evento 1 AK 30 25 90

Evento 2 AC 63 215 20 Evento 2 Parque La Florida

Evento 3 Parque Simoacuten Boliacutevar Evento 3 Parque Simoacuten Boliacutevar

Fecha

inconsistente

Fechas no secuenciales

Lugar inexistente

26 Buenas praacutecticas para la publicacioacuten de datos

9 Incorporar el componente geograacutefico en los datos publicados para optimizar su comprensioacuten uso re-uso y visualizacioacuten

El espacio geograacutefico es un punto de la superficie terrestre que se vea afectado o que afecte de

alguna manera a la humanidad19 Este punto de la superficie puede ser la direccioacuten de una

institucioacuten educativa la ubicacioacuten de un centro de vacunacioacuten el lugar donde se miden las

variaciones de traacutensito en la ciudad los parques de Bogotaacute el edificio en donde se llevan a

cabo los traacutemites de una entidad etc

Los datos que usted captura o recolecta en su quehacer misional siempre estaacuten asociados a un

espacio geograacutefico por lo tanto este componente deberiacutea ser incluido en los datos publicados

Tenga en cuenta que el componente geograacutefico lo puede incorporar incluyendo una ubicacioacuten

asociada a una direccioacuten a un lugar a una localidad a un barrio al nombre de un

establecimiento puacuteblicamente reconocido o a cualquier punto que permita al usuario

identificar la localizacioacuten del dato publicado

iquestQueacute logro

Ampliar el espectro de usuarios que consultan utilizan y reutilizan mis datos

Que mis datos sean maacutes interoperables y maacutes procesados

Que mis datos sean puedan compartir en maacutes plataformas

Que los usuarios puedan visualizar mis datos en un mapa

iexclRecomendaciones

Disponga sus datos agregando un atributo de ubicacioacuten como direcciones coordenadas o

lugares geograacuteficos

Ejemplo 1

Incluya direcciones que permitan localizar espacialmente sus datos

Programa Direccioacuten

Registro de atencioacuten a la ciudadaniacutea CL 138 108 16

Centro de autocuidado KR 18 D 77 A 11 SUR

Familias con un nintildeo en cupos cofinanciados CL 70 A SUR 20 46

Centro de autocuidado KR 18 D 73 A 33 SUR

19 httpenciclopediabanrepculturalorgindexphptitle=Espacio_geogrC3A1fico

27 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo 2

Utilice coordenadas para indicar la ubicacioacuten de sus datos

EPS Coordenada X Coordenada Y

EPS Convida 9087496334 1051342164

Capital Salud EPS 986321006 954875808

EPS Famisanar 9742508812 8837031501

Aliansalud EPS 9716943356 9659706891

Salud Total EPS 9215624975 9625189518

Tenga en cuenta que para publicar datos con coordenadas tendraacute que incluir dentro

de su metadato el Sistema de referencia empleado

MAGNA ndash SIRGAS EPSG 4686 httpsepsgio4686

MAGNA ndash SIRGAS EPSG 3116 httpsepsgio3116

MAGNA ndash BOGOTAacute SR-ORG 7458 httpspatialreferenceorgrefsr-org7458

Ejemplo 3

Tambieacuten puede incluir lugares geograacuteficos descriptivos asiacute

Usuario Vacunado Lugar de Vacunacioacuten

Usuario 1 BOSQUE IZQUIERDO

Usuario 2 LAGUNITAS URBANO

Usuario 3 LA CAPUCHINA

Usuario 4 SAN JOSE SUR

Usuario 5 VENECIA

28 Buenas praacutecticas para la publicacioacuten de datos

10 Asignar un identificador uacutenico que permita aumentar la consulta uso e interoperabilidad del dato publicado

Considere un identificador uacutenico como un texto que permite identificar inequiacutevocamente el

dato publicado Si usted va a publicar un dato buscando que este sea reutilizado por los

usuarios y por su propia entidad asignar un identificador facilitaraacute el descubrimiento y la

citacioacuten del dato a traveacutes del tiempo independientemente del estado la disponibilidad o el

formato de este

En la vida cotidiana mediante la ceacutedula de ciudadaniacutea se asigna a cada ciudadano un nuacutemero

de identificacioacuten uacutenico y a traveacutes de este identificador el ciudadano es reconocido a lo largo de

su vida e incluso despueacutes de su muerte por otras personas yo autoridades En el mundo de la

informacioacuten cada dato deberiacutea viajar con un identificador uacutenico que le permita ser encontrado

y reconocido faacutecilmente entre los demaacutes datos

Ahora bien si usted o su entidad publican continuamente datos establecer un sistema de

identificacioacuten comuacuten le permitiraacute identificar raacutepidamente los datos y los haraacute comparables por

cualquier usuario de manera confiable Esta condicioacuten es previa para lograr una correcta

gestioacuten y reutilizacioacuten de sus datos

iquestQueacute logro

Ampliar el espectro de usuarios que consultan utilizan y reutilizan mis datos

Que mis datos sean maacutes interoperables y maacutes procesados

Que mis datos sean compartidos en maacutes plataformas

Que mis datos puedan vincularse a otros datos en el entorno Web

Que mis datos sean encontrados usados y citados inequiacutevocamente

Garantizar y monitorear la reutilizacioacuten de mis datos

Reducir del uso erroacuteneo de mis datos

iexclRecomendaciones

Establezca un sistema de identificacioacuten comuacuten para los datos que va a publicar

Utilice siempre el identificador asignado para publicar sus datos

29 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo

IDECA ha dispuesto el Sistema de Registro de Iacutetems geograacuteficos

httpgeoitemsidecagovcogeoitemsano una herramienta web desarrollada para la

creacioacuten aprobacioacuten publicacioacuten y mantenimiento de iacutetems geograacuteficos que permite la

asignacioacuten concertada de identificadores y significados uacutenicos que contribuyen a la definicioacuten

de un lenguaje comuacuten para el desarrollo de nuevos sistema de informacioacuten en el Distrito

garantizando con ello su fiabilidad e interoperabilidad Adicionalmente permite almacenar

descripciones de la informacioacuten oficial producida e identificar su respectivo custodio jugando

asiacute un papel importante en el control y seguimiento de la produccioacuten de informacioacuten

geograacutefica

Este sistema asigna un identificador uacutenico a cada uno de los iacutetems creados Dentro de los iacutetems

publicados se reconoce el ID 65 como unidad de planeamiento y siempre que se hace

referencia a este objeto es suficiente nombrarlo asiacute para entender que se habla de ldquoUnidades

territoriales de anaacutelisis planeamiento y gestioacuten que tienen como propoacutesito definir y precisar el

planeamiento del suelo urbano de expansioacuten y ruralrdquo

30 Buenas praacutecticas para la publicacioacuten de datos

OBTENGA EL MAacuteS ALTO NIVEL EN PUBLICACIOacuteN DE DATOS

Hasta aquiacute hemos publicado las que consideramos como mejores praacutecticas de publicacioacuten de datos Ahora usted como publicador o como entidad debe evaluar si sus datos se estaacuten disponiendo con los maacutes altos y mejores estaacutendares de publicacioacuten

Lo invitamos a que valide en queacute nivel de publicacioacuten se encuentra su entidad teniendo en cuenta el siguiente listado

Nivel Baacutesico

En este nivel se encuentran aquellas entidades que publican sus datos en formatos estaacutendar y reutilizables (praacutectica 5) que integran a la publicacioacuten sus respectivos metadatos (praacutectica 1) y que acompantildean la publicacioacuten con una licencia asociada (praacutectica 2)

Nivel Intermedio

Este nivel lo alcanzan las entidades que superando el nivel baacutesico disponen un mayor volumen de informacioacuten gracias a que anonimizan sus datos (praacutectica 4) implementan medidas de calidad que aumentan la confianza en sus datos (praacutectica 8) incorporan el componente geograacutefico proporcionando valor agregado a sus datos (praacutectica 9) y publican un diccionario de datos que facilita la interpretacioacuten de los datos publicados (praacutectica 6)

Nivel Avanzado

Las entidades que superando el nivel intermedio utilizan vocabularios estandarizados en sus nuevas publicaciones (praacutectica 3) acompantildean la publicacioacuten de sus datos con enlaces a otros recursos (praacutectica 7) y asignan un identificador uacutenico para dato logrando asiacute aumentar su descubrimiento y reutilizacioacuten (praacutectica 10)

31 Buenas praacutecticas para la publicacioacuten de datos

REFERENCIAS

Bernadette Farias Loacutescio Caroline Burle Newton Calegari W3C Data on the Web Best

Practices 31 de enero de 2017 W3C Recommendation URL httpswwww3orgTRdwbp

Bernadette Hyland Ghislain Auguste Atemezing Boris Villazoacuten-Terrazas W3C Best Practices

for Publishing Linked Data 9 de enero de 2014 W3C Note URL httpswwww3orgTRld-bp

Dan Brickley Libby Miller FOAF project FOAF Vocabulary Specification 099 (Paddington

Edition) 14 de enero de 2014 URL httpxmlnscomfoafspec

Dublin Core metadata initiative DCMI Metadata Terms 14 de junio de 2012 DCMI

Recommendation URL httpdublincoreorgdocumentsdcmi-terms

Fadi Maali John Erickson W3C Data Catalog Vocabulary (DCAT) 16 de enero de 2014 W3C

Recommendation URL httpswwww3orgTRvocab-dcat

ISO 19115-12014 (E) Geographic information ndash Metadata Part1 Fundamentals 01 de abril de

2014 International Standard

ISO 191262009 (E) Geographic information -- Feature concept dictionaries and registers

noviembre de 2009 International Standard

ISO 191572013 (E) Geographic information ndash Data quality 15 de diciembre de 2013

International Standard

Jeremy Tandy Payam Barnaghi Linda van den Brink W3C Spatial Data on the Web Best

Practices 5 de enero 2017 W3C Note URL httpswwww3orgTRsdw-bp

T Berners-Lee R Fielding L Masinter IETF Uniform Resource Identifier (URI) Generic Syntax

Enero de 2005 Internet Standard URL httpstoolsietforghtmlrfc3986

World Wide Web Foundation Open Data Barometer URL httpopendatabarometerorg

W3C OWL Working Group W3C OWL 2 Web Ontology Language Document Overview (Second

Edition) 11 de diciembre de 2012 W3C Recommendation URL httpswwww3orgTRowl2-

overview

W3org Semantic Web - W3C URL httpswwww3orgstandardssemanticweb Consultado

el 12 de septiembre de 2018

Page 14: PARA LA PUBLICACIÓN DE DATOSideca.gov.co/.../files/documentacion/buenaspracticaspublicaciondat… · La obtención de datos la realiza cada entidad en el desarrollo de sus actividades

14 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo 3

La especificacioacuten vCard disponible en httpswwww3orgTRvcard-rdf promueve un

vocabulario especiacutefico para describir personas y organizaciones

Uno de los vocablos que describe esta especificacioacuten es la ldquodireccioacuten de entregardquo llamado

dentro del vocabulario como ADR y definido como ldquola direccioacuten del objeto representado en

partes estructuradasrdquo

Ahora bien este vocabulario especifica los componentes de la direccioacuten de entrega para el

objeto asiacute el nombre del paiacutes la localidad el coacutedigo postal la regioacuten y la direccioacuten dada por

viacuteas (calles y carreras en el caso colombiano) Esto quiere decir que cualquiera de los

componentes descritos puede usarse como direccioacuten de entrega vaacutelida ya que son equivalentes

entre siacute

Aunque en el vocabulario la direccioacuten de entrega se llame ADR el usuario de la informacioacuten

entenderaacute que un nombre de paiacutes o un coacutedigo postal pueden interpretarse como ADR

15 Buenas praacutecticas para la publicacioacuten de datos

4 Anonimizar los datos de caraacutecter personal informacioacuten estadiacutestica informacioacuten indirectamente identificable e informacioacuten sensible o confidencial

Anonimizar es el proceso que impide la identificacioacuten de las unidades de estudio que son fuente

para los registros individuales de un conjunto8 de datos o maacutes claro es la aplicacioacuten de teacutecnicas

que permitan expresar un dato relativo a personas eliminando la referencia a su identidad9

Baacutesicamente lo que se busca es reducir los riesgos en el uso y procesamiento de datos

personales evitar la extraccioacuten de registros que identifican a una persona reducir la

combinacioacuten de dos o maacutes registros en una o varias bases de datos para identificar a una

persona y minimizar la deduccioacuten de datos personales partir de uno o varios datos publicados

iquestQueacute informacioacuten debo prioritariamente anonimizar

Datos personales Informacioacuten numeacuterica alfabeacutetica graacutefica fotograacutefica acuacutestica o

cualquier otro tipo susceptible de recogida registro tratamiento y transmisioacuten

concerniente a personas fiacutesicas identificadas o identificables (tales como nombre

apellidos estado civil sexo edad domicilio identificacioacuten personal nuacutemero de

teleacutefono etc)10

Informacioacuten sensible Informacioacuten considerada como estrictamente confidencial

Informacioacuten y caracteriacutesticas referentes a la edad procedencia salud raza religioacuten

ideologiacutea afiliacioacuten finanzas etc se consideran de caraacutecter sensible y requieren de

una proteccioacuten especial11

iquestQueacute logro

Garantizar que mis datos publicados cuentan con medidas de proteccioacuten de datos

personales

Eliminar de manera efectiva el riesgo de re-identificacioacuten

Evitar que el procesamiento de mis datos tenga consecuencias negativas para alguna

persona

Disponer muchos maacutes datos sin invadir la informacioacuten personal

iexclRecomendaciones

Implemente actividades de proteccioacuten de la privacidad de los datos personales antes

de publicarlos

Elimine cualquier identificador directo de la persona (nombre documento de

identidad etc)

8 httpswwwdanegovcofilessenlineamientosDSO_020_LIN_08pdf 9 httpdleraeesid=2jjMiRi 10 httpswwwdanegovcofilessenlineamientosDSO_020_LIN_08pdf 11 Ibidem

16 Buenas praacutecticas para la publicacioacuten de datos

Reemplace los identificadores directos por coacutedigos de referencia pseudoacutenimos

(algoritmos AES12 o un hash cifrado HMAC13) coacutedigos arbitrarios o aleatorios

Si reemplazando el identificador directo auacuten es faacutecil identificar a la persona elimine el

dato

Clasifique yo categorice los datos

Redondee los datos numeacutericos hacia arriba o hacia abajo

Evaluacutee antes durante y despueacutes de publicados los datos si la anonimizacioacuten de sus

datos es suficiente y evaluacutee regularmente los riesgos existentes

Para maacutes informacioacuten consulte los Lineamientos para la Anonimizacioacuten de micro datos

Ejemplo 1

Antes de publicar sus datos retire el identificador directo de la persona En este caso

reemplace en nuacutemero de documento que identifica al usuario y reemplaacutecelo por un

consecutivo

Usuario Beneficio Usuario Beneficio

80123456 Subsidio de vivienda Usuario 1 Subsidio de vivienda

51123456 Subsidio de alimentacioacuten Usuario 2 Subsidio de alimentacioacuten

19123456 Subsidio al adulto mayor Usuario 3 Subsidio al adulto mayor

53123456 Subsidio de desempleo Usuario 4 Subsidio de desempleo

Ejemplo 2

Clasifique o categorice sus datos En este ejemplo asigne rangos a la edad de manera tal que el

titular del registro no sea identificable por este dato

Usuario Edad Usuario Rango de edad

Usuario 1 11 antildeos Usuario 1 Entre 10 y 15 antildeos

Usuario 2 22 antildeos Usuario 2 Entre 20 y 25 antildeos

Usuario 3 36 antildeos Usuario 3 Entre 35 y 40 antildeos

Usuario 4 63 antildeos Usuario 4 Entre 60 y 65 antildeos

12 Advanced Encryption Standard puede consultar como ha sido implementado este algoritmo en httpsrevistasudistritaleducoojsindexphpTecnuraarticleview72368892 13 Hash-based Message Authentication Code puede consultar como se crea este cifrado en httpsdocsoraclecomcdE19253-01819-7804wanboottasks2-51indexhtml

17 Buenas praacutecticas para la publicacioacuten de datos

5 Publicar los datos en formatos estaacutendar reutilizables y legibles por aplicaciones informaacuteticas

Un formato puede ser definido como la estructura de un disco dividido en campos y pistas

seguacuten un determinado sistema operativo lo que permite almacenar en eacutel informacioacuten14

baacutesicamente es la forma en que se codifican los datos en un archivo informaacutetico

Actualmente conocemos formatos comunes de almacenamiento como el doc una extensioacuten

de Word que almacena texto y cuyo propietario es la compantildeiacutea Microsoft Pero iquestqueacute pasa si un

usuario quiere abrir un documento doc en un procesador de texto diferente a Word

difiacutecilmente va a poder conocer el contenido de dicho documento sin tener esta licencia

Lo que queremos lograr con la implementacioacuten de esta praacutectica es que todos los usuarios que

encuentren mis datos puedan accederlos sin necesidad de contar con un software o aplicacioacuten

informaacutetica especiacutefica

iquestQueacute logro

Que mis datos sean consultados utilizados y reutilizados por maacutes usuarios

Que mis datos sean maacutes interoperables y maacutes procesados

Que mis datos puedan ser extraiacutedos transformados y procesados por aplicaciones

informaacuteticas

Que mis datos puedan ser compartidos e intercambiados entre sistemas

Disminuir los costos y los tiempos en el uso y la transformacioacuten de mis datos

iexclRecomendaciones

Prefiera publicar su conjunto de datos en formatos abiertos o no propietario ya que

estos facilitan el uso re-uso y distribucioacuten de estos Se busca que un mayor nuacutemero de

aplicaciones informaacuteticas pueda extraer leer y transformar los datos generando mayor

uso y re-uso por los usuarios

Disponga sus datos en muacuteltiples formatos con el fin de incrementar el acceso a los

mismos Se busca que el mayor nuacutemero de usuarios pueda utilizar los datos sin tener

que transformarlos primero en su formato preferido

Utilice Web Services para mejorar el intercambio e interoperabilidad de los datos

publicados

14 httpdleraeessrvsearchm=30ampw=formato

18 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo 1

A continuacioacuten encontraraacute extensiones de formato propietario y no propietario prefiera para

la publicacioacuten de sus datos las extensiones de la derecha

FORMATO PROPIETARIO FORMATO NO PROPIETARIO

DOC GDB TXT ASCII Grid KML RDF

XLS DWG CSV GeoJSON DXF XML

PPT SHP JSON GML ODF

Ejemplo 2

Si no fue posible utilizar una extensioacuten de formato no propietario publique sus datos en una

variedad de formatos que le permita al usuario acceder a los datos desde diferentes

aplicaciones informaacuteticas

Ejemplo 3

Para publicar sus datos conozca diferentes tipos de Web Services que viajan en la red utilizando extensiones XML

SOAP httpswwww3orgTRsoap

REST httprestelksteinorg

WMS httpwwwopengeospatialorgstandardswms

WFS httpwwwopengeospatialorgstandardswfs

WCS httpwwwopengeospatialorgstandardswcs

19 Buenas praacutecticas para la publicacioacuten de datos

6 Proporcionar un diccionario de datos que facilite el uso e interpretacioacuten de los datos publicados

Un diccionario estaacute definido como un repertorio en forma de libro o en soporte electroacutenico en el

que se recogen seguacuten un orden determinado las palabras o expresiones de una o maacutes lenguas

o de una materia concreta acompantildeadas de su definicioacuten equivalencia o explicacioacuten15

especiacuteficamente en un diccionario de datos se encuentran los conceptos de los datos y sus

propiedades (atributos dominios asociaciones y operaciones) acompantildeados de una definicioacuten

en donde se identifica el propoacutesito alcance y campo de aplicacioacuten del dato publicado

Lograr que los usuarios de mis datos entiendan la informacioacuten que estaacute publicada le permitiraacute

decidir si satisfacen o no su necesidad y le facilitaraacute la decisioacuten para explotar lo datos

Para maacutes informacioacuten consulte el Instructivo Diccionario de Datos

iquestQueacute logro

Que mis datos sean consultados utilizados y reutilizados por maacutes usuarios

Que se eviten ambiguumledades en la interpretacioacuten de mis datos

Que mis datos publicados esteacuten unificados y consistentes

Que los usuarios comprendan mejor y dispongan de claridad sobre los conceptos de

mis datos

iexclRecomendaciones

Publique como miacutenimo un diccionario de datos que contenga la caracterizacioacuten del

conjunto de datos producidos por su entidad

Cree el diccionario de datos teniendo en cuenta como miacutenimo la siguiente informacioacuten

Nombre del atributo Nombre que identifica de manera clara un atributo

Definicioacuten Descripcioacuten del atributo

Tipo de dato Tipo de valor del atributo

Unidad de medida Expresa la unidad de medida del atributo

Dominio Determina si el atributo tiene asociado un dominio

15 httpdleraeesw=diccionario

20 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo

Para el conjunto de datos ldquoEstablecimientos Educativos en Bogotaacuterdquo publicariacuteamos un

diccionario de datos similar al siguiente

Nombre del atributo Definicioacuten Tipo de dato

Unidad de Medida

Dominio

Coacutedigo del establecimiento

Coacutedigo DANE asignado al Institucioacuten Educativa Decimal

Nombre del establecimiento

Nombre de la Institucioacuten Educativa Cadena de Caracteres

Aacuterea construida del establecimiento

Aacuterea construida de la Institucioacuten Educativa Decimal Metros

cuadrados

Sector

Clasificacioacuten asignada seguacuten la naturaleza juriacutedica la cual define las principales caracteriacutesticas que desde lo juriacutedico - administrativo y tiene que ver con el origen de su creacioacuten

Entero

EESector

No podriacuteamos olvidar detallar el dominio asociado

Atributo Nombre del Dominio Coacutedigo Definicioacuten

EESector

Oficial 1

Es una institucioacuten donde su naturaleza de servicio puacuteblico cultural y su funcioacuten social le es inherente cumpliendo con las disposiciones legales y estatutarias que las rigen donde sus rentas se conservan y se aplican debidamente

Privado 2

Es una institucioacuten constituida como persona juriacutedica de utilidad comuacuten donde sus rentas se conservan y se aplican debidamente y que en todo lo esencial se cumple con la voluntad de sus fundadores

21 Buenas praacutecticas para la publicacioacuten de datos

7 Acompantildear la publicacioacuten de los datos con enlaces a otros recursos

Un enlace es definido como una secuencia de caracteres que se utiliza como direccioacuten para

acceder a informacioacuten adicional16 maacutes sencillo puede definirse como una expresioacuten que

conecta una cierta informacioacuten con otra17Ahora bien un recurso se puede entender como

cualquier medio que satisfaga una necesidad por ejemplo datos servicios documentos o

software

En teacuterminos generales se sugiere que para facilitar al usuario la comprensioacuten de los datos

publicados se proporcionen recursos o documentos adicionales que puedan ser consultados

yo descargados traveacutes de enlaces o links de otro sitio Web

Dentro de los recursos adicionales que pueden publicarse para acompantildear el dato estaacuten los

procedimientos de captura del dato los cataacutelogos de objetos las especificaciones teacutecnicas los

documentos normativos los cataacutelogos de simbologiacutea los reportes de evaluacioacuten de calidad

entre otros

iquestQueacute logro

Mejorar la consulta utilizacioacuten y reutilizacioacuten de mis datos

Que los usuarios comprendan mejor mis datos

Que mis datos sean compartidos e intercambiados por un mayor nuacutemero de usuarios

iexclRecomendaciones

Disponga informacioacuten adicional de sus datos que le permita a los usuarios ampliar el

horizonte de las aplicaciones y funcionalidades en las que pueda utilizar y explotar del

dato

No olvide vincular o registrar esta informacioacuten en el metadato

16 httpdleraeesid=FTVRKyj 17 httpssistemascomenlacephp

22 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo 1

El ldquoMapa de Referencia para Bogotaacuterdquo publicado en httpswwwidecagovcoesserviciosmapa-de-referencia tiene publicados varios enlaces a otros recursos

Especificacioacuten teacutecnica para la elaboracioacuten del Mapa de Referencia para Bogotaacute DC V0318

Cataacutelogo de Objetos del Mapa de Referencia de Bogotaacute DC V 57

Cataacutelogo de Representacioacuten del Mapa de Referencia de Bogotaacute DC V30

Reporte de evaluacioacuten de calidad generado al Mapa de Referencia del Distrito Capital V1217

Ejemplo 2

La informacioacuten de los ldquohumedales de Bogotaacuterdquo publicada en

httpambientebogotagovcowebsdahumedales tiene publicados enlaces a otros recursos

o Gestioacuten de los humedales

o Poliacutetica de Humedales del Distrito Capital

o Normatividad

o Planes de Manejo Ambiental

o Comiteacute distrital de humedales documentos de consulta normatividad

23 Buenas praacutecticas para la publicacioacuten de datos

8 Depurar sus datos antes de publicarlos para garantizar su calidad y aumentar su confianza

La calidad estaacute definida como el conjunto de propiedades inherentes a algo que permiten

juzgar su valor18 para el caso que nos concierne este algo hace referencia al dato publicado

Ahora bien la calidad tambieacuten es entendida como la capacidad del dato publicado para

satisfacer los requerimientos y las necesidades de los usuarios respetando una serie de normas

y especificaciones establecidas

Actualmente existen muacuteltiples elementos de calidad de los datos que identifican las cualidades

de estos sin embargo en este aparte citaremos los elementos principales que usted o su

entidad deben tener en cuenta para publicar sus datos con un estaacutendar miacutenimo de calidad

Para maacutes informacioacuten consulte el Procedimiento para evaluar y reportar la calidad de

los datos espaciales

iquestQueacute logro

Que mis datos sean consultados utilizados y reutilizados por maacutes usuarios

Que los usuarios hablen bien de mis datos

Que mis datos sean maacutes interoperables y maacutes procesados

Que mis datos sean maacutes compartidos

Que mis datos sean maacutes confiables

Recomendacioacuten 1

Establezca si dentro de su conjunto de datos existen capos vaciacuteos o nulos con informacioacuten

descontextualizada sobrante o duplicada Si existen compleacutetelos o elimiacutenelos seguacuten

corresponda antes de la publicacioacuten El elemento de calidad asociado se denomina ldquototalidadrdquo

Localidad Atendidos Localidad Atendidos

Suba 200 Suba 200

Suba 200 Tunjuelito 500

Ameacutericas 100

850

Tunjuelito 500

18 httpdleraeesid=6nVpk8P|6nXVL1Z

Campo duplicado

Campo inconsistente

Campo vaciacuteo

24 Buenas praacutecticas para la publicacioacuten de datos

Recomendacioacuten 2

Identifique y transforme si es necesario los datos que hayan sido registrados en un formato

diferente al establecido para su conjunto de datos Es decir estandarice el formato de salida

del dato que va a publicar El elemento de calidad asociado se denomina ldquoconsistencia de

formatordquo

Localidad Atendidos Localidad Atendidos

Suba 200 Suba 200

Tunjuelito 5008 Tunjuelito 500

Fontiboacuten 40 Fontiboacuten 430

Tunjuelito 500 Tunjuelito 500

Recomendacioacuten 3

Si sus datos tienen alguacuten tipo de clasificacioacuten o rangos previo a la publicacioacuten valide que estos

se hayan registrado correctamente El elemento de calidad asociado se denomina ldquoexactitud de

clasificacioacutenrdquo

Geacutenero Edad Rango de Edad Geacutenero Edad Rango de Edad

Femenino 5 0 lt Edad le 10 Femenino 5 0 lt Edad le 10

Masculino 15 0 lt Edad le 10 Masculino 15 10 lt Edad le 20

Femenino 35 40 lt Edad le 50 Femenino 35 30 lt Edad le 40

Recomendacioacuten 4

Si sus datos representan atributos cuantitativos verifique antes de la publicacioacuten que estos

correspondan a valores conocidos como verdaderos El elemento de calidad asociado se

denomina ldquoexactitud de atributos cuantitativosrdquo

Localidad Mes Temperatura Localidad Mes Temperatura

Chapinero Enero 7degC Chapinero Enero 7degC

Suba Agosto -15degC Suba Agosto 15degC

Tunjuelito Abril 60degC Tunjuelito Abril 16degC

Clasificacioacuten inconsistente

Formato inconsistente

Valor inconsistente

25 Buenas praacutecticas para la publicacioacuten de datos

Recomendacioacuten 5

Si los datos a publicar tienen asociadas fechas de captura o recoleccioacuten de informacioacuten (Por

ejemplo registro de incidentes registro de vacunacioacuten conteo de vehiacuteculos etc) valide que

las fechas registradas coincidan con la fecha del evento capturado El elemento de calidad

asociado se denomina ldquoexactitud de la medicioacuten del tiempordquo

Precipitacioacuten (mm) Fecha de registro Precipitacioacuten (mm) Fecha de registro

00 20580101 00 20180101

01 20180102 01 20180102

126 20510403 126 20180103

20 20180104 20 20180104

Recomendacioacuten 6

Cuando sus datos reflejen informacioacuten determinada por un orden de eventos garantice antes

de la publicacioacuten que este orden sea el adecuado El elemento de calidad asociado se

denomina ldquoconsistencia temporalrdquo

Usuario Escolaridad Periodo de Estudio Usuario Escolaridad Periodo de Estudio

Usuario 1 Preescolar 20030101 ndash 20051231 Usuario 1 Preescolar 20030101 ndash 20051231

Usuario 1 Primaria 20030101 ndash 20101231 Usuario 1 Primaria 20060101 ndash 20101231

Usuario 1 Secundaria 20060101 ndash 20163112 Usuario 1 Secundaria 20110101 ndash 20143112

Usuario 1 Media 20150101 - 20163112 Usuario 1 Media 20150101 - 20163112

Recomendacioacuten 7

Si sus datos incluyen alguna ubicacioacuten (direccioacuten lugar coordenadas) verifique que esta

corresponda a la ubicacioacuten real El elemento de calidad asociado se denomina ldquoexactitud

posicionalrdquo

Eventos Deportivos Lugar Eventos Deportivos Lugar

Evento 1 AK 30 25 90 Evento 1 AK 30 25 90

Evento 2 AC 63 215 20 Evento 2 Parque La Florida

Evento 3 Parque Simoacuten Boliacutevar Evento 3 Parque Simoacuten Boliacutevar

Fecha

inconsistente

Fechas no secuenciales

Lugar inexistente

26 Buenas praacutecticas para la publicacioacuten de datos

9 Incorporar el componente geograacutefico en los datos publicados para optimizar su comprensioacuten uso re-uso y visualizacioacuten

El espacio geograacutefico es un punto de la superficie terrestre que se vea afectado o que afecte de

alguna manera a la humanidad19 Este punto de la superficie puede ser la direccioacuten de una

institucioacuten educativa la ubicacioacuten de un centro de vacunacioacuten el lugar donde se miden las

variaciones de traacutensito en la ciudad los parques de Bogotaacute el edificio en donde se llevan a

cabo los traacutemites de una entidad etc

Los datos que usted captura o recolecta en su quehacer misional siempre estaacuten asociados a un

espacio geograacutefico por lo tanto este componente deberiacutea ser incluido en los datos publicados

Tenga en cuenta que el componente geograacutefico lo puede incorporar incluyendo una ubicacioacuten

asociada a una direccioacuten a un lugar a una localidad a un barrio al nombre de un

establecimiento puacuteblicamente reconocido o a cualquier punto que permita al usuario

identificar la localizacioacuten del dato publicado

iquestQueacute logro

Ampliar el espectro de usuarios que consultan utilizan y reutilizan mis datos

Que mis datos sean maacutes interoperables y maacutes procesados

Que mis datos sean puedan compartir en maacutes plataformas

Que los usuarios puedan visualizar mis datos en un mapa

iexclRecomendaciones

Disponga sus datos agregando un atributo de ubicacioacuten como direcciones coordenadas o

lugares geograacuteficos

Ejemplo 1

Incluya direcciones que permitan localizar espacialmente sus datos

Programa Direccioacuten

Registro de atencioacuten a la ciudadaniacutea CL 138 108 16

Centro de autocuidado KR 18 D 77 A 11 SUR

Familias con un nintildeo en cupos cofinanciados CL 70 A SUR 20 46

Centro de autocuidado KR 18 D 73 A 33 SUR

19 httpenciclopediabanrepculturalorgindexphptitle=Espacio_geogrC3A1fico

27 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo 2

Utilice coordenadas para indicar la ubicacioacuten de sus datos

EPS Coordenada X Coordenada Y

EPS Convida 9087496334 1051342164

Capital Salud EPS 986321006 954875808

EPS Famisanar 9742508812 8837031501

Aliansalud EPS 9716943356 9659706891

Salud Total EPS 9215624975 9625189518

Tenga en cuenta que para publicar datos con coordenadas tendraacute que incluir dentro

de su metadato el Sistema de referencia empleado

MAGNA ndash SIRGAS EPSG 4686 httpsepsgio4686

MAGNA ndash SIRGAS EPSG 3116 httpsepsgio3116

MAGNA ndash BOGOTAacute SR-ORG 7458 httpspatialreferenceorgrefsr-org7458

Ejemplo 3

Tambieacuten puede incluir lugares geograacuteficos descriptivos asiacute

Usuario Vacunado Lugar de Vacunacioacuten

Usuario 1 BOSQUE IZQUIERDO

Usuario 2 LAGUNITAS URBANO

Usuario 3 LA CAPUCHINA

Usuario 4 SAN JOSE SUR

Usuario 5 VENECIA

28 Buenas praacutecticas para la publicacioacuten de datos

10 Asignar un identificador uacutenico que permita aumentar la consulta uso e interoperabilidad del dato publicado

Considere un identificador uacutenico como un texto que permite identificar inequiacutevocamente el

dato publicado Si usted va a publicar un dato buscando que este sea reutilizado por los

usuarios y por su propia entidad asignar un identificador facilitaraacute el descubrimiento y la

citacioacuten del dato a traveacutes del tiempo independientemente del estado la disponibilidad o el

formato de este

En la vida cotidiana mediante la ceacutedula de ciudadaniacutea se asigna a cada ciudadano un nuacutemero

de identificacioacuten uacutenico y a traveacutes de este identificador el ciudadano es reconocido a lo largo de

su vida e incluso despueacutes de su muerte por otras personas yo autoridades En el mundo de la

informacioacuten cada dato deberiacutea viajar con un identificador uacutenico que le permita ser encontrado

y reconocido faacutecilmente entre los demaacutes datos

Ahora bien si usted o su entidad publican continuamente datos establecer un sistema de

identificacioacuten comuacuten le permitiraacute identificar raacutepidamente los datos y los haraacute comparables por

cualquier usuario de manera confiable Esta condicioacuten es previa para lograr una correcta

gestioacuten y reutilizacioacuten de sus datos

iquestQueacute logro

Ampliar el espectro de usuarios que consultan utilizan y reutilizan mis datos

Que mis datos sean maacutes interoperables y maacutes procesados

Que mis datos sean compartidos en maacutes plataformas

Que mis datos puedan vincularse a otros datos en el entorno Web

Que mis datos sean encontrados usados y citados inequiacutevocamente

Garantizar y monitorear la reutilizacioacuten de mis datos

Reducir del uso erroacuteneo de mis datos

iexclRecomendaciones

Establezca un sistema de identificacioacuten comuacuten para los datos que va a publicar

Utilice siempre el identificador asignado para publicar sus datos

29 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo

IDECA ha dispuesto el Sistema de Registro de Iacutetems geograacuteficos

httpgeoitemsidecagovcogeoitemsano una herramienta web desarrollada para la

creacioacuten aprobacioacuten publicacioacuten y mantenimiento de iacutetems geograacuteficos que permite la

asignacioacuten concertada de identificadores y significados uacutenicos que contribuyen a la definicioacuten

de un lenguaje comuacuten para el desarrollo de nuevos sistema de informacioacuten en el Distrito

garantizando con ello su fiabilidad e interoperabilidad Adicionalmente permite almacenar

descripciones de la informacioacuten oficial producida e identificar su respectivo custodio jugando

asiacute un papel importante en el control y seguimiento de la produccioacuten de informacioacuten

geograacutefica

Este sistema asigna un identificador uacutenico a cada uno de los iacutetems creados Dentro de los iacutetems

publicados se reconoce el ID 65 como unidad de planeamiento y siempre que se hace

referencia a este objeto es suficiente nombrarlo asiacute para entender que se habla de ldquoUnidades

territoriales de anaacutelisis planeamiento y gestioacuten que tienen como propoacutesito definir y precisar el

planeamiento del suelo urbano de expansioacuten y ruralrdquo

30 Buenas praacutecticas para la publicacioacuten de datos

OBTENGA EL MAacuteS ALTO NIVEL EN PUBLICACIOacuteN DE DATOS

Hasta aquiacute hemos publicado las que consideramos como mejores praacutecticas de publicacioacuten de datos Ahora usted como publicador o como entidad debe evaluar si sus datos se estaacuten disponiendo con los maacutes altos y mejores estaacutendares de publicacioacuten

Lo invitamos a que valide en queacute nivel de publicacioacuten se encuentra su entidad teniendo en cuenta el siguiente listado

Nivel Baacutesico

En este nivel se encuentran aquellas entidades que publican sus datos en formatos estaacutendar y reutilizables (praacutectica 5) que integran a la publicacioacuten sus respectivos metadatos (praacutectica 1) y que acompantildean la publicacioacuten con una licencia asociada (praacutectica 2)

Nivel Intermedio

Este nivel lo alcanzan las entidades que superando el nivel baacutesico disponen un mayor volumen de informacioacuten gracias a que anonimizan sus datos (praacutectica 4) implementan medidas de calidad que aumentan la confianza en sus datos (praacutectica 8) incorporan el componente geograacutefico proporcionando valor agregado a sus datos (praacutectica 9) y publican un diccionario de datos que facilita la interpretacioacuten de los datos publicados (praacutectica 6)

Nivel Avanzado

Las entidades que superando el nivel intermedio utilizan vocabularios estandarizados en sus nuevas publicaciones (praacutectica 3) acompantildean la publicacioacuten de sus datos con enlaces a otros recursos (praacutectica 7) y asignan un identificador uacutenico para dato logrando asiacute aumentar su descubrimiento y reutilizacioacuten (praacutectica 10)

31 Buenas praacutecticas para la publicacioacuten de datos

REFERENCIAS

Bernadette Farias Loacutescio Caroline Burle Newton Calegari W3C Data on the Web Best

Practices 31 de enero de 2017 W3C Recommendation URL httpswwww3orgTRdwbp

Bernadette Hyland Ghislain Auguste Atemezing Boris Villazoacuten-Terrazas W3C Best Practices

for Publishing Linked Data 9 de enero de 2014 W3C Note URL httpswwww3orgTRld-bp

Dan Brickley Libby Miller FOAF project FOAF Vocabulary Specification 099 (Paddington

Edition) 14 de enero de 2014 URL httpxmlnscomfoafspec

Dublin Core metadata initiative DCMI Metadata Terms 14 de junio de 2012 DCMI

Recommendation URL httpdublincoreorgdocumentsdcmi-terms

Fadi Maali John Erickson W3C Data Catalog Vocabulary (DCAT) 16 de enero de 2014 W3C

Recommendation URL httpswwww3orgTRvocab-dcat

ISO 19115-12014 (E) Geographic information ndash Metadata Part1 Fundamentals 01 de abril de

2014 International Standard

ISO 191262009 (E) Geographic information -- Feature concept dictionaries and registers

noviembre de 2009 International Standard

ISO 191572013 (E) Geographic information ndash Data quality 15 de diciembre de 2013

International Standard

Jeremy Tandy Payam Barnaghi Linda van den Brink W3C Spatial Data on the Web Best

Practices 5 de enero 2017 W3C Note URL httpswwww3orgTRsdw-bp

T Berners-Lee R Fielding L Masinter IETF Uniform Resource Identifier (URI) Generic Syntax

Enero de 2005 Internet Standard URL httpstoolsietforghtmlrfc3986

World Wide Web Foundation Open Data Barometer URL httpopendatabarometerorg

W3C OWL Working Group W3C OWL 2 Web Ontology Language Document Overview (Second

Edition) 11 de diciembre de 2012 W3C Recommendation URL httpswwww3orgTRowl2-

overview

W3org Semantic Web - W3C URL httpswwww3orgstandardssemanticweb Consultado

el 12 de septiembre de 2018

Page 15: PARA LA PUBLICACIÓN DE DATOSideca.gov.co/.../files/documentacion/buenaspracticaspublicaciondat… · La obtención de datos la realiza cada entidad en el desarrollo de sus actividades

15 Buenas praacutecticas para la publicacioacuten de datos

4 Anonimizar los datos de caraacutecter personal informacioacuten estadiacutestica informacioacuten indirectamente identificable e informacioacuten sensible o confidencial

Anonimizar es el proceso que impide la identificacioacuten de las unidades de estudio que son fuente

para los registros individuales de un conjunto8 de datos o maacutes claro es la aplicacioacuten de teacutecnicas

que permitan expresar un dato relativo a personas eliminando la referencia a su identidad9

Baacutesicamente lo que se busca es reducir los riesgos en el uso y procesamiento de datos

personales evitar la extraccioacuten de registros que identifican a una persona reducir la

combinacioacuten de dos o maacutes registros en una o varias bases de datos para identificar a una

persona y minimizar la deduccioacuten de datos personales partir de uno o varios datos publicados

iquestQueacute informacioacuten debo prioritariamente anonimizar

Datos personales Informacioacuten numeacuterica alfabeacutetica graacutefica fotograacutefica acuacutestica o

cualquier otro tipo susceptible de recogida registro tratamiento y transmisioacuten

concerniente a personas fiacutesicas identificadas o identificables (tales como nombre

apellidos estado civil sexo edad domicilio identificacioacuten personal nuacutemero de

teleacutefono etc)10

Informacioacuten sensible Informacioacuten considerada como estrictamente confidencial

Informacioacuten y caracteriacutesticas referentes a la edad procedencia salud raza religioacuten

ideologiacutea afiliacioacuten finanzas etc se consideran de caraacutecter sensible y requieren de

una proteccioacuten especial11

iquestQueacute logro

Garantizar que mis datos publicados cuentan con medidas de proteccioacuten de datos

personales

Eliminar de manera efectiva el riesgo de re-identificacioacuten

Evitar que el procesamiento de mis datos tenga consecuencias negativas para alguna

persona

Disponer muchos maacutes datos sin invadir la informacioacuten personal

iexclRecomendaciones

Implemente actividades de proteccioacuten de la privacidad de los datos personales antes

de publicarlos

Elimine cualquier identificador directo de la persona (nombre documento de

identidad etc)

8 httpswwwdanegovcofilessenlineamientosDSO_020_LIN_08pdf 9 httpdleraeesid=2jjMiRi 10 httpswwwdanegovcofilessenlineamientosDSO_020_LIN_08pdf 11 Ibidem

16 Buenas praacutecticas para la publicacioacuten de datos

Reemplace los identificadores directos por coacutedigos de referencia pseudoacutenimos

(algoritmos AES12 o un hash cifrado HMAC13) coacutedigos arbitrarios o aleatorios

Si reemplazando el identificador directo auacuten es faacutecil identificar a la persona elimine el

dato

Clasifique yo categorice los datos

Redondee los datos numeacutericos hacia arriba o hacia abajo

Evaluacutee antes durante y despueacutes de publicados los datos si la anonimizacioacuten de sus

datos es suficiente y evaluacutee regularmente los riesgos existentes

Para maacutes informacioacuten consulte los Lineamientos para la Anonimizacioacuten de micro datos

Ejemplo 1

Antes de publicar sus datos retire el identificador directo de la persona En este caso

reemplace en nuacutemero de documento que identifica al usuario y reemplaacutecelo por un

consecutivo

Usuario Beneficio Usuario Beneficio

80123456 Subsidio de vivienda Usuario 1 Subsidio de vivienda

51123456 Subsidio de alimentacioacuten Usuario 2 Subsidio de alimentacioacuten

19123456 Subsidio al adulto mayor Usuario 3 Subsidio al adulto mayor

53123456 Subsidio de desempleo Usuario 4 Subsidio de desempleo

Ejemplo 2

Clasifique o categorice sus datos En este ejemplo asigne rangos a la edad de manera tal que el

titular del registro no sea identificable por este dato

Usuario Edad Usuario Rango de edad

Usuario 1 11 antildeos Usuario 1 Entre 10 y 15 antildeos

Usuario 2 22 antildeos Usuario 2 Entre 20 y 25 antildeos

Usuario 3 36 antildeos Usuario 3 Entre 35 y 40 antildeos

Usuario 4 63 antildeos Usuario 4 Entre 60 y 65 antildeos

12 Advanced Encryption Standard puede consultar como ha sido implementado este algoritmo en httpsrevistasudistritaleducoojsindexphpTecnuraarticleview72368892 13 Hash-based Message Authentication Code puede consultar como se crea este cifrado en httpsdocsoraclecomcdE19253-01819-7804wanboottasks2-51indexhtml

17 Buenas praacutecticas para la publicacioacuten de datos

5 Publicar los datos en formatos estaacutendar reutilizables y legibles por aplicaciones informaacuteticas

Un formato puede ser definido como la estructura de un disco dividido en campos y pistas

seguacuten un determinado sistema operativo lo que permite almacenar en eacutel informacioacuten14

baacutesicamente es la forma en que se codifican los datos en un archivo informaacutetico

Actualmente conocemos formatos comunes de almacenamiento como el doc una extensioacuten

de Word que almacena texto y cuyo propietario es la compantildeiacutea Microsoft Pero iquestqueacute pasa si un

usuario quiere abrir un documento doc en un procesador de texto diferente a Word

difiacutecilmente va a poder conocer el contenido de dicho documento sin tener esta licencia

Lo que queremos lograr con la implementacioacuten de esta praacutectica es que todos los usuarios que

encuentren mis datos puedan accederlos sin necesidad de contar con un software o aplicacioacuten

informaacutetica especiacutefica

iquestQueacute logro

Que mis datos sean consultados utilizados y reutilizados por maacutes usuarios

Que mis datos sean maacutes interoperables y maacutes procesados

Que mis datos puedan ser extraiacutedos transformados y procesados por aplicaciones

informaacuteticas

Que mis datos puedan ser compartidos e intercambiados entre sistemas

Disminuir los costos y los tiempos en el uso y la transformacioacuten de mis datos

iexclRecomendaciones

Prefiera publicar su conjunto de datos en formatos abiertos o no propietario ya que

estos facilitan el uso re-uso y distribucioacuten de estos Se busca que un mayor nuacutemero de

aplicaciones informaacuteticas pueda extraer leer y transformar los datos generando mayor

uso y re-uso por los usuarios

Disponga sus datos en muacuteltiples formatos con el fin de incrementar el acceso a los

mismos Se busca que el mayor nuacutemero de usuarios pueda utilizar los datos sin tener

que transformarlos primero en su formato preferido

Utilice Web Services para mejorar el intercambio e interoperabilidad de los datos

publicados

14 httpdleraeessrvsearchm=30ampw=formato

18 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo 1

A continuacioacuten encontraraacute extensiones de formato propietario y no propietario prefiera para

la publicacioacuten de sus datos las extensiones de la derecha

FORMATO PROPIETARIO FORMATO NO PROPIETARIO

DOC GDB TXT ASCII Grid KML RDF

XLS DWG CSV GeoJSON DXF XML

PPT SHP JSON GML ODF

Ejemplo 2

Si no fue posible utilizar una extensioacuten de formato no propietario publique sus datos en una

variedad de formatos que le permita al usuario acceder a los datos desde diferentes

aplicaciones informaacuteticas

Ejemplo 3

Para publicar sus datos conozca diferentes tipos de Web Services que viajan en la red utilizando extensiones XML

SOAP httpswwww3orgTRsoap

REST httprestelksteinorg

WMS httpwwwopengeospatialorgstandardswms

WFS httpwwwopengeospatialorgstandardswfs

WCS httpwwwopengeospatialorgstandardswcs

19 Buenas praacutecticas para la publicacioacuten de datos

6 Proporcionar un diccionario de datos que facilite el uso e interpretacioacuten de los datos publicados

Un diccionario estaacute definido como un repertorio en forma de libro o en soporte electroacutenico en el

que se recogen seguacuten un orden determinado las palabras o expresiones de una o maacutes lenguas

o de una materia concreta acompantildeadas de su definicioacuten equivalencia o explicacioacuten15

especiacuteficamente en un diccionario de datos se encuentran los conceptos de los datos y sus

propiedades (atributos dominios asociaciones y operaciones) acompantildeados de una definicioacuten

en donde se identifica el propoacutesito alcance y campo de aplicacioacuten del dato publicado

Lograr que los usuarios de mis datos entiendan la informacioacuten que estaacute publicada le permitiraacute

decidir si satisfacen o no su necesidad y le facilitaraacute la decisioacuten para explotar lo datos

Para maacutes informacioacuten consulte el Instructivo Diccionario de Datos

iquestQueacute logro

Que mis datos sean consultados utilizados y reutilizados por maacutes usuarios

Que se eviten ambiguumledades en la interpretacioacuten de mis datos

Que mis datos publicados esteacuten unificados y consistentes

Que los usuarios comprendan mejor y dispongan de claridad sobre los conceptos de

mis datos

iexclRecomendaciones

Publique como miacutenimo un diccionario de datos que contenga la caracterizacioacuten del

conjunto de datos producidos por su entidad

Cree el diccionario de datos teniendo en cuenta como miacutenimo la siguiente informacioacuten

Nombre del atributo Nombre que identifica de manera clara un atributo

Definicioacuten Descripcioacuten del atributo

Tipo de dato Tipo de valor del atributo

Unidad de medida Expresa la unidad de medida del atributo

Dominio Determina si el atributo tiene asociado un dominio

15 httpdleraeesw=diccionario

20 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo

Para el conjunto de datos ldquoEstablecimientos Educativos en Bogotaacuterdquo publicariacuteamos un

diccionario de datos similar al siguiente

Nombre del atributo Definicioacuten Tipo de dato

Unidad de Medida

Dominio

Coacutedigo del establecimiento

Coacutedigo DANE asignado al Institucioacuten Educativa Decimal

Nombre del establecimiento

Nombre de la Institucioacuten Educativa Cadena de Caracteres

Aacuterea construida del establecimiento

Aacuterea construida de la Institucioacuten Educativa Decimal Metros

cuadrados

Sector

Clasificacioacuten asignada seguacuten la naturaleza juriacutedica la cual define las principales caracteriacutesticas que desde lo juriacutedico - administrativo y tiene que ver con el origen de su creacioacuten

Entero

EESector

No podriacuteamos olvidar detallar el dominio asociado

Atributo Nombre del Dominio Coacutedigo Definicioacuten

EESector

Oficial 1

Es una institucioacuten donde su naturaleza de servicio puacuteblico cultural y su funcioacuten social le es inherente cumpliendo con las disposiciones legales y estatutarias que las rigen donde sus rentas se conservan y se aplican debidamente

Privado 2

Es una institucioacuten constituida como persona juriacutedica de utilidad comuacuten donde sus rentas se conservan y se aplican debidamente y que en todo lo esencial se cumple con la voluntad de sus fundadores

21 Buenas praacutecticas para la publicacioacuten de datos

7 Acompantildear la publicacioacuten de los datos con enlaces a otros recursos

Un enlace es definido como una secuencia de caracteres que se utiliza como direccioacuten para

acceder a informacioacuten adicional16 maacutes sencillo puede definirse como una expresioacuten que

conecta una cierta informacioacuten con otra17Ahora bien un recurso se puede entender como

cualquier medio que satisfaga una necesidad por ejemplo datos servicios documentos o

software

En teacuterminos generales se sugiere que para facilitar al usuario la comprensioacuten de los datos

publicados se proporcionen recursos o documentos adicionales que puedan ser consultados

yo descargados traveacutes de enlaces o links de otro sitio Web

Dentro de los recursos adicionales que pueden publicarse para acompantildear el dato estaacuten los

procedimientos de captura del dato los cataacutelogos de objetos las especificaciones teacutecnicas los

documentos normativos los cataacutelogos de simbologiacutea los reportes de evaluacioacuten de calidad

entre otros

iquestQueacute logro

Mejorar la consulta utilizacioacuten y reutilizacioacuten de mis datos

Que los usuarios comprendan mejor mis datos

Que mis datos sean compartidos e intercambiados por un mayor nuacutemero de usuarios

iexclRecomendaciones

Disponga informacioacuten adicional de sus datos que le permita a los usuarios ampliar el

horizonte de las aplicaciones y funcionalidades en las que pueda utilizar y explotar del

dato

No olvide vincular o registrar esta informacioacuten en el metadato

16 httpdleraeesid=FTVRKyj 17 httpssistemascomenlacephp

22 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo 1

El ldquoMapa de Referencia para Bogotaacuterdquo publicado en httpswwwidecagovcoesserviciosmapa-de-referencia tiene publicados varios enlaces a otros recursos

Especificacioacuten teacutecnica para la elaboracioacuten del Mapa de Referencia para Bogotaacute DC V0318

Cataacutelogo de Objetos del Mapa de Referencia de Bogotaacute DC V 57

Cataacutelogo de Representacioacuten del Mapa de Referencia de Bogotaacute DC V30

Reporte de evaluacioacuten de calidad generado al Mapa de Referencia del Distrito Capital V1217

Ejemplo 2

La informacioacuten de los ldquohumedales de Bogotaacuterdquo publicada en

httpambientebogotagovcowebsdahumedales tiene publicados enlaces a otros recursos

o Gestioacuten de los humedales

o Poliacutetica de Humedales del Distrito Capital

o Normatividad

o Planes de Manejo Ambiental

o Comiteacute distrital de humedales documentos de consulta normatividad

23 Buenas praacutecticas para la publicacioacuten de datos

8 Depurar sus datos antes de publicarlos para garantizar su calidad y aumentar su confianza

La calidad estaacute definida como el conjunto de propiedades inherentes a algo que permiten

juzgar su valor18 para el caso que nos concierne este algo hace referencia al dato publicado

Ahora bien la calidad tambieacuten es entendida como la capacidad del dato publicado para

satisfacer los requerimientos y las necesidades de los usuarios respetando una serie de normas

y especificaciones establecidas

Actualmente existen muacuteltiples elementos de calidad de los datos que identifican las cualidades

de estos sin embargo en este aparte citaremos los elementos principales que usted o su

entidad deben tener en cuenta para publicar sus datos con un estaacutendar miacutenimo de calidad

Para maacutes informacioacuten consulte el Procedimiento para evaluar y reportar la calidad de

los datos espaciales

iquestQueacute logro

Que mis datos sean consultados utilizados y reutilizados por maacutes usuarios

Que los usuarios hablen bien de mis datos

Que mis datos sean maacutes interoperables y maacutes procesados

Que mis datos sean maacutes compartidos

Que mis datos sean maacutes confiables

Recomendacioacuten 1

Establezca si dentro de su conjunto de datos existen capos vaciacuteos o nulos con informacioacuten

descontextualizada sobrante o duplicada Si existen compleacutetelos o elimiacutenelos seguacuten

corresponda antes de la publicacioacuten El elemento de calidad asociado se denomina ldquototalidadrdquo

Localidad Atendidos Localidad Atendidos

Suba 200 Suba 200

Suba 200 Tunjuelito 500

Ameacutericas 100

850

Tunjuelito 500

18 httpdleraeesid=6nVpk8P|6nXVL1Z

Campo duplicado

Campo inconsistente

Campo vaciacuteo

24 Buenas praacutecticas para la publicacioacuten de datos

Recomendacioacuten 2

Identifique y transforme si es necesario los datos que hayan sido registrados en un formato

diferente al establecido para su conjunto de datos Es decir estandarice el formato de salida

del dato que va a publicar El elemento de calidad asociado se denomina ldquoconsistencia de

formatordquo

Localidad Atendidos Localidad Atendidos

Suba 200 Suba 200

Tunjuelito 5008 Tunjuelito 500

Fontiboacuten 40 Fontiboacuten 430

Tunjuelito 500 Tunjuelito 500

Recomendacioacuten 3

Si sus datos tienen alguacuten tipo de clasificacioacuten o rangos previo a la publicacioacuten valide que estos

se hayan registrado correctamente El elemento de calidad asociado se denomina ldquoexactitud de

clasificacioacutenrdquo

Geacutenero Edad Rango de Edad Geacutenero Edad Rango de Edad

Femenino 5 0 lt Edad le 10 Femenino 5 0 lt Edad le 10

Masculino 15 0 lt Edad le 10 Masculino 15 10 lt Edad le 20

Femenino 35 40 lt Edad le 50 Femenino 35 30 lt Edad le 40

Recomendacioacuten 4

Si sus datos representan atributos cuantitativos verifique antes de la publicacioacuten que estos

correspondan a valores conocidos como verdaderos El elemento de calidad asociado se

denomina ldquoexactitud de atributos cuantitativosrdquo

Localidad Mes Temperatura Localidad Mes Temperatura

Chapinero Enero 7degC Chapinero Enero 7degC

Suba Agosto -15degC Suba Agosto 15degC

Tunjuelito Abril 60degC Tunjuelito Abril 16degC

Clasificacioacuten inconsistente

Formato inconsistente

Valor inconsistente

25 Buenas praacutecticas para la publicacioacuten de datos

Recomendacioacuten 5

Si los datos a publicar tienen asociadas fechas de captura o recoleccioacuten de informacioacuten (Por

ejemplo registro de incidentes registro de vacunacioacuten conteo de vehiacuteculos etc) valide que

las fechas registradas coincidan con la fecha del evento capturado El elemento de calidad

asociado se denomina ldquoexactitud de la medicioacuten del tiempordquo

Precipitacioacuten (mm) Fecha de registro Precipitacioacuten (mm) Fecha de registro

00 20580101 00 20180101

01 20180102 01 20180102

126 20510403 126 20180103

20 20180104 20 20180104

Recomendacioacuten 6

Cuando sus datos reflejen informacioacuten determinada por un orden de eventos garantice antes

de la publicacioacuten que este orden sea el adecuado El elemento de calidad asociado se

denomina ldquoconsistencia temporalrdquo

Usuario Escolaridad Periodo de Estudio Usuario Escolaridad Periodo de Estudio

Usuario 1 Preescolar 20030101 ndash 20051231 Usuario 1 Preescolar 20030101 ndash 20051231

Usuario 1 Primaria 20030101 ndash 20101231 Usuario 1 Primaria 20060101 ndash 20101231

Usuario 1 Secundaria 20060101 ndash 20163112 Usuario 1 Secundaria 20110101 ndash 20143112

Usuario 1 Media 20150101 - 20163112 Usuario 1 Media 20150101 - 20163112

Recomendacioacuten 7

Si sus datos incluyen alguna ubicacioacuten (direccioacuten lugar coordenadas) verifique que esta

corresponda a la ubicacioacuten real El elemento de calidad asociado se denomina ldquoexactitud

posicionalrdquo

Eventos Deportivos Lugar Eventos Deportivos Lugar

Evento 1 AK 30 25 90 Evento 1 AK 30 25 90

Evento 2 AC 63 215 20 Evento 2 Parque La Florida

Evento 3 Parque Simoacuten Boliacutevar Evento 3 Parque Simoacuten Boliacutevar

Fecha

inconsistente

Fechas no secuenciales

Lugar inexistente

26 Buenas praacutecticas para la publicacioacuten de datos

9 Incorporar el componente geograacutefico en los datos publicados para optimizar su comprensioacuten uso re-uso y visualizacioacuten

El espacio geograacutefico es un punto de la superficie terrestre que se vea afectado o que afecte de

alguna manera a la humanidad19 Este punto de la superficie puede ser la direccioacuten de una

institucioacuten educativa la ubicacioacuten de un centro de vacunacioacuten el lugar donde se miden las

variaciones de traacutensito en la ciudad los parques de Bogotaacute el edificio en donde se llevan a

cabo los traacutemites de una entidad etc

Los datos que usted captura o recolecta en su quehacer misional siempre estaacuten asociados a un

espacio geograacutefico por lo tanto este componente deberiacutea ser incluido en los datos publicados

Tenga en cuenta que el componente geograacutefico lo puede incorporar incluyendo una ubicacioacuten

asociada a una direccioacuten a un lugar a una localidad a un barrio al nombre de un

establecimiento puacuteblicamente reconocido o a cualquier punto que permita al usuario

identificar la localizacioacuten del dato publicado

iquestQueacute logro

Ampliar el espectro de usuarios que consultan utilizan y reutilizan mis datos

Que mis datos sean maacutes interoperables y maacutes procesados

Que mis datos sean puedan compartir en maacutes plataformas

Que los usuarios puedan visualizar mis datos en un mapa

iexclRecomendaciones

Disponga sus datos agregando un atributo de ubicacioacuten como direcciones coordenadas o

lugares geograacuteficos

Ejemplo 1

Incluya direcciones que permitan localizar espacialmente sus datos

Programa Direccioacuten

Registro de atencioacuten a la ciudadaniacutea CL 138 108 16

Centro de autocuidado KR 18 D 77 A 11 SUR

Familias con un nintildeo en cupos cofinanciados CL 70 A SUR 20 46

Centro de autocuidado KR 18 D 73 A 33 SUR

19 httpenciclopediabanrepculturalorgindexphptitle=Espacio_geogrC3A1fico

27 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo 2

Utilice coordenadas para indicar la ubicacioacuten de sus datos

EPS Coordenada X Coordenada Y

EPS Convida 9087496334 1051342164

Capital Salud EPS 986321006 954875808

EPS Famisanar 9742508812 8837031501

Aliansalud EPS 9716943356 9659706891

Salud Total EPS 9215624975 9625189518

Tenga en cuenta que para publicar datos con coordenadas tendraacute que incluir dentro

de su metadato el Sistema de referencia empleado

MAGNA ndash SIRGAS EPSG 4686 httpsepsgio4686

MAGNA ndash SIRGAS EPSG 3116 httpsepsgio3116

MAGNA ndash BOGOTAacute SR-ORG 7458 httpspatialreferenceorgrefsr-org7458

Ejemplo 3

Tambieacuten puede incluir lugares geograacuteficos descriptivos asiacute

Usuario Vacunado Lugar de Vacunacioacuten

Usuario 1 BOSQUE IZQUIERDO

Usuario 2 LAGUNITAS URBANO

Usuario 3 LA CAPUCHINA

Usuario 4 SAN JOSE SUR

Usuario 5 VENECIA

28 Buenas praacutecticas para la publicacioacuten de datos

10 Asignar un identificador uacutenico que permita aumentar la consulta uso e interoperabilidad del dato publicado

Considere un identificador uacutenico como un texto que permite identificar inequiacutevocamente el

dato publicado Si usted va a publicar un dato buscando que este sea reutilizado por los

usuarios y por su propia entidad asignar un identificador facilitaraacute el descubrimiento y la

citacioacuten del dato a traveacutes del tiempo independientemente del estado la disponibilidad o el

formato de este

En la vida cotidiana mediante la ceacutedula de ciudadaniacutea se asigna a cada ciudadano un nuacutemero

de identificacioacuten uacutenico y a traveacutes de este identificador el ciudadano es reconocido a lo largo de

su vida e incluso despueacutes de su muerte por otras personas yo autoridades En el mundo de la

informacioacuten cada dato deberiacutea viajar con un identificador uacutenico que le permita ser encontrado

y reconocido faacutecilmente entre los demaacutes datos

Ahora bien si usted o su entidad publican continuamente datos establecer un sistema de

identificacioacuten comuacuten le permitiraacute identificar raacutepidamente los datos y los haraacute comparables por

cualquier usuario de manera confiable Esta condicioacuten es previa para lograr una correcta

gestioacuten y reutilizacioacuten de sus datos

iquestQueacute logro

Ampliar el espectro de usuarios que consultan utilizan y reutilizan mis datos

Que mis datos sean maacutes interoperables y maacutes procesados

Que mis datos sean compartidos en maacutes plataformas

Que mis datos puedan vincularse a otros datos en el entorno Web

Que mis datos sean encontrados usados y citados inequiacutevocamente

Garantizar y monitorear la reutilizacioacuten de mis datos

Reducir del uso erroacuteneo de mis datos

iexclRecomendaciones

Establezca un sistema de identificacioacuten comuacuten para los datos que va a publicar

Utilice siempre el identificador asignado para publicar sus datos

29 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo

IDECA ha dispuesto el Sistema de Registro de Iacutetems geograacuteficos

httpgeoitemsidecagovcogeoitemsano una herramienta web desarrollada para la

creacioacuten aprobacioacuten publicacioacuten y mantenimiento de iacutetems geograacuteficos que permite la

asignacioacuten concertada de identificadores y significados uacutenicos que contribuyen a la definicioacuten

de un lenguaje comuacuten para el desarrollo de nuevos sistema de informacioacuten en el Distrito

garantizando con ello su fiabilidad e interoperabilidad Adicionalmente permite almacenar

descripciones de la informacioacuten oficial producida e identificar su respectivo custodio jugando

asiacute un papel importante en el control y seguimiento de la produccioacuten de informacioacuten

geograacutefica

Este sistema asigna un identificador uacutenico a cada uno de los iacutetems creados Dentro de los iacutetems

publicados se reconoce el ID 65 como unidad de planeamiento y siempre que se hace

referencia a este objeto es suficiente nombrarlo asiacute para entender que se habla de ldquoUnidades

territoriales de anaacutelisis planeamiento y gestioacuten que tienen como propoacutesito definir y precisar el

planeamiento del suelo urbano de expansioacuten y ruralrdquo

30 Buenas praacutecticas para la publicacioacuten de datos

OBTENGA EL MAacuteS ALTO NIVEL EN PUBLICACIOacuteN DE DATOS

Hasta aquiacute hemos publicado las que consideramos como mejores praacutecticas de publicacioacuten de datos Ahora usted como publicador o como entidad debe evaluar si sus datos se estaacuten disponiendo con los maacutes altos y mejores estaacutendares de publicacioacuten

Lo invitamos a que valide en queacute nivel de publicacioacuten se encuentra su entidad teniendo en cuenta el siguiente listado

Nivel Baacutesico

En este nivel se encuentran aquellas entidades que publican sus datos en formatos estaacutendar y reutilizables (praacutectica 5) que integran a la publicacioacuten sus respectivos metadatos (praacutectica 1) y que acompantildean la publicacioacuten con una licencia asociada (praacutectica 2)

Nivel Intermedio

Este nivel lo alcanzan las entidades que superando el nivel baacutesico disponen un mayor volumen de informacioacuten gracias a que anonimizan sus datos (praacutectica 4) implementan medidas de calidad que aumentan la confianza en sus datos (praacutectica 8) incorporan el componente geograacutefico proporcionando valor agregado a sus datos (praacutectica 9) y publican un diccionario de datos que facilita la interpretacioacuten de los datos publicados (praacutectica 6)

Nivel Avanzado

Las entidades que superando el nivel intermedio utilizan vocabularios estandarizados en sus nuevas publicaciones (praacutectica 3) acompantildean la publicacioacuten de sus datos con enlaces a otros recursos (praacutectica 7) y asignan un identificador uacutenico para dato logrando asiacute aumentar su descubrimiento y reutilizacioacuten (praacutectica 10)

31 Buenas praacutecticas para la publicacioacuten de datos

REFERENCIAS

Bernadette Farias Loacutescio Caroline Burle Newton Calegari W3C Data on the Web Best

Practices 31 de enero de 2017 W3C Recommendation URL httpswwww3orgTRdwbp

Bernadette Hyland Ghislain Auguste Atemezing Boris Villazoacuten-Terrazas W3C Best Practices

for Publishing Linked Data 9 de enero de 2014 W3C Note URL httpswwww3orgTRld-bp

Dan Brickley Libby Miller FOAF project FOAF Vocabulary Specification 099 (Paddington

Edition) 14 de enero de 2014 URL httpxmlnscomfoafspec

Dublin Core metadata initiative DCMI Metadata Terms 14 de junio de 2012 DCMI

Recommendation URL httpdublincoreorgdocumentsdcmi-terms

Fadi Maali John Erickson W3C Data Catalog Vocabulary (DCAT) 16 de enero de 2014 W3C

Recommendation URL httpswwww3orgTRvocab-dcat

ISO 19115-12014 (E) Geographic information ndash Metadata Part1 Fundamentals 01 de abril de

2014 International Standard

ISO 191262009 (E) Geographic information -- Feature concept dictionaries and registers

noviembre de 2009 International Standard

ISO 191572013 (E) Geographic information ndash Data quality 15 de diciembre de 2013

International Standard

Jeremy Tandy Payam Barnaghi Linda van den Brink W3C Spatial Data on the Web Best

Practices 5 de enero 2017 W3C Note URL httpswwww3orgTRsdw-bp

T Berners-Lee R Fielding L Masinter IETF Uniform Resource Identifier (URI) Generic Syntax

Enero de 2005 Internet Standard URL httpstoolsietforghtmlrfc3986

World Wide Web Foundation Open Data Barometer URL httpopendatabarometerorg

W3C OWL Working Group W3C OWL 2 Web Ontology Language Document Overview (Second

Edition) 11 de diciembre de 2012 W3C Recommendation URL httpswwww3orgTRowl2-

overview

W3org Semantic Web - W3C URL httpswwww3orgstandardssemanticweb Consultado

el 12 de septiembre de 2018

Page 16: PARA LA PUBLICACIÓN DE DATOSideca.gov.co/.../files/documentacion/buenaspracticaspublicaciondat… · La obtención de datos la realiza cada entidad en el desarrollo de sus actividades

16 Buenas praacutecticas para la publicacioacuten de datos

Reemplace los identificadores directos por coacutedigos de referencia pseudoacutenimos

(algoritmos AES12 o un hash cifrado HMAC13) coacutedigos arbitrarios o aleatorios

Si reemplazando el identificador directo auacuten es faacutecil identificar a la persona elimine el

dato

Clasifique yo categorice los datos

Redondee los datos numeacutericos hacia arriba o hacia abajo

Evaluacutee antes durante y despueacutes de publicados los datos si la anonimizacioacuten de sus

datos es suficiente y evaluacutee regularmente los riesgos existentes

Para maacutes informacioacuten consulte los Lineamientos para la Anonimizacioacuten de micro datos

Ejemplo 1

Antes de publicar sus datos retire el identificador directo de la persona En este caso

reemplace en nuacutemero de documento que identifica al usuario y reemplaacutecelo por un

consecutivo

Usuario Beneficio Usuario Beneficio

80123456 Subsidio de vivienda Usuario 1 Subsidio de vivienda

51123456 Subsidio de alimentacioacuten Usuario 2 Subsidio de alimentacioacuten

19123456 Subsidio al adulto mayor Usuario 3 Subsidio al adulto mayor

53123456 Subsidio de desempleo Usuario 4 Subsidio de desempleo

Ejemplo 2

Clasifique o categorice sus datos En este ejemplo asigne rangos a la edad de manera tal que el

titular del registro no sea identificable por este dato

Usuario Edad Usuario Rango de edad

Usuario 1 11 antildeos Usuario 1 Entre 10 y 15 antildeos

Usuario 2 22 antildeos Usuario 2 Entre 20 y 25 antildeos

Usuario 3 36 antildeos Usuario 3 Entre 35 y 40 antildeos

Usuario 4 63 antildeos Usuario 4 Entre 60 y 65 antildeos

12 Advanced Encryption Standard puede consultar como ha sido implementado este algoritmo en httpsrevistasudistritaleducoojsindexphpTecnuraarticleview72368892 13 Hash-based Message Authentication Code puede consultar como se crea este cifrado en httpsdocsoraclecomcdE19253-01819-7804wanboottasks2-51indexhtml

17 Buenas praacutecticas para la publicacioacuten de datos

5 Publicar los datos en formatos estaacutendar reutilizables y legibles por aplicaciones informaacuteticas

Un formato puede ser definido como la estructura de un disco dividido en campos y pistas

seguacuten un determinado sistema operativo lo que permite almacenar en eacutel informacioacuten14

baacutesicamente es la forma en que se codifican los datos en un archivo informaacutetico

Actualmente conocemos formatos comunes de almacenamiento como el doc una extensioacuten

de Word que almacena texto y cuyo propietario es la compantildeiacutea Microsoft Pero iquestqueacute pasa si un

usuario quiere abrir un documento doc en un procesador de texto diferente a Word

difiacutecilmente va a poder conocer el contenido de dicho documento sin tener esta licencia

Lo que queremos lograr con la implementacioacuten de esta praacutectica es que todos los usuarios que

encuentren mis datos puedan accederlos sin necesidad de contar con un software o aplicacioacuten

informaacutetica especiacutefica

iquestQueacute logro

Que mis datos sean consultados utilizados y reutilizados por maacutes usuarios

Que mis datos sean maacutes interoperables y maacutes procesados

Que mis datos puedan ser extraiacutedos transformados y procesados por aplicaciones

informaacuteticas

Que mis datos puedan ser compartidos e intercambiados entre sistemas

Disminuir los costos y los tiempos en el uso y la transformacioacuten de mis datos

iexclRecomendaciones

Prefiera publicar su conjunto de datos en formatos abiertos o no propietario ya que

estos facilitan el uso re-uso y distribucioacuten de estos Se busca que un mayor nuacutemero de

aplicaciones informaacuteticas pueda extraer leer y transformar los datos generando mayor

uso y re-uso por los usuarios

Disponga sus datos en muacuteltiples formatos con el fin de incrementar el acceso a los

mismos Se busca que el mayor nuacutemero de usuarios pueda utilizar los datos sin tener

que transformarlos primero en su formato preferido

Utilice Web Services para mejorar el intercambio e interoperabilidad de los datos

publicados

14 httpdleraeessrvsearchm=30ampw=formato

18 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo 1

A continuacioacuten encontraraacute extensiones de formato propietario y no propietario prefiera para

la publicacioacuten de sus datos las extensiones de la derecha

FORMATO PROPIETARIO FORMATO NO PROPIETARIO

DOC GDB TXT ASCII Grid KML RDF

XLS DWG CSV GeoJSON DXF XML

PPT SHP JSON GML ODF

Ejemplo 2

Si no fue posible utilizar una extensioacuten de formato no propietario publique sus datos en una

variedad de formatos que le permita al usuario acceder a los datos desde diferentes

aplicaciones informaacuteticas

Ejemplo 3

Para publicar sus datos conozca diferentes tipos de Web Services que viajan en la red utilizando extensiones XML

SOAP httpswwww3orgTRsoap

REST httprestelksteinorg

WMS httpwwwopengeospatialorgstandardswms

WFS httpwwwopengeospatialorgstandardswfs

WCS httpwwwopengeospatialorgstandardswcs

19 Buenas praacutecticas para la publicacioacuten de datos

6 Proporcionar un diccionario de datos que facilite el uso e interpretacioacuten de los datos publicados

Un diccionario estaacute definido como un repertorio en forma de libro o en soporte electroacutenico en el

que se recogen seguacuten un orden determinado las palabras o expresiones de una o maacutes lenguas

o de una materia concreta acompantildeadas de su definicioacuten equivalencia o explicacioacuten15

especiacuteficamente en un diccionario de datos se encuentran los conceptos de los datos y sus

propiedades (atributos dominios asociaciones y operaciones) acompantildeados de una definicioacuten

en donde se identifica el propoacutesito alcance y campo de aplicacioacuten del dato publicado

Lograr que los usuarios de mis datos entiendan la informacioacuten que estaacute publicada le permitiraacute

decidir si satisfacen o no su necesidad y le facilitaraacute la decisioacuten para explotar lo datos

Para maacutes informacioacuten consulte el Instructivo Diccionario de Datos

iquestQueacute logro

Que mis datos sean consultados utilizados y reutilizados por maacutes usuarios

Que se eviten ambiguumledades en la interpretacioacuten de mis datos

Que mis datos publicados esteacuten unificados y consistentes

Que los usuarios comprendan mejor y dispongan de claridad sobre los conceptos de

mis datos

iexclRecomendaciones

Publique como miacutenimo un diccionario de datos que contenga la caracterizacioacuten del

conjunto de datos producidos por su entidad

Cree el diccionario de datos teniendo en cuenta como miacutenimo la siguiente informacioacuten

Nombre del atributo Nombre que identifica de manera clara un atributo

Definicioacuten Descripcioacuten del atributo

Tipo de dato Tipo de valor del atributo

Unidad de medida Expresa la unidad de medida del atributo

Dominio Determina si el atributo tiene asociado un dominio

15 httpdleraeesw=diccionario

20 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo

Para el conjunto de datos ldquoEstablecimientos Educativos en Bogotaacuterdquo publicariacuteamos un

diccionario de datos similar al siguiente

Nombre del atributo Definicioacuten Tipo de dato

Unidad de Medida

Dominio

Coacutedigo del establecimiento

Coacutedigo DANE asignado al Institucioacuten Educativa Decimal

Nombre del establecimiento

Nombre de la Institucioacuten Educativa Cadena de Caracteres

Aacuterea construida del establecimiento

Aacuterea construida de la Institucioacuten Educativa Decimal Metros

cuadrados

Sector

Clasificacioacuten asignada seguacuten la naturaleza juriacutedica la cual define las principales caracteriacutesticas que desde lo juriacutedico - administrativo y tiene que ver con el origen de su creacioacuten

Entero

EESector

No podriacuteamos olvidar detallar el dominio asociado

Atributo Nombre del Dominio Coacutedigo Definicioacuten

EESector

Oficial 1

Es una institucioacuten donde su naturaleza de servicio puacuteblico cultural y su funcioacuten social le es inherente cumpliendo con las disposiciones legales y estatutarias que las rigen donde sus rentas se conservan y se aplican debidamente

Privado 2

Es una institucioacuten constituida como persona juriacutedica de utilidad comuacuten donde sus rentas se conservan y se aplican debidamente y que en todo lo esencial se cumple con la voluntad de sus fundadores

21 Buenas praacutecticas para la publicacioacuten de datos

7 Acompantildear la publicacioacuten de los datos con enlaces a otros recursos

Un enlace es definido como una secuencia de caracteres que se utiliza como direccioacuten para

acceder a informacioacuten adicional16 maacutes sencillo puede definirse como una expresioacuten que

conecta una cierta informacioacuten con otra17Ahora bien un recurso se puede entender como

cualquier medio que satisfaga una necesidad por ejemplo datos servicios documentos o

software

En teacuterminos generales se sugiere que para facilitar al usuario la comprensioacuten de los datos

publicados se proporcionen recursos o documentos adicionales que puedan ser consultados

yo descargados traveacutes de enlaces o links de otro sitio Web

Dentro de los recursos adicionales que pueden publicarse para acompantildear el dato estaacuten los

procedimientos de captura del dato los cataacutelogos de objetos las especificaciones teacutecnicas los

documentos normativos los cataacutelogos de simbologiacutea los reportes de evaluacioacuten de calidad

entre otros

iquestQueacute logro

Mejorar la consulta utilizacioacuten y reutilizacioacuten de mis datos

Que los usuarios comprendan mejor mis datos

Que mis datos sean compartidos e intercambiados por un mayor nuacutemero de usuarios

iexclRecomendaciones

Disponga informacioacuten adicional de sus datos que le permita a los usuarios ampliar el

horizonte de las aplicaciones y funcionalidades en las que pueda utilizar y explotar del

dato

No olvide vincular o registrar esta informacioacuten en el metadato

16 httpdleraeesid=FTVRKyj 17 httpssistemascomenlacephp

22 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo 1

El ldquoMapa de Referencia para Bogotaacuterdquo publicado en httpswwwidecagovcoesserviciosmapa-de-referencia tiene publicados varios enlaces a otros recursos

Especificacioacuten teacutecnica para la elaboracioacuten del Mapa de Referencia para Bogotaacute DC V0318

Cataacutelogo de Objetos del Mapa de Referencia de Bogotaacute DC V 57

Cataacutelogo de Representacioacuten del Mapa de Referencia de Bogotaacute DC V30

Reporte de evaluacioacuten de calidad generado al Mapa de Referencia del Distrito Capital V1217

Ejemplo 2

La informacioacuten de los ldquohumedales de Bogotaacuterdquo publicada en

httpambientebogotagovcowebsdahumedales tiene publicados enlaces a otros recursos

o Gestioacuten de los humedales

o Poliacutetica de Humedales del Distrito Capital

o Normatividad

o Planes de Manejo Ambiental

o Comiteacute distrital de humedales documentos de consulta normatividad

23 Buenas praacutecticas para la publicacioacuten de datos

8 Depurar sus datos antes de publicarlos para garantizar su calidad y aumentar su confianza

La calidad estaacute definida como el conjunto de propiedades inherentes a algo que permiten

juzgar su valor18 para el caso que nos concierne este algo hace referencia al dato publicado

Ahora bien la calidad tambieacuten es entendida como la capacidad del dato publicado para

satisfacer los requerimientos y las necesidades de los usuarios respetando una serie de normas

y especificaciones establecidas

Actualmente existen muacuteltiples elementos de calidad de los datos que identifican las cualidades

de estos sin embargo en este aparte citaremos los elementos principales que usted o su

entidad deben tener en cuenta para publicar sus datos con un estaacutendar miacutenimo de calidad

Para maacutes informacioacuten consulte el Procedimiento para evaluar y reportar la calidad de

los datos espaciales

iquestQueacute logro

Que mis datos sean consultados utilizados y reutilizados por maacutes usuarios

Que los usuarios hablen bien de mis datos

Que mis datos sean maacutes interoperables y maacutes procesados

Que mis datos sean maacutes compartidos

Que mis datos sean maacutes confiables

Recomendacioacuten 1

Establezca si dentro de su conjunto de datos existen capos vaciacuteos o nulos con informacioacuten

descontextualizada sobrante o duplicada Si existen compleacutetelos o elimiacutenelos seguacuten

corresponda antes de la publicacioacuten El elemento de calidad asociado se denomina ldquototalidadrdquo

Localidad Atendidos Localidad Atendidos

Suba 200 Suba 200

Suba 200 Tunjuelito 500

Ameacutericas 100

850

Tunjuelito 500

18 httpdleraeesid=6nVpk8P|6nXVL1Z

Campo duplicado

Campo inconsistente

Campo vaciacuteo

24 Buenas praacutecticas para la publicacioacuten de datos

Recomendacioacuten 2

Identifique y transforme si es necesario los datos que hayan sido registrados en un formato

diferente al establecido para su conjunto de datos Es decir estandarice el formato de salida

del dato que va a publicar El elemento de calidad asociado se denomina ldquoconsistencia de

formatordquo

Localidad Atendidos Localidad Atendidos

Suba 200 Suba 200

Tunjuelito 5008 Tunjuelito 500

Fontiboacuten 40 Fontiboacuten 430

Tunjuelito 500 Tunjuelito 500

Recomendacioacuten 3

Si sus datos tienen alguacuten tipo de clasificacioacuten o rangos previo a la publicacioacuten valide que estos

se hayan registrado correctamente El elemento de calidad asociado se denomina ldquoexactitud de

clasificacioacutenrdquo

Geacutenero Edad Rango de Edad Geacutenero Edad Rango de Edad

Femenino 5 0 lt Edad le 10 Femenino 5 0 lt Edad le 10

Masculino 15 0 lt Edad le 10 Masculino 15 10 lt Edad le 20

Femenino 35 40 lt Edad le 50 Femenino 35 30 lt Edad le 40

Recomendacioacuten 4

Si sus datos representan atributos cuantitativos verifique antes de la publicacioacuten que estos

correspondan a valores conocidos como verdaderos El elemento de calidad asociado se

denomina ldquoexactitud de atributos cuantitativosrdquo

Localidad Mes Temperatura Localidad Mes Temperatura

Chapinero Enero 7degC Chapinero Enero 7degC

Suba Agosto -15degC Suba Agosto 15degC

Tunjuelito Abril 60degC Tunjuelito Abril 16degC

Clasificacioacuten inconsistente

Formato inconsistente

Valor inconsistente

25 Buenas praacutecticas para la publicacioacuten de datos

Recomendacioacuten 5

Si los datos a publicar tienen asociadas fechas de captura o recoleccioacuten de informacioacuten (Por

ejemplo registro de incidentes registro de vacunacioacuten conteo de vehiacuteculos etc) valide que

las fechas registradas coincidan con la fecha del evento capturado El elemento de calidad

asociado se denomina ldquoexactitud de la medicioacuten del tiempordquo

Precipitacioacuten (mm) Fecha de registro Precipitacioacuten (mm) Fecha de registro

00 20580101 00 20180101

01 20180102 01 20180102

126 20510403 126 20180103

20 20180104 20 20180104

Recomendacioacuten 6

Cuando sus datos reflejen informacioacuten determinada por un orden de eventos garantice antes

de la publicacioacuten que este orden sea el adecuado El elemento de calidad asociado se

denomina ldquoconsistencia temporalrdquo

Usuario Escolaridad Periodo de Estudio Usuario Escolaridad Periodo de Estudio

Usuario 1 Preescolar 20030101 ndash 20051231 Usuario 1 Preescolar 20030101 ndash 20051231

Usuario 1 Primaria 20030101 ndash 20101231 Usuario 1 Primaria 20060101 ndash 20101231

Usuario 1 Secundaria 20060101 ndash 20163112 Usuario 1 Secundaria 20110101 ndash 20143112

Usuario 1 Media 20150101 - 20163112 Usuario 1 Media 20150101 - 20163112

Recomendacioacuten 7

Si sus datos incluyen alguna ubicacioacuten (direccioacuten lugar coordenadas) verifique que esta

corresponda a la ubicacioacuten real El elemento de calidad asociado se denomina ldquoexactitud

posicionalrdquo

Eventos Deportivos Lugar Eventos Deportivos Lugar

Evento 1 AK 30 25 90 Evento 1 AK 30 25 90

Evento 2 AC 63 215 20 Evento 2 Parque La Florida

Evento 3 Parque Simoacuten Boliacutevar Evento 3 Parque Simoacuten Boliacutevar

Fecha

inconsistente

Fechas no secuenciales

Lugar inexistente

26 Buenas praacutecticas para la publicacioacuten de datos

9 Incorporar el componente geograacutefico en los datos publicados para optimizar su comprensioacuten uso re-uso y visualizacioacuten

El espacio geograacutefico es un punto de la superficie terrestre que se vea afectado o que afecte de

alguna manera a la humanidad19 Este punto de la superficie puede ser la direccioacuten de una

institucioacuten educativa la ubicacioacuten de un centro de vacunacioacuten el lugar donde se miden las

variaciones de traacutensito en la ciudad los parques de Bogotaacute el edificio en donde se llevan a

cabo los traacutemites de una entidad etc

Los datos que usted captura o recolecta en su quehacer misional siempre estaacuten asociados a un

espacio geograacutefico por lo tanto este componente deberiacutea ser incluido en los datos publicados

Tenga en cuenta que el componente geograacutefico lo puede incorporar incluyendo una ubicacioacuten

asociada a una direccioacuten a un lugar a una localidad a un barrio al nombre de un

establecimiento puacuteblicamente reconocido o a cualquier punto que permita al usuario

identificar la localizacioacuten del dato publicado

iquestQueacute logro

Ampliar el espectro de usuarios que consultan utilizan y reutilizan mis datos

Que mis datos sean maacutes interoperables y maacutes procesados

Que mis datos sean puedan compartir en maacutes plataformas

Que los usuarios puedan visualizar mis datos en un mapa

iexclRecomendaciones

Disponga sus datos agregando un atributo de ubicacioacuten como direcciones coordenadas o

lugares geograacuteficos

Ejemplo 1

Incluya direcciones que permitan localizar espacialmente sus datos

Programa Direccioacuten

Registro de atencioacuten a la ciudadaniacutea CL 138 108 16

Centro de autocuidado KR 18 D 77 A 11 SUR

Familias con un nintildeo en cupos cofinanciados CL 70 A SUR 20 46

Centro de autocuidado KR 18 D 73 A 33 SUR

19 httpenciclopediabanrepculturalorgindexphptitle=Espacio_geogrC3A1fico

27 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo 2

Utilice coordenadas para indicar la ubicacioacuten de sus datos

EPS Coordenada X Coordenada Y

EPS Convida 9087496334 1051342164

Capital Salud EPS 986321006 954875808

EPS Famisanar 9742508812 8837031501

Aliansalud EPS 9716943356 9659706891

Salud Total EPS 9215624975 9625189518

Tenga en cuenta que para publicar datos con coordenadas tendraacute que incluir dentro

de su metadato el Sistema de referencia empleado

MAGNA ndash SIRGAS EPSG 4686 httpsepsgio4686

MAGNA ndash SIRGAS EPSG 3116 httpsepsgio3116

MAGNA ndash BOGOTAacute SR-ORG 7458 httpspatialreferenceorgrefsr-org7458

Ejemplo 3

Tambieacuten puede incluir lugares geograacuteficos descriptivos asiacute

Usuario Vacunado Lugar de Vacunacioacuten

Usuario 1 BOSQUE IZQUIERDO

Usuario 2 LAGUNITAS URBANO

Usuario 3 LA CAPUCHINA

Usuario 4 SAN JOSE SUR

Usuario 5 VENECIA

28 Buenas praacutecticas para la publicacioacuten de datos

10 Asignar un identificador uacutenico que permita aumentar la consulta uso e interoperabilidad del dato publicado

Considere un identificador uacutenico como un texto que permite identificar inequiacutevocamente el

dato publicado Si usted va a publicar un dato buscando que este sea reutilizado por los

usuarios y por su propia entidad asignar un identificador facilitaraacute el descubrimiento y la

citacioacuten del dato a traveacutes del tiempo independientemente del estado la disponibilidad o el

formato de este

En la vida cotidiana mediante la ceacutedula de ciudadaniacutea se asigna a cada ciudadano un nuacutemero

de identificacioacuten uacutenico y a traveacutes de este identificador el ciudadano es reconocido a lo largo de

su vida e incluso despueacutes de su muerte por otras personas yo autoridades En el mundo de la

informacioacuten cada dato deberiacutea viajar con un identificador uacutenico que le permita ser encontrado

y reconocido faacutecilmente entre los demaacutes datos

Ahora bien si usted o su entidad publican continuamente datos establecer un sistema de

identificacioacuten comuacuten le permitiraacute identificar raacutepidamente los datos y los haraacute comparables por

cualquier usuario de manera confiable Esta condicioacuten es previa para lograr una correcta

gestioacuten y reutilizacioacuten de sus datos

iquestQueacute logro

Ampliar el espectro de usuarios que consultan utilizan y reutilizan mis datos

Que mis datos sean maacutes interoperables y maacutes procesados

Que mis datos sean compartidos en maacutes plataformas

Que mis datos puedan vincularse a otros datos en el entorno Web

Que mis datos sean encontrados usados y citados inequiacutevocamente

Garantizar y monitorear la reutilizacioacuten de mis datos

Reducir del uso erroacuteneo de mis datos

iexclRecomendaciones

Establezca un sistema de identificacioacuten comuacuten para los datos que va a publicar

Utilice siempre el identificador asignado para publicar sus datos

29 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo

IDECA ha dispuesto el Sistema de Registro de Iacutetems geograacuteficos

httpgeoitemsidecagovcogeoitemsano una herramienta web desarrollada para la

creacioacuten aprobacioacuten publicacioacuten y mantenimiento de iacutetems geograacuteficos que permite la

asignacioacuten concertada de identificadores y significados uacutenicos que contribuyen a la definicioacuten

de un lenguaje comuacuten para el desarrollo de nuevos sistema de informacioacuten en el Distrito

garantizando con ello su fiabilidad e interoperabilidad Adicionalmente permite almacenar

descripciones de la informacioacuten oficial producida e identificar su respectivo custodio jugando

asiacute un papel importante en el control y seguimiento de la produccioacuten de informacioacuten

geograacutefica

Este sistema asigna un identificador uacutenico a cada uno de los iacutetems creados Dentro de los iacutetems

publicados se reconoce el ID 65 como unidad de planeamiento y siempre que se hace

referencia a este objeto es suficiente nombrarlo asiacute para entender que se habla de ldquoUnidades

territoriales de anaacutelisis planeamiento y gestioacuten que tienen como propoacutesito definir y precisar el

planeamiento del suelo urbano de expansioacuten y ruralrdquo

30 Buenas praacutecticas para la publicacioacuten de datos

OBTENGA EL MAacuteS ALTO NIVEL EN PUBLICACIOacuteN DE DATOS

Hasta aquiacute hemos publicado las que consideramos como mejores praacutecticas de publicacioacuten de datos Ahora usted como publicador o como entidad debe evaluar si sus datos se estaacuten disponiendo con los maacutes altos y mejores estaacutendares de publicacioacuten

Lo invitamos a que valide en queacute nivel de publicacioacuten se encuentra su entidad teniendo en cuenta el siguiente listado

Nivel Baacutesico

En este nivel se encuentran aquellas entidades que publican sus datos en formatos estaacutendar y reutilizables (praacutectica 5) que integran a la publicacioacuten sus respectivos metadatos (praacutectica 1) y que acompantildean la publicacioacuten con una licencia asociada (praacutectica 2)

Nivel Intermedio

Este nivel lo alcanzan las entidades que superando el nivel baacutesico disponen un mayor volumen de informacioacuten gracias a que anonimizan sus datos (praacutectica 4) implementan medidas de calidad que aumentan la confianza en sus datos (praacutectica 8) incorporan el componente geograacutefico proporcionando valor agregado a sus datos (praacutectica 9) y publican un diccionario de datos que facilita la interpretacioacuten de los datos publicados (praacutectica 6)

Nivel Avanzado

Las entidades que superando el nivel intermedio utilizan vocabularios estandarizados en sus nuevas publicaciones (praacutectica 3) acompantildean la publicacioacuten de sus datos con enlaces a otros recursos (praacutectica 7) y asignan un identificador uacutenico para dato logrando asiacute aumentar su descubrimiento y reutilizacioacuten (praacutectica 10)

31 Buenas praacutecticas para la publicacioacuten de datos

REFERENCIAS

Bernadette Farias Loacutescio Caroline Burle Newton Calegari W3C Data on the Web Best

Practices 31 de enero de 2017 W3C Recommendation URL httpswwww3orgTRdwbp

Bernadette Hyland Ghislain Auguste Atemezing Boris Villazoacuten-Terrazas W3C Best Practices

for Publishing Linked Data 9 de enero de 2014 W3C Note URL httpswwww3orgTRld-bp

Dan Brickley Libby Miller FOAF project FOAF Vocabulary Specification 099 (Paddington

Edition) 14 de enero de 2014 URL httpxmlnscomfoafspec

Dublin Core metadata initiative DCMI Metadata Terms 14 de junio de 2012 DCMI

Recommendation URL httpdublincoreorgdocumentsdcmi-terms

Fadi Maali John Erickson W3C Data Catalog Vocabulary (DCAT) 16 de enero de 2014 W3C

Recommendation URL httpswwww3orgTRvocab-dcat

ISO 19115-12014 (E) Geographic information ndash Metadata Part1 Fundamentals 01 de abril de

2014 International Standard

ISO 191262009 (E) Geographic information -- Feature concept dictionaries and registers

noviembre de 2009 International Standard

ISO 191572013 (E) Geographic information ndash Data quality 15 de diciembre de 2013

International Standard

Jeremy Tandy Payam Barnaghi Linda van den Brink W3C Spatial Data on the Web Best

Practices 5 de enero 2017 W3C Note URL httpswwww3orgTRsdw-bp

T Berners-Lee R Fielding L Masinter IETF Uniform Resource Identifier (URI) Generic Syntax

Enero de 2005 Internet Standard URL httpstoolsietforghtmlrfc3986

World Wide Web Foundation Open Data Barometer URL httpopendatabarometerorg

W3C OWL Working Group W3C OWL 2 Web Ontology Language Document Overview (Second

Edition) 11 de diciembre de 2012 W3C Recommendation URL httpswwww3orgTRowl2-

overview

W3org Semantic Web - W3C URL httpswwww3orgstandardssemanticweb Consultado

el 12 de septiembre de 2018

Page 17: PARA LA PUBLICACIÓN DE DATOSideca.gov.co/.../files/documentacion/buenaspracticaspublicaciondat… · La obtención de datos la realiza cada entidad en el desarrollo de sus actividades

17 Buenas praacutecticas para la publicacioacuten de datos

5 Publicar los datos en formatos estaacutendar reutilizables y legibles por aplicaciones informaacuteticas

Un formato puede ser definido como la estructura de un disco dividido en campos y pistas

seguacuten un determinado sistema operativo lo que permite almacenar en eacutel informacioacuten14

baacutesicamente es la forma en que se codifican los datos en un archivo informaacutetico

Actualmente conocemos formatos comunes de almacenamiento como el doc una extensioacuten

de Word que almacena texto y cuyo propietario es la compantildeiacutea Microsoft Pero iquestqueacute pasa si un

usuario quiere abrir un documento doc en un procesador de texto diferente a Word

difiacutecilmente va a poder conocer el contenido de dicho documento sin tener esta licencia

Lo que queremos lograr con la implementacioacuten de esta praacutectica es que todos los usuarios que

encuentren mis datos puedan accederlos sin necesidad de contar con un software o aplicacioacuten

informaacutetica especiacutefica

iquestQueacute logro

Que mis datos sean consultados utilizados y reutilizados por maacutes usuarios

Que mis datos sean maacutes interoperables y maacutes procesados

Que mis datos puedan ser extraiacutedos transformados y procesados por aplicaciones

informaacuteticas

Que mis datos puedan ser compartidos e intercambiados entre sistemas

Disminuir los costos y los tiempos en el uso y la transformacioacuten de mis datos

iexclRecomendaciones

Prefiera publicar su conjunto de datos en formatos abiertos o no propietario ya que

estos facilitan el uso re-uso y distribucioacuten de estos Se busca que un mayor nuacutemero de

aplicaciones informaacuteticas pueda extraer leer y transformar los datos generando mayor

uso y re-uso por los usuarios

Disponga sus datos en muacuteltiples formatos con el fin de incrementar el acceso a los

mismos Se busca que el mayor nuacutemero de usuarios pueda utilizar los datos sin tener

que transformarlos primero en su formato preferido

Utilice Web Services para mejorar el intercambio e interoperabilidad de los datos

publicados

14 httpdleraeessrvsearchm=30ampw=formato

18 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo 1

A continuacioacuten encontraraacute extensiones de formato propietario y no propietario prefiera para

la publicacioacuten de sus datos las extensiones de la derecha

FORMATO PROPIETARIO FORMATO NO PROPIETARIO

DOC GDB TXT ASCII Grid KML RDF

XLS DWG CSV GeoJSON DXF XML

PPT SHP JSON GML ODF

Ejemplo 2

Si no fue posible utilizar una extensioacuten de formato no propietario publique sus datos en una

variedad de formatos que le permita al usuario acceder a los datos desde diferentes

aplicaciones informaacuteticas

Ejemplo 3

Para publicar sus datos conozca diferentes tipos de Web Services que viajan en la red utilizando extensiones XML

SOAP httpswwww3orgTRsoap

REST httprestelksteinorg

WMS httpwwwopengeospatialorgstandardswms

WFS httpwwwopengeospatialorgstandardswfs

WCS httpwwwopengeospatialorgstandardswcs

19 Buenas praacutecticas para la publicacioacuten de datos

6 Proporcionar un diccionario de datos que facilite el uso e interpretacioacuten de los datos publicados

Un diccionario estaacute definido como un repertorio en forma de libro o en soporte electroacutenico en el

que se recogen seguacuten un orden determinado las palabras o expresiones de una o maacutes lenguas

o de una materia concreta acompantildeadas de su definicioacuten equivalencia o explicacioacuten15

especiacuteficamente en un diccionario de datos se encuentran los conceptos de los datos y sus

propiedades (atributos dominios asociaciones y operaciones) acompantildeados de una definicioacuten

en donde se identifica el propoacutesito alcance y campo de aplicacioacuten del dato publicado

Lograr que los usuarios de mis datos entiendan la informacioacuten que estaacute publicada le permitiraacute

decidir si satisfacen o no su necesidad y le facilitaraacute la decisioacuten para explotar lo datos

Para maacutes informacioacuten consulte el Instructivo Diccionario de Datos

iquestQueacute logro

Que mis datos sean consultados utilizados y reutilizados por maacutes usuarios

Que se eviten ambiguumledades en la interpretacioacuten de mis datos

Que mis datos publicados esteacuten unificados y consistentes

Que los usuarios comprendan mejor y dispongan de claridad sobre los conceptos de

mis datos

iexclRecomendaciones

Publique como miacutenimo un diccionario de datos que contenga la caracterizacioacuten del

conjunto de datos producidos por su entidad

Cree el diccionario de datos teniendo en cuenta como miacutenimo la siguiente informacioacuten

Nombre del atributo Nombre que identifica de manera clara un atributo

Definicioacuten Descripcioacuten del atributo

Tipo de dato Tipo de valor del atributo

Unidad de medida Expresa la unidad de medida del atributo

Dominio Determina si el atributo tiene asociado un dominio

15 httpdleraeesw=diccionario

20 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo

Para el conjunto de datos ldquoEstablecimientos Educativos en Bogotaacuterdquo publicariacuteamos un

diccionario de datos similar al siguiente

Nombre del atributo Definicioacuten Tipo de dato

Unidad de Medida

Dominio

Coacutedigo del establecimiento

Coacutedigo DANE asignado al Institucioacuten Educativa Decimal

Nombre del establecimiento

Nombre de la Institucioacuten Educativa Cadena de Caracteres

Aacuterea construida del establecimiento

Aacuterea construida de la Institucioacuten Educativa Decimal Metros

cuadrados

Sector

Clasificacioacuten asignada seguacuten la naturaleza juriacutedica la cual define las principales caracteriacutesticas que desde lo juriacutedico - administrativo y tiene que ver con el origen de su creacioacuten

Entero

EESector

No podriacuteamos olvidar detallar el dominio asociado

Atributo Nombre del Dominio Coacutedigo Definicioacuten

EESector

Oficial 1

Es una institucioacuten donde su naturaleza de servicio puacuteblico cultural y su funcioacuten social le es inherente cumpliendo con las disposiciones legales y estatutarias que las rigen donde sus rentas se conservan y se aplican debidamente

Privado 2

Es una institucioacuten constituida como persona juriacutedica de utilidad comuacuten donde sus rentas se conservan y se aplican debidamente y que en todo lo esencial se cumple con la voluntad de sus fundadores

21 Buenas praacutecticas para la publicacioacuten de datos

7 Acompantildear la publicacioacuten de los datos con enlaces a otros recursos

Un enlace es definido como una secuencia de caracteres que se utiliza como direccioacuten para

acceder a informacioacuten adicional16 maacutes sencillo puede definirse como una expresioacuten que

conecta una cierta informacioacuten con otra17Ahora bien un recurso se puede entender como

cualquier medio que satisfaga una necesidad por ejemplo datos servicios documentos o

software

En teacuterminos generales se sugiere que para facilitar al usuario la comprensioacuten de los datos

publicados se proporcionen recursos o documentos adicionales que puedan ser consultados

yo descargados traveacutes de enlaces o links de otro sitio Web

Dentro de los recursos adicionales que pueden publicarse para acompantildear el dato estaacuten los

procedimientos de captura del dato los cataacutelogos de objetos las especificaciones teacutecnicas los

documentos normativos los cataacutelogos de simbologiacutea los reportes de evaluacioacuten de calidad

entre otros

iquestQueacute logro

Mejorar la consulta utilizacioacuten y reutilizacioacuten de mis datos

Que los usuarios comprendan mejor mis datos

Que mis datos sean compartidos e intercambiados por un mayor nuacutemero de usuarios

iexclRecomendaciones

Disponga informacioacuten adicional de sus datos que le permita a los usuarios ampliar el

horizonte de las aplicaciones y funcionalidades en las que pueda utilizar y explotar del

dato

No olvide vincular o registrar esta informacioacuten en el metadato

16 httpdleraeesid=FTVRKyj 17 httpssistemascomenlacephp

22 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo 1

El ldquoMapa de Referencia para Bogotaacuterdquo publicado en httpswwwidecagovcoesserviciosmapa-de-referencia tiene publicados varios enlaces a otros recursos

Especificacioacuten teacutecnica para la elaboracioacuten del Mapa de Referencia para Bogotaacute DC V0318

Cataacutelogo de Objetos del Mapa de Referencia de Bogotaacute DC V 57

Cataacutelogo de Representacioacuten del Mapa de Referencia de Bogotaacute DC V30

Reporte de evaluacioacuten de calidad generado al Mapa de Referencia del Distrito Capital V1217

Ejemplo 2

La informacioacuten de los ldquohumedales de Bogotaacuterdquo publicada en

httpambientebogotagovcowebsdahumedales tiene publicados enlaces a otros recursos

o Gestioacuten de los humedales

o Poliacutetica de Humedales del Distrito Capital

o Normatividad

o Planes de Manejo Ambiental

o Comiteacute distrital de humedales documentos de consulta normatividad

23 Buenas praacutecticas para la publicacioacuten de datos

8 Depurar sus datos antes de publicarlos para garantizar su calidad y aumentar su confianza

La calidad estaacute definida como el conjunto de propiedades inherentes a algo que permiten

juzgar su valor18 para el caso que nos concierne este algo hace referencia al dato publicado

Ahora bien la calidad tambieacuten es entendida como la capacidad del dato publicado para

satisfacer los requerimientos y las necesidades de los usuarios respetando una serie de normas

y especificaciones establecidas

Actualmente existen muacuteltiples elementos de calidad de los datos que identifican las cualidades

de estos sin embargo en este aparte citaremos los elementos principales que usted o su

entidad deben tener en cuenta para publicar sus datos con un estaacutendar miacutenimo de calidad

Para maacutes informacioacuten consulte el Procedimiento para evaluar y reportar la calidad de

los datos espaciales

iquestQueacute logro

Que mis datos sean consultados utilizados y reutilizados por maacutes usuarios

Que los usuarios hablen bien de mis datos

Que mis datos sean maacutes interoperables y maacutes procesados

Que mis datos sean maacutes compartidos

Que mis datos sean maacutes confiables

Recomendacioacuten 1

Establezca si dentro de su conjunto de datos existen capos vaciacuteos o nulos con informacioacuten

descontextualizada sobrante o duplicada Si existen compleacutetelos o elimiacutenelos seguacuten

corresponda antes de la publicacioacuten El elemento de calidad asociado se denomina ldquototalidadrdquo

Localidad Atendidos Localidad Atendidos

Suba 200 Suba 200

Suba 200 Tunjuelito 500

Ameacutericas 100

850

Tunjuelito 500

18 httpdleraeesid=6nVpk8P|6nXVL1Z

Campo duplicado

Campo inconsistente

Campo vaciacuteo

24 Buenas praacutecticas para la publicacioacuten de datos

Recomendacioacuten 2

Identifique y transforme si es necesario los datos que hayan sido registrados en un formato

diferente al establecido para su conjunto de datos Es decir estandarice el formato de salida

del dato que va a publicar El elemento de calidad asociado se denomina ldquoconsistencia de

formatordquo

Localidad Atendidos Localidad Atendidos

Suba 200 Suba 200

Tunjuelito 5008 Tunjuelito 500

Fontiboacuten 40 Fontiboacuten 430

Tunjuelito 500 Tunjuelito 500

Recomendacioacuten 3

Si sus datos tienen alguacuten tipo de clasificacioacuten o rangos previo a la publicacioacuten valide que estos

se hayan registrado correctamente El elemento de calidad asociado se denomina ldquoexactitud de

clasificacioacutenrdquo

Geacutenero Edad Rango de Edad Geacutenero Edad Rango de Edad

Femenino 5 0 lt Edad le 10 Femenino 5 0 lt Edad le 10

Masculino 15 0 lt Edad le 10 Masculino 15 10 lt Edad le 20

Femenino 35 40 lt Edad le 50 Femenino 35 30 lt Edad le 40

Recomendacioacuten 4

Si sus datos representan atributos cuantitativos verifique antes de la publicacioacuten que estos

correspondan a valores conocidos como verdaderos El elemento de calidad asociado se

denomina ldquoexactitud de atributos cuantitativosrdquo

Localidad Mes Temperatura Localidad Mes Temperatura

Chapinero Enero 7degC Chapinero Enero 7degC

Suba Agosto -15degC Suba Agosto 15degC

Tunjuelito Abril 60degC Tunjuelito Abril 16degC

Clasificacioacuten inconsistente

Formato inconsistente

Valor inconsistente

25 Buenas praacutecticas para la publicacioacuten de datos

Recomendacioacuten 5

Si los datos a publicar tienen asociadas fechas de captura o recoleccioacuten de informacioacuten (Por

ejemplo registro de incidentes registro de vacunacioacuten conteo de vehiacuteculos etc) valide que

las fechas registradas coincidan con la fecha del evento capturado El elemento de calidad

asociado se denomina ldquoexactitud de la medicioacuten del tiempordquo

Precipitacioacuten (mm) Fecha de registro Precipitacioacuten (mm) Fecha de registro

00 20580101 00 20180101

01 20180102 01 20180102

126 20510403 126 20180103

20 20180104 20 20180104

Recomendacioacuten 6

Cuando sus datos reflejen informacioacuten determinada por un orden de eventos garantice antes

de la publicacioacuten que este orden sea el adecuado El elemento de calidad asociado se

denomina ldquoconsistencia temporalrdquo

Usuario Escolaridad Periodo de Estudio Usuario Escolaridad Periodo de Estudio

Usuario 1 Preescolar 20030101 ndash 20051231 Usuario 1 Preescolar 20030101 ndash 20051231

Usuario 1 Primaria 20030101 ndash 20101231 Usuario 1 Primaria 20060101 ndash 20101231

Usuario 1 Secundaria 20060101 ndash 20163112 Usuario 1 Secundaria 20110101 ndash 20143112

Usuario 1 Media 20150101 - 20163112 Usuario 1 Media 20150101 - 20163112

Recomendacioacuten 7

Si sus datos incluyen alguna ubicacioacuten (direccioacuten lugar coordenadas) verifique que esta

corresponda a la ubicacioacuten real El elemento de calidad asociado se denomina ldquoexactitud

posicionalrdquo

Eventos Deportivos Lugar Eventos Deportivos Lugar

Evento 1 AK 30 25 90 Evento 1 AK 30 25 90

Evento 2 AC 63 215 20 Evento 2 Parque La Florida

Evento 3 Parque Simoacuten Boliacutevar Evento 3 Parque Simoacuten Boliacutevar

Fecha

inconsistente

Fechas no secuenciales

Lugar inexistente

26 Buenas praacutecticas para la publicacioacuten de datos

9 Incorporar el componente geograacutefico en los datos publicados para optimizar su comprensioacuten uso re-uso y visualizacioacuten

El espacio geograacutefico es un punto de la superficie terrestre que se vea afectado o que afecte de

alguna manera a la humanidad19 Este punto de la superficie puede ser la direccioacuten de una

institucioacuten educativa la ubicacioacuten de un centro de vacunacioacuten el lugar donde se miden las

variaciones de traacutensito en la ciudad los parques de Bogotaacute el edificio en donde se llevan a

cabo los traacutemites de una entidad etc

Los datos que usted captura o recolecta en su quehacer misional siempre estaacuten asociados a un

espacio geograacutefico por lo tanto este componente deberiacutea ser incluido en los datos publicados

Tenga en cuenta que el componente geograacutefico lo puede incorporar incluyendo una ubicacioacuten

asociada a una direccioacuten a un lugar a una localidad a un barrio al nombre de un

establecimiento puacuteblicamente reconocido o a cualquier punto que permita al usuario

identificar la localizacioacuten del dato publicado

iquestQueacute logro

Ampliar el espectro de usuarios que consultan utilizan y reutilizan mis datos

Que mis datos sean maacutes interoperables y maacutes procesados

Que mis datos sean puedan compartir en maacutes plataformas

Que los usuarios puedan visualizar mis datos en un mapa

iexclRecomendaciones

Disponga sus datos agregando un atributo de ubicacioacuten como direcciones coordenadas o

lugares geograacuteficos

Ejemplo 1

Incluya direcciones que permitan localizar espacialmente sus datos

Programa Direccioacuten

Registro de atencioacuten a la ciudadaniacutea CL 138 108 16

Centro de autocuidado KR 18 D 77 A 11 SUR

Familias con un nintildeo en cupos cofinanciados CL 70 A SUR 20 46

Centro de autocuidado KR 18 D 73 A 33 SUR

19 httpenciclopediabanrepculturalorgindexphptitle=Espacio_geogrC3A1fico

27 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo 2

Utilice coordenadas para indicar la ubicacioacuten de sus datos

EPS Coordenada X Coordenada Y

EPS Convida 9087496334 1051342164

Capital Salud EPS 986321006 954875808

EPS Famisanar 9742508812 8837031501

Aliansalud EPS 9716943356 9659706891

Salud Total EPS 9215624975 9625189518

Tenga en cuenta que para publicar datos con coordenadas tendraacute que incluir dentro

de su metadato el Sistema de referencia empleado

MAGNA ndash SIRGAS EPSG 4686 httpsepsgio4686

MAGNA ndash SIRGAS EPSG 3116 httpsepsgio3116

MAGNA ndash BOGOTAacute SR-ORG 7458 httpspatialreferenceorgrefsr-org7458

Ejemplo 3

Tambieacuten puede incluir lugares geograacuteficos descriptivos asiacute

Usuario Vacunado Lugar de Vacunacioacuten

Usuario 1 BOSQUE IZQUIERDO

Usuario 2 LAGUNITAS URBANO

Usuario 3 LA CAPUCHINA

Usuario 4 SAN JOSE SUR

Usuario 5 VENECIA

28 Buenas praacutecticas para la publicacioacuten de datos

10 Asignar un identificador uacutenico que permita aumentar la consulta uso e interoperabilidad del dato publicado

Considere un identificador uacutenico como un texto que permite identificar inequiacutevocamente el

dato publicado Si usted va a publicar un dato buscando que este sea reutilizado por los

usuarios y por su propia entidad asignar un identificador facilitaraacute el descubrimiento y la

citacioacuten del dato a traveacutes del tiempo independientemente del estado la disponibilidad o el

formato de este

En la vida cotidiana mediante la ceacutedula de ciudadaniacutea se asigna a cada ciudadano un nuacutemero

de identificacioacuten uacutenico y a traveacutes de este identificador el ciudadano es reconocido a lo largo de

su vida e incluso despueacutes de su muerte por otras personas yo autoridades En el mundo de la

informacioacuten cada dato deberiacutea viajar con un identificador uacutenico que le permita ser encontrado

y reconocido faacutecilmente entre los demaacutes datos

Ahora bien si usted o su entidad publican continuamente datos establecer un sistema de

identificacioacuten comuacuten le permitiraacute identificar raacutepidamente los datos y los haraacute comparables por

cualquier usuario de manera confiable Esta condicioacuten es previa para lograr una correcta

gestioacuten y reutilizacioacuten de sus datos

iquestQueacute logro

Ampliar el espectro de usuarios que consultan utilizan y reutilizan mis datos

Que mis datos sean maacutes interoperables y maacutes procesados

Que mis datos sean compartidos en maacutes plataformas

Que mis datos puedan vincularse a otros datos en el entorno Web

Que mis datos sean encontrados usados y citados inequiacutevocamente

Garantizar y monitorear la reutilizacioacuten de mis datos

Reducir del uso erroacuteneo de mis datos

iexclRecomendaciones

Establezca un sistema de identificacioacuten comuacuten para los datos que va a publicar

Utilice siempre el identificador asignado para publicar sus datos

29 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo

IDECA ha dispuesto el Sistema de Registro de Iacutetems geograacuteficos

httpgeoitemsidecagovcogeoitemsano una herramienta web desarrollada para la

creacioacuten aprobacioacuten publicacioacuten y mantenimiento de iacutetems geograacuteficos que permite la

asignacioacuten concertada de identificadores y significados uacutenicos que contribuyen a la definicioacuten

de un lenguaje comuacuten para el desarrollo de nuevos sistema de informacioacuten en el Distrito

garantizando con ello su fiabilidad e interoperabilidad Adicionalmente permite almacenar

descripciones de la informacioacuten oficial producida e identificar su respectivo custodio jugando

asiacute un papel importante en el control y seguimiento de la produccioacuten de informacioacuten

geograacutefica

Este sistema asigna un identificador uacutenico a cada uno de los iacutetems creados Dentro de los iacutetems

publicados se reconoce el ID 65 como unidad de planeamiento y siempre que se hace

referencia a este objeto es suficiente nombrarlo asiacute para entender que se habla de ldquoUnidades

territoriales de anaacutelisis planeamiento y gestioacuten que tienen como propoacutesito definir y precisar el

planeamiento del suelo urbano de expansioacuten y ruralrdquo

30 Buenas praacutecticas para la publicacioacuten de datos

OBTENGA EL MAacuteS ALTO NIVEL EN PUBLICACIOacuteN DE DATOS

Hasta aquiacute hemos publicado las que consideramos como mejores praacutecticas de publicacioacuten de datos Ahora usted como publicador o como entidad debe evaluar si sus datos se estaacuten disponiendo con los maacutes altos y mejores estaacutendares de publicacioacuten

Lo invitamos a que valide en queacute nivel de publicacioacuten se encuentra su entidad teniendo en cuenta el siguiente listado

Nivel Baacutesico

En este nivel se encuentran aquellas entidades que publican sus datos en formatos estaacutendar y reutilizables (praacutectica 5) que integran a la publicacioacuten sus respectivos metadatos (praacutectica 1) y que acompantildean la publicacioacuten con una licencia asociada (praacutectica 2)

Nivel Intermedio

Este nivel lo alcanzan las entidades que superando el nivel baacutesico disponen un mayor volumen de informacioacuten gracias a que anonimizan sus datos (praacutectica 4) implementan medidas de calidad que aumentan la confianza en sus datos (praacutectica 8) incorporan el componente geograacutefico proporcionando valor agregado a sus datos (praacutectica 9) y publican un diccionario de datos que facilita la interpretacioacuten de los datos publicados (praacutectica 6)

Nivel Avanzado

Las entidades que superando el nivel intermedio utilizan vocabularios estandarizados en sus nuevas publicaciones (praacutectica 3) acompantildean la publicacioacuten de sus datos con enlaces a otros recursos (praacutectica 7) y asignan un identificador uacutenico para dato logrando asiacute aumentar su descubrimiento y reutilizacioacuten (praacutectica 10)

31 Buenas praacutecticas para la publicacioacuten de datos

REFERENCIAS

Bernadette Farias Loacutescio Caroline Burle Newton Calegari W3C Data on the Web Best

Practices 31 de enero de 2017 W3C Recommendation URL httpswwww3orgTRdwbp

Bernadette Hyland Ghislain Auguste Atemezing Boris Villazoacuten-Terrazas W3C Best Practices

for Publishing Linked Data 9 de enero de 2014 W3C Note URL httpswwww3orgTRld-bp

Dan Brickley Libby Miller FOAF project FOAF Vocabulary Specification 099 (Paddington

Edition) 14 de enero de 2014 URL httpxmlnscomfoafspec

Dublin Core metadata initiative DCMI Metadata Terms 14 de junio de 2012 DCMI

Recommendation URL httpdublincoreorgdocumentsdcmi-terms

Fadi Maali John Erickson W3C Data Catalog Vocabulary (DCAT) 16 de enero de 2014 W3C

Recommendation URL httpswwww3orgTRvocab-dcat

ISO 19115-12014 (E) Geographic information ndash Metadata Part1 Fundamentals 01 de abril de

2014 International Standard

ISO 191262009 (E) Geographic information -- Feature concept dictionaries and registers

noviembre de 2009 International Standard

ISO 191572013 (E) Geographic information ndash Data quality 15 de diciembre de 2013

International Standard

Jeremy Tandy Payam Barnaghi Linda van den Brink W3C Spatial Data on the Web Best

Practices 5 de enero 2017 W3C Note URL httpswwww3orgTRsdw-bp

T Berners-Lee R Fielding L Masinter IETF Uniform Resource Identifier (URI) Generic Syntax

Enero de 2005 Internet Standard URL httpstoolsietforghtmlrfc3986

World Wide Web Foundation Open Data Barometer URL httpopendatabarometerorg

W3C OWL Working Group W3C OWL 2 Web Ontology Language Document Overview (Second

Edition) 11 de diciembre de 2012 W3C Recommendation URL httpswwww3orgTRowl2-

overview

W3org Semantic Web - W3C URL httpswwww3orgstandardssemanticweb Consultado

el 12 de septiembre de 2018

Page 18: PARA LA PUBLICACIÓN DE DATOSideca.gov.co/.../files/documentacion/buenaspracticaspublicaciondat… · La obtención de datos la realiza cada entidad en el desarrollo de sus actividades

18 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo 1

A continuacioacuten encontraraacute extensiones de formato propietario y no propietario prefiera para

la publicacioacuten de sus datos las extensiones de la derecha

FORMATO PROPIETARIO FORMATO NO PROPIETARIO

DOC GDB TXT ASCII Grid KML RDF

XLS DWG CSV GeoJSON DXF XML

PPT SHP JSON GML ODF

Ejemplo 2

Si no fue posible utilizar una extensioacuten de formato no propietario publique sus datos en una

variedad de formatos que le permita al usuario acceder a los datos desde diferentes

aplicaciones informaacuteticas

Ejemplo 3

Para publicar sus datos conozca diferentes tipos de Web Services que viajan en la red utilizando extensiones XML

SOAP httpswwww3orgTRsoap

REST httprestelksteinorg

WMS httpwwwopengeospatialorgstandardswms

WFS httpwwwopengeospatialorgstandardswfs

WCS httpwwwopengeospatialorgstandardswcs

19 Buenas praacutecticas para la publicacioacuten de datos

6 Proporcionar un diccionario de datos que facilite el uso e interpretacioacuten de los datos publicados

Un diccionario estaacute definido como un repertorio en forma de libro o en soporte electroacutenico en el

que se recogen seguacuten un orden determinado las palabras o expresiones de una o maacutes lenguas

o de una materia concreta acompantildeadas de su definicioacuten equivalencia o explicacioacuten15

especiacuteficamente en un diccionario de datos se encuentran los conceptos de los datos y sus

propiedades (atributos dominios asociaciones y operaciones) acompantildeados de una definicioacuten

en donde se identifica el propoacutesito alcance y campo de aplicacioacuten del dato publicado

Lograr que los usuarios de mis datos entiendan la informacioacuten que estaacute publicada le permitiraacute

decidir si satisfacen o no su necesidad y le facilitaraacute la decisioacuten para explotar lo datos

Para maacutes informacioacuten consulte el Instructivo Diccionario de Datos

iquestQueacute logro

Que mis datos sean consultados utilizados y reutilizados por maacutes usuarios

Que se eviten ambiguumledades en la interpretacioacuten de mis datos

Que mis datos publicados esteacuten unificados y consistentes

Que los usuarios comprendan mejor y dispongan de claridad sobre los conceptos de

mis datos

iexclRecomendaciones

Publique como miacutenimo un diccionario de datos que contenga la caracterizacioacuten del

conjunto de datos producidos por su entidad

Cree el diccionario de datos teniendo en cuenta como miacutenimo la siguiente informacioacuten

Nombre del atributo Nombre que identifica de manera clara un atributo

Definicioacuten Descripcioacuten del atributo

Tipo de dato Tipo de valor del atributo

Unidad de medida Expresa la unidad de medida del atributo

Dominio Determina si el atributo tiene asociado un dominio

15 httpdleraeesw=diccionario

20 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo

Para el conjunto de datos ldquoEstablecimientos Educativos en Bogotaacuterdquo publicariacuteamos un

diccionario de datos similar al siguiente

Nombre del atributo Definicioacuten Tipo de dato

Unidad de Medida

Dominio

Coacutedigo del establecimiento

Coacutedigo DANE asignado al Institucioacuten Educativa Decimal

Nombre del establecimiento

Nombre de la Institucioacuten Educativa Cadena de Caracteres

Aacuterea construida del establecimiento

Aacuterea construida de la Institucioacuten Educativa Decimal Metros

cuadrados

Sector

Clasificacioacuten asignada seguacuten la naturaleza juriacutedica la cual define las principales caracteriacutesticas que desde lo juriacutedico - administrativo y tiene que ver con el origen de su creacioacuten

Entero

EESector

No podriacuteamos olvidar detallar el dominio asociado

Atributo Nombre del Dominio Coacutedigo Definicioacuten

EESector

Oficial 1

Es una institucioacuten donde su naturaleza de servicio puacuteblico cultural y su funcioacuten social le es inherente cumpliendo con las disposiciones legales y estatutarias que las rigen donde sus rentas se conservan y se aplican debidamente

Privado 2

Es una institucioacuten constituida como persona juriacutedica de utilidad comuacuten donde sus rentas se conservan y se aplican debidamente y que en todo lo esencial se cumple con la voluntad de sus fundadores

21 Buenas praacutecticas para la publicacioacuten de datos

7 Acompantildear la publicacioacuten de los datos con enlaces a otros recursos

Un enlace es definido como una secuencia de caracteres que se utiliza como direccioacuten para

acceder a informacioacuten adicional16 maacutes sencillo puede definirse como una expresioacuten que

conecta una cierta informacioacuten con otra17Ahora bien un recurso se puede entender como

cualquier medio que satisfaga una necesidad por ejemplo datos servicios documentos o

software

En teacuterminos generales se sugiere que para facilitar al usuario la comprensioacuten de los datos

publicados se proporcionen recursos o documentos adicionales que puedan ser consultados

yo descargados traveacutes de enlaces o links de otro sitio Web

Dentro de los recursos adicionales que pueden publicarse para acompantildear el dato estaacuten los

procedimientos de captura del dato los cataacutelogos de objetos las especificaciones teacutecnicas los

documentos normativos los cataacutelogos de simbologiacutea los reportes de evaluacioacuten de calidad

entre otros

iquestQueacute logro

Mejorar la consulta utilizacioacuten y reutilizacioacuten de mis datos

Que los usuarios comprendan mejor mis datos

Que mis datos sean compartidos e intercambiados por un mayor nuacutemero de usuarios

iexclRecomendaciones

Disponga informacioacuten adicional de sus datos que le permita a los usuarios ampliar el

horizonte de las aplicaciones y funcionalidades en las que pueda utilizar y explotar del

dato

No olvide vincular o registrar esta informacioacuten en el metadato

16 httpdleraeesid=FTVRKyj 17 httpssistemascomenlacephp

22 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo 1

El ldquoMapa de Referencia para Bogotaacuterdquo publicado en httpswwwidecagovcoesserviciosmapa-de-referencia tiene publicados varios enlaces a otros recursos

Especificacioacuten teacutecnica para la elaboracioacuten del Mapa de Referencia para Bogotaacute DC V0318

Cataacutelogo de Objetos del Mapa de Referencia de Bogotaacute DC V 57

Cataacutelogo de Representacioacuten del Mapa de Referencia de Bogotaacute DC V30

Reporte de evaluacioacuten de calidad generado al Mapa de Referencia del Distrito Capital V1217

Ejemplo 2

La informacioacuten de los ldquohumedales de Bogotaacuterdquo publicada en

httpambientebogotagovcowebsdahumedales tiene publicados enlaces a otros recursos

o Gestioacuten de los humedales

o Poliacutetica de Humedales del Distrito Capital

o Normatividad

o Planes de Manejo Ambiental

o Comiteacute distrital de humedales documentos de consulta normatividad

23 Buenas praacutecticas para la publicacioacuten de datos

8 Depurar sus datos antes de publicarlos para garantizar su calidad y aumentar su confianza

La calidad estaacute definida como el conjunto de propiedades inherentes a algo que permiten

juzgar su valor18 para el caso que nos concierne este algo hace referencia al dato publicado

Ahora bien la calidad tambieacuten es entendida como la capacidad del dato publicado para

satisfacer los requerimientos y las necesidades de los usuarios respetando una serie de normas

y especificaciones establecidas

Actualmente existen muacuteltiples elementos de calidad de los datos que identifican las cualidades

de estos sin embargo en este aparte citaremos los elementos principales que usted o su

entidad deben tener en cuenta para publicar sus datos con un estaacutendar miacutenimo de calidad

Para maacutes informacioacuten consulte el Procedimiento para evaluar y reportar la calidad de

los datos espaciales

iquestQueacute logro

Que mis datos sean consultados utilizados y reutilizados por maacutes usuarios

Que los usuarios hablen bien de mis datos

Que mis datos sean maacutes interoperables y maacutes procesados

Que mis datos sean maacutes compartidos

Que mis datos sean maacutes confiables

Recomendacioacuten 1

Establezca si dentro de su conjunto de datos existen capos vaciacuteos o nulos con informacioacuten

descontextualizada sobrante o duplicada Si existen compleacutetelos o elimiacutenelos seguacuten

corresponda antes de la publicacioacuten El elemento de calidad asociado se denomina ldquototalidadrdquo

Localidad Atendidos Localidad Atendidos

Suba 200 Suba 200

Suba 200 Tunjuelito 500

Ameacutericas 100

850

Tunjuelito 500

18 httpdleraeesid=6nVpk8P|6nXVL1Z

Campo duplicado

Campo inconsistente

Campo vaciacuteo

24 Buenas praacutecticas para la publicacioacuten de datos

Recomendacioacuten 2

Identifique y transforme si es necesario los datos que hayan sido registrados en un formato

diferente al establecido para su conjunto de datos Es decir estandarice el formato de salida

del dato que va a publicar El elemento de calidad asociado se denomina ldquoconsistencia de

formatordquo

Localidad Atendidos Localidad Atendidos

Suba 200 Suba 200

Tunjuelito 5008 Tunjuelito 500

Fontiboacuten 40 Fontiboacuten 430

Tunjuelito 500 Tunjuelito 500

Recomendacioacuten 3

Si sus datos tienen alguacuten tipo de clasificacioacuten o rangos previo a la publicacioacuten valide que estos

se hayan registrado correctamente El elemento de calidad asociado se denomina ldquoexactitud de

clasificacioacutenrdquo

Geacutenero Edad Rango de Edad Geacutenero Edad Rango de Edad

Femenino 5 0 lt Edad le 10 Femenino 5 0 lt Edad le 10

Masculino 15 0 lt Edad le 10 Masculino 15 10 lt Edad le 20

Femenino 35 40 lt Edad le 50 Femenino 35 30 lt Edad le 40

Recomendacioacuten 4

Si sus datos representan atributos cuantitativos verifique antes de la publicacioacuten que estos

correspondan a valores conocidos como verdaderos El elemento de calidad asociado se

denomina ldquoexactitud de atributos cuantitativosrdquo

Localidad Mes Temperatura Localidad Mes Temperatura

Chapinero Enero 7degC Chapinero Enero 7degC

Suba Agosto -15degC Suba Agosto 15degC

Tunjuelito Abril 60degC Tunjuelito Abril 16degC

Clasificacioacuten inconsistente

Formato inconsistente

Valor inconsistente

25 Buenas praacutecticas para la publicacioacuten de datos

Recomendacioacuten 5

Si los datos a publicar tienen asociadas fechas de captura o recoleccioacuten de informacioacuten (Por

ejemplo registro de incidentes registro de vacunacioacuten conteo de vehiacuteculos etc) valide que

las fechas registradas coincidan con la fecha del evento capturado El elemento de calidad

asociado se denomina ldquoexactitud de la medicioacuten del tiempordquo

Precipitacioacuten (mm) Fecha de registro Precipitacioacuten (mm) Fecha de registro

00 20580101 00 20180101

01 20180102 01 20180102

126 20510403 126 20180103

20 20180104 20 20180104

Recomendacioacuten 6

Cuando sus datos reflejen informacioacuten determinada por un orden de eventos garantice antes

de la publicacioacuten que este orden sea el adecuado El elemento de calidad asociado se

denomina ldquoconsistencia temporalrdquo

Usuario Escolaridad Periodo de Estudio Usuario Escolaridad Periodo de Estudio

Usuario 1 Preescolar 20030101 ndash 20051231 Usuario 1 Preescolar 20030101 ndash 20051231

Usuario 1 Primaria 20030101 ndash 20101231 Usuario 1 Primaria 20060101 ndash 20101231

Usuario 1 Secundaria 20060101 ndash 20163112 Usuario 1 Secundaria 20110101 ndash 20143112

Usuario 1 Media 20150101 - 20163112 Usuario 1 Media 20150101 - 20163112

Recomendacioacuten 7

Si sus datos incluyen alguna ubicacioacuten (direccioacuten lugar coordenadas) verifique que esta

corresponda a la ubicacioacuten real El elemento de calidad asociado se denomina ldquoexactitud

posicionalrdquo

Eventos Deportivos Lugar Eventos Deportivos Lugar

Evento 1 AK 30 25 90 Evento 1 AK 30 25 90

Evento 2 AC 63 215 20 Evento 2 Parque La Florida

Evento 3 Parque Simoacuten Boliacutevar Evento 3 Parque Simoacuten Boliacutevar

Fecha

inconsistente

Fechas no secuenciales

Lugar inexistente

26 Buenas praacutecticas para la publicacioacuten de datos

9 Incorporar el componente geograacutefico en los datos publicados para optimizar su comprensioacuten uso re-uso y visualizacioacuten

El espacio geograacutefico es un punto de la superficie terrestre que se vea afectado o que afecte de

alguna manera a la humanidad19 Este punto de la superficie puede ser la direccioacuten de una

institucioacuten educativa la ubicacioacuten de un centro de vacunacioacuten el lugar donde se miden las

variaciones de traacutensito en la ciudad los parques de Bogotaacute el edificio en donde se llevan a

cabo los traacutemites de una entidad etc

Los datos que usted captura o recolecta en su quehacer misional siempre estaacuten asociados a un

espacio geograacutefico por lo tanto este componente deberiacutea ser incluido en los datos publicados

Tenga en cuenta que el componente geograacutefico lo puede incorporar incluyendo una ubicacioacuten

asociada a una direccioacuten a un lugar a una localidad a un barrio al nombre de un

establecimiento puacuteblicamente reconocido o a cualquier punto que permita al usuario

identificar la localizacioacuten del dato publicado

iquestQueacute logro

Ampliar el espectro de usuarios que consultan utilizan y reutilizan mis datos

Que mis datos sean maacutes interoperables y maacutes procesados

Que mis datos sean puedan compartir en maacutes plataformas

Que los usuarios puedan visualizar mis datos en un mapa

iexclRecomendaciones

Disponga sus datos agregando un atributo de ubicacioacuten como direcciones coordenadas o

lugares geograacuteficos

Ejemplo 1

Incluya direcciones que permitan localizar espacialmente sus datos

Programa Direccioacuten

Registro de atencioacuten a la ciudadaniacutea CL 138 108 16

Centro de autocuidado KR 18 D 77 A 11 SUR

Familias con un nintildeo en cupos cofinanciados CL 70 A SUR 20 46

Centro de autocuidado KR 18 D 73 A 33 SUR

19 httpenciclopediabanrepculturalorgindexphptitle=Espacio_geogrC3A1fico

27 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo 2

Utilice coordenadas para indicar la ubicacioacuten de sus datos

EPS Coordenada X Coordenada Y

EPS Convida 9087496334 1051342164

Capital Salud EPS 986321006 954875808

EPS Famisanar 9742508812 8837031501

Aliansalud EPS 9716943356 9659706891

Salud Total EPS 9215624975 9625189518

Tenga en cuenta que para publicar datos con coordenadas tendraacute que incluir dentro

de su metadato el Sistema de referencia empleado

MAGNA ndash SIRGAS EPSG 4686 httpsepsgio4686

MAGNA ndash SIRGAS EPSG 3116 httpsepsgio3116

MAGNA ndash BOGOTAacute SR-ORG 7458 httpspatialreferenceorgrefsr-org7458

Ejemplo 3

Tambieacuten puede incluir lugares geograacuteficos descriptivos asiacute

Usuario Vacunado Lugar de Vacunacioacuten

Usuario 1 BOSQUE IZQUIERDO

Usuario 2 LAGUNITAS URBANO

Usuario 3 LA CAPUCHINA

Usuario 4 SAN JOSE SUR

Usuario 5 VENECIA

28 Buenas praacutecticas para la publicacioacuten de datos

10 Asignar un identificador uacutenico que permita aumentar la consulta uso e interoperabilidad del dato publicado

Considere un identificador uacutenico como un texto que permite identificar inequiacutevocamente el

dato publicado Si usted va a publicar un dato buscando que este sea reutilizado por los

usuarios y por su propia entidad asignar un identificador facilitaraacute el descubrimiento y la

citacioacuten del dato a traveacutes del tiempo independientemente del estado la disponibilidad o el

formato de este

En la vida cotidiana mediante la ceacutedula de ciudadaniacutea se asigna a cada ciudadano un nuacutemero

de identificacioacuten uacutenico y a traveacutes de este identificador el ciudadano es reconocido a lo largo de

su vida e incluso despueacutes de su muerte por otras personas yo autoridades En el mundo de la

informacioacuten cada dato deberiacutea viajar con un identificador uacutenico que le permita ser encontrado

y reconocido faacutecilmente entre los demaacutes datos

Ahora bien si usted o su entidad publican continuamente datos establecer un sistema de

identificacioacuten comuacuten le permitiraacute identificar raacutepidamente los datos y los haraacute comparables por

cualquier usuario de manera confiable Esta condicioacuten es previa para lograr una correcta

gestioacuten y reutilizacioacuten de sus datos

iquestQueacute logro

Ampliar el espectro de usuarios que consultan utilizan y reutilizan mis datos

Que mis datos sean maacutes interoperables y maacutes procesados

Que mis datos sean compartidos en maacutes plataformas

Que mis datos puedan vincularse a otros datos en el entorno Web

Que mis datos sean encontrados usados y citados inequiacutevocamente

Garantizar y monitorear la reutilizacioacuten de mis datos

Reducir del uso erroacuteneo de mis datos

iexclRecomendaciones

Establezca un sistema de identificacioacuten comuacuten para los datos que va a publicar

Utilice siempre el identificador asignado para publicar sus datos

29 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo

IDECA ha dispuesto el Sistema de Registro de Iacutetems geograacuteficos

httpgeoitemsidecagovcogeoitemsano una herramienta web desarrollada para la

creacioacuten aprobacioacuten publicacioacuten y mantenimiento de iacutetems geograacuteficos que permite la

asignacioacuten concertada de identificadores y significados uacutenicos que contribuyen a la definicioacuten

de un lenguaje comuacuten para el desarrollo de nuevos sistema de informacioacuten en el Distrito

garantizando con ello su fiabilidad e interoperabilidad Adicionalmente permite almacenar

descripciones de la informacioacuten oficial producida e identificar su respectivo custodio jugando

asiacute un papel importante en el control y seguimiento de la produccioacuten de informacioacuten

geograacutefica

Este sistema asigna un identificador uacutenico a cada uno de los iacutetems creados Dentro de los iacutetems

publicados se reconoce el ID 65 como unidad de planeamiento y siempre que se hace

referencia a este objeto es suficiente nombrarlo asiacute para entender que se habla de ldquoUnidades

territoriales de anaacutelisis planeamiento y gestioacuten que tienen como propoacutesito definir y precisar el

planeamiento del suelo urbano de expansioacuten y ruralrdquo

30 Buenas praacutecticas para la publicacioacuten de datos

OBTENGA EL MAacuteS ALTO NIVEL EN PUBLICACIOacuteN DE DATOS

Hasta aquiacute hemos publicado las que consideramos como mejores praacutecticas de publicacioacuten de datos Ahora usted como publicador o como entidad debe evaluar si sus datos se estaacuten disponiendo con los maacutes altos y mejores estaacutendares de publicacioacuten

Lo invitamos a que valide en queacute nivel de publicacioacuten se encuentra su entidad teniendo en cuenta el siguiente listado

Nivel Baacutesico

En este nivel se encuentran aquellas entidades que publican sus datos en formatos estaacutendar y reutilizables (praacutectica 5) que integran a la publicacioacuten sus respectivos metadatos (praacutectica 1) y que acompantildean la publicacioacuten con una licencia asociada (praacutectica 2)

Nivel Intermedio

Este nivel lo alcanzan las entidades que superando el nivel baacutesico disponen un mayor volumen de informacioacuten gracias a que anonimizan sus datos (praacutectica 4) implementan medidas de calidad que aumentan la confianza en sus datos (praacutectica 8) incorporan el componente geograacutefico proporcionando valor agregado a sus datos (praacutectica 9) y publican un diccionario de datos que facilita la interpretacioacuten de los datos publicados (praacutectica 6)

Nivel Avanzado

Las entidades que superando el nivel intermedio utilizan vocabularios estandarizados en sus nuevas publicaciones (praacutectica 3) acompantildean la publicacioacuten de sus datos con enlaces a otros recursos (praacutectica 7) y asignan un identificador uacutenico para dato logrando asiacute aumentar su descubrimiento y reutilizacioacuten (praacutectica 10)

31 Buenas praacutecticas para la publicacioacuten de datos

REFERENCIAS

Bernadette Farias Loacutescio Caroline Burle Newton Calegari W3C Data on the Web Best

Practices 31 de enero de 2017 W3C Recommendation URL httpswwww3orgTRdwbp

Bernadette Hyland Ghislain Auguste Atemezing Boris Villazoacuten-Terrazas W3C Best Practices

for Publishing Linked Data 9 de enero de 2014 W3C Note URL httpswwww3orgTRld-bp

Dan Brickley Libby Miller FOAF project FOAF Vocabulary Specification 099 (Paddington

Edition) 14 de enero de 2014 URL httpxmlnscomfoafspec

Dublin Core metadata initiative DCMI Metadata Terms 14 de junio de 2012 DCMI

Recommendation URL httpdublincoreorgdocumentsdcmi-terms

Fadi Maali John Erickson W3C Data Catalog Vocabulary (DCAT) 16 de enero de 2014 W3C

Recommendation URL httpswwww3orgTRvocab-dcat

ISO 19115-12014 (E) Geographic information ndash Metadata Part1 Fundamentals 01 de abril de

2014 International Standard

ISO 191262009 (E) Geographic information -- Feature concept dictionaries and registers

noviembre de 2009 International Standard

ISO 191572013 (E) Geographic information ndash Data quality 15 de diciembre de 2013

International Standard

Jeremy Tandy Payam Barnaghi Linda van den Brink W3C Spatial Data on the Web Best

Practices 5 de enero 2017 W3C Note URL httpswwww3orgTRsdw-bp

T Berners-Lee R Fielding L Masinter IETF Uniform Resource Identifier (URI) Generic Syntax

Enero de 2005 Internet Standard URL httpstoolsietforghtmlrfc3986

World Wide Web Foundation Open Data Barometer URL httpopendatabarometerorg

W3C OWL Working Group W3C OWL 2 Web Ontology Language Document Overview (Second

Edition) 11 de diciembre de 2012 W3C Recommendation URL httpswwww3orgTRowl2-

overview

W3org Semantic Web - W3C URL httpswwww3orgstandardssemanticweb Consultado

el 12 de septiembre de 2018

Page 19: PARA LA PUBLICACIÓN DE DATOSideca.gov.co/.../files/documentacion/buenaspracticaspublicaciondat… · La obtención de datos la realiza cada entidad en el desarrollo de sus actividades

19 Buenas praacutecticas para la publicacioacuten de datos

6 Proporcionar un diccionario de datos que facilite el uso e interpretacioacuten de los datos publicados

Un diccionario estaacute definido como un repertorio en forma de libro o en soporte electroacutenico en el

que se recogen seguacuten un orden determinado las palabras o expresiones de una o maacutes lenguas

o de una materia concreta acompantildeadas de su definicioacuten equivalencia o explicacioacuten15

especiacuteficamente en un diccionario de datos se encuentran los conceptos de los datos y sus

propiedades (atributos dominios asociaciones y operaciones) acompantildeados de una definicioacuten

en donde se identifica el propoacutesito alcance y campo de aplicacioacuten del dato publicado

Lograr que los usuarios de mis datos entiendan la informacioacuten que estaacute publicada le permitiraacute

decidir si satisfacen o no su necesidad y le facilitaraacute la decisioacuten para explotar lo datos

Para maacutes informacioacuten consulte el Instructivo Diccionario de Datos

iquestQueacute logro

Que mis datos sean consultados utilizados y reutilizados por maacutes usuarios

Que se eviten ambiguumledades en la interpretacioacuten de mis datos

Que mis datos publicados esteacuten unificados y consistentes

Que los usuarios comprendan mejor y dispongan de claridad sobre los conceptos de

mis datos

iexclRecomendaciones

Publique como miacutenimo un diccionario de datos que contenga la caracterizacioacuten del

conjunto de datos producidos por su entidad

Cree el diccionario de datos teniendo en cuenta como miacutenimo la siguiente informacioacuten

Nombre del atributo Nombre que identifica de manera clara un atributo

Definicioacuten Descripcioacuten del atributo

Tipo de dato Tipo de valor del atributo

Unidad de medida Expresa la unidad de medida del atributo

Dominio Determina si el atributo tiene asociado un dominio

15 httpdleraeesw=diccionario

20 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo

Para el conjunto de datos ldquoEstablecimientos Educativos en Bogotaacuterdquo publicariacuteamos un

diccionario de datos similar al siguiente

Nombre del atributo Definicioacuten Tipo de dato

Unidad de Medida

Dominio

Coacutedigo del establecimiento

Coacutedigo DANE asignado al Institucioacuten Educativa Decimal

Nombre del establecimiento

Nombre de la Institucioacuten Educativa Cadena de Caracteres

Aacuterea construida del establecimiento

Aacuterea construida de la Institucioacuten Educativa Decimal Metros

cuadrados

Sector

Clasificacioacuten asignada seguacuten la naturaleza juriacutedica la cual define las principales caracteriacutesticas que desde lo juriacutedico - administrativo y tiene que ver con el origen de su creacioacuten

Entero

EESector

No podriacuteamos olvidar detallar el dominio asociado

Atributo Nombre del Dominio Coacutedigo Definicioacuten

EESector

Oficial 1

Es una institucioacuten donde su naturaleza de servicio puacuteblico cultural y su funcioacuten social le es inherente cumpliendo con las disposiciones legales y estatutarias que las rigen donde sus rentas se conservan y se aplican debidamente

Privado 2

Es una institucioacuten constituida como persona juriacutedica de utilidad comuacuten donde sus rentas se conservan y se aplican debidamente y que en todo lo esencial se cumple con la voluntad de sus fundadores

21 Buenas praacutecticas para la publicacioacuten de datos

7 Acompantildear la publicacioacuten de los datos con enlaces a otros recursos

Un enlace es definido como una secuencia de caracteres que se utiliza como direccioacuten para

acceder a informacioacuten adicional16 maacutes sencillo puede definirse como una expresioacuten que

conecta una cierta informacioacuten con otra17Ahora bien un recurso se puede entender como

cualquier medio que satisfaga una necesidad por ejemplo datos servicios documentos o

software

En teacuterminos generales se sugiere que para facilitar al usuario la comprensioacuten de los datos

publicados se proporcionen recursos o documentos adicionales que puedan ser consultados

yo descargados traveacutes de enlaces o links de otro sitio Web

Dentro de los recursos adicionales que pueden publicarse para acompantildear el dato estaacuten los

procedimientos de captura del dato los cataacutelogos de objetos las especificaciones teacutecnicas los

documentos normativos los cataacutelogos de simbologiacutea los reportes de evaluacioacuten de calidad

entre otros

iquestQueacute logro

Mejorar la consulta utilizacioacuten y reutilizacioacuten de mis datos

Que los usuarios comprendan mejor mis datos

Que mis datos sean compartidos e intercambiados por un mayor nuacutemero de usuarios

iexclRecomendaciones

Disponga informacioacuten adicional de sus datos que le permita a los usuarios ampliar el

horizonte de las aplicaciones y funcionalidades en las que pueda utilizar y explotar del

dato

No olvide vincular o registrar esta informacioacuten en el metadato

16 httpdleraeesid=FTVRKyj 17 httpssistemascomenlacephp

22 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo 1

El ldquoMapa de Referencia para Bogotaacuterdquo publicado en httpswwwidecagovcoesserviciosmapa-de-referencia tiene publicados varios enlaces a otros recursos

Especificacioacuten teacutecnica para la elaboracioacuten del Mapa de Referencia para Bogotaacute DC V0318

Cataacutelogo de Objetos del Mapa de Referencia de Bogotaacute DC V 57

Cataacutelogo de Representacioacuten del Mapa de Referencia de Bogotaacute DC V30

Reporte de evaluacioacuten de calidad generado al Mapa de Referencia del Distrito Capital V1217

Ejemplo 2

La informacioacuten de los ldquohumedales de Bogotaacuterdquo publicada en

httpambientebogotagovcowebsdahumedales tiene publicados enlaces a otros recursos

o Gestioacuten de los humedales

o Poliacutetica de Humedales del Distrito Capital

o Normatividad

o Planes de Manejo Ambiental

o Comiteacute distrital de humedales documentos de consulta normatividad

23 Buenas praacutecticas para la publicacioacuten de datos

8 Depurar sus datos antes de publicarlos para garantizar su calidad y aumentar su confianza

La calidad estaacute definida como el conjunto de propiedades inherentes a algo que permiten

juzgar su valor18 para el caso que nos concierne este algo hace referencia al dato publicado

Ahora bien la calidad tambieacuten es entendida como la capacidad del dato publicado para

satisfacer los requerimientos y las necesidades de los usuarios respetando una serie de normas

y especificaciones establecidas

Actualmente existen muacuteltiples elementos de calidad de los datos que identifican las cualidades

de estos sin embargo en este aparte citaremos los elementos principales que usted o su

entidad deben tener en cuenta para publicar sus datos con un estaacutendar miacutenimo de calidad

Para maacutes informacioacuten consulte el Procedimiento para evaluar y reportar la calidad de

los datos espaciales

iquestQueacute logro

Que mis datos sean consultados utilizados y reutilizados por maacutes usuarios

Que los usuarios hablen bien de mis datos

Que mis datos sean maacutes interoperables y maacutes procesados

Que mis datos sean maacutes compartidos

Que mis datos sean maacutes confiables

Recomendacioacuten 1

Establezca si dentro de su conjunto de datos existen capos vaciacuteos o nulos con informacioacuten

descontextualizada sobrante o duplicada Si existen compleacutetelos o elimiacutenelos seguacuten

corresponda antes de la publicacioacuten El elemento de calidad asociado se denomina ldquototalidadrdquo

Localidad Atendidos Localidad Atendidos

Suba 200 Suba 200

Suba 200 Tunjuelito 500

Ameacutericas 100

850

Tunjuelito 500

18 httpdleraeesid=6nVpk8P|6nXVL1Z

Campo duplicado

Campo inconsistente

Campo vaciacuteo

24 Buenas praacutecticas para la publicacioacuten de datos

Recomendacioacuten 2

Identifique y transforme si es necesario los datos que hayan sido registrados en un formato

diferente al establecido para su conjunto de datos Es decir estandarice el formato de salida

del dato que va a publicar El elemento de calidad asociado se denomina ldquoconsistencia de

formatordquo

Localidad Atendidos Localidad Atendidos

Suba 200 Suba 200

Tunjuelito 5008 Tunjuelito 500

Fontiboacuten 40 Fontiboacuten 430

Tunjuelito 500 Tunjuelito 500

Recomendacioacuten 3

Si sus datos tienen alguacuten tipo de clasificacioacuten o rangos previo a la publicacioacuten valide que estos

se hayan registrado correctamente El elemento de calidad asociado se denomina ldquoexactitud de

clasificacioacutenrdquo

Geacutenero Edad Rango de Edad Geacutenero Edad Rango de Edad

Femenino 5 0 lt Edad le 10 Femenino 5 0 lt Edad le 10

Masculino 15 0 lt Edad le 10 Masculino 15 10 lt Edad le 20

Femenino 35 40 lt Edad le 50 Femenino 35 30 lt Edad le 40

Recomendacioacuten 4

Si sus datos representan atributos cuantitativos verifique antes de la publicacioacuten que estos

correspondan a valores conocidos como verdaderos El elemento de calidad asociado se

denomina ldquoexactitud de atributos cuantitativosrdquo

Localidad Mes Temperatura Localidad Mes Temperatura

Chapinero Enero 7degC Chapinero Enero 7degC

Suba Agosto -15degC Suba Agosto 15degC

Tunjuelito Abril 60degC Tunjuelito Abril 16degC

Clasificacioacuten inconsistente

Formato inconsistente

Valor inconsistente

25 Buenas praacutecticas para la publicacioacuten de datos

Recomendacioacuten 5

Si los datos a publicar tienen asociadas fechas de captura o recoleccioacuten de informacioacuten (Por

ejemplo registro de incidentes registro de vacunacioacuten conteo de vehiacuteculos etc) valide que

las fechas registradas coincidan con la fecha del evento capturado El elemento de calidad

asociado se denomina ldquoexactitud de la medicioacuten del tiempordquo

Precipitacioacuten (mm) Fecha de registro Precipitacioacuten (mm) Fecha de registro

00 20580101 00 20180101

01 20180102 01 20180102

126 20510403 126 20180103

20 20180104 20 20180104

Recomendacioacuten 6

Cuando sus datos reflejen informacioacuten determinada por un orden de eventos garantice antes

de la publicacioacuten que este orden sea el adecuado El elemento de calidad asociado se

denomina ldquoconsistencia temporalrdquo

Usuario Escolaridad Periodo de Estudio Usuario Escolaridad Periodo de Estudio

Usuario 1 Preescolar 20030101 ndash 20051231 Usuario 1 Preescolar 20030101 ndash 20051231

Usuario 1 Primaria 20030101 ndash 20101231 Usuario 1 Primaria 20060101 ndash 20101231

Usuario 1 Secundaria 20060101 ndash 20163112 Usuario 1 Secundaria 20110101 ndash 20143112

Usuario 1 Media 20150101 - 20163112 Usuario 1 Media 20150101 - 20163112

Recomendacioacuten 7

Si sus datos incluyen alguna ubicacioacuten (direccioacuten lugar coordenadas) verifique que esta

corresponda a la ubicacioacuten real El elemento de calidad asociado se denomina ldquoexactitud

posicionalrdquo

Eventos Deportivos Lugar Eventos Deportivos Lugar

Evento 1 AK 30 25 90 Evento 1 AK 30 25 90

Evento 2 AC 63 215 20 Evento 2 Parque La Florida

Evento 3 Parque Simoacuten Boliacutevar Evento 3 Parque Simoacuten Boliacutevar

Fecha

inconsistente

Fechas no secuenciales

Lugar inexistente

26 Buenas praacutecticas para la publicacioacuten de datos

9 Incorporar el componente geograacutefico en los datos publicados para optimizar su comprensioacuten uso re-uso y visualizacioacuten

El espacio geograacutefico es un punto de la superficie terrestre que se vea afectado o que afecte de

alguna manera a la humanidad19 Este punto de la superficie puede ser la direccioacuten de una

institucioacuten educativa la ubicacioacuten de un centro de vacunacioacuten el lugar donde se miden las

variaciones de traacutensito en la ciudad los parques de Bogotaacute el edificio en donde se llevan a

cabo los traacutemites de una entidad etc

Los datos que usted captura o recolecta en su quehacer misional siempre estaacuten asociados a un

espacio geograacutefico por lo tanto este componente deberiacutea ser incluido en los datos publicados

Tenga en cuenta que el componente geograacutefico lo puede incorporar incluyendo una ubicacioacuten

asociada a una direccioacuten a un lugar a una localidad a un barrio al nombre de un

establecimiento puacuteblicamente reconocido o a cualquier punto que permita al usuario

identificar la localizacioacuten del dato publicado

iquestQueacute logro

Ampliar el espectro de usuarios que consultan utilizan y reutilizan mis datos

Que mis datos sean maacutes interoperables y maacutes procesados

Que mis datos sean puedan compartir en maacutes plataformas

Que los usuarios puedan visualizar mis datos en un mapa

iexclRecomendaciones

Disponga sus datos agregando un atributo de ubicacioacuten como direcciones coordenadas o

lugares geograacuteficos

Ejemplo 1

Incluya direcciones que permitan localizar espacialmente sus datos

Programa Direccioacuten

Registro de atencioacuten a la ciudadaniacutea CL 138 108 16

Centro de autocuidado KR 18 D 77 A 11 SUR

Familias con un nintildeo en cupos cofinanciados CL 70 A SUR 20 46

Centro de autocuidado KR 18 D 73 A 33 SUR

19 httpenciclopediabanrepculturalorgindexphptitle=Espacio_geogrC3A1fico

27 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo 2

Utilice coordenadas para indicar la ubicacioacuten de sus datos

EPS Coordenada X Coordenada Y

EPS Convida 9087496334 1051342164

Capital Salud EPS 986321006 954875808

EPS Famisanar 9742508812 8837031501

Aliansalud EPS 9716943356 9659706891

Salud Total EPS 9215624975 9625189518

Tenga en cuenta que para publicar datos con coordenadas tendraacute que incluir dentro

de su metadato el Sistema de referencia empleado

MAGNA ndash SIRGAS EPSG 4686 httpsepsgio4686

MAGNA ndash SIRGAS EPSG 3116 httpsepsgio3116

MAGNA ndash BOGOTAacute SR-ORG 7458 httpspatialreferenceorgrefsr-org7458

Ejemplo 3

Tambieacuten puede incluir lugares geograacuteficos descriptivos asiacute

Usuario Vacunado Lugar de Vacunacioacuten

Usuario 1 BOSQUE IZQUIERDO

Usuario 2 LAGUNITAS URBANO

Usuario 3 LA CAPUCHINA

Usuario 4 SAN JOSE SUR

Usuario 5 VENECIA

28 Buenas praacutecticas para la publicacioacuten de datos

10 Asignar un identificador uacutenico que permita aumentar la consulta uso e interoperabilidad del dato publicado

Considere un identificador uacutenico como un texto que permite identificar inequiacutevocamente el

dato publicado Si usted va a publicar un dato buscando que este sea reutilizado por los

usuarios y por su propia entidad asignar un identificador facilitaraacute el descubrimiento y la

citacioacuten del dato a traveacutes del tiempo independientemente del estado la disponibilidad o el

formato de este

En la vida cotidiana mediante la ceacutedula de ciudadaniacutea se asigna a cada ciudadano un nuacutemero

de identificacioacuten uacutenico y a traveacutes de este identificador el ciudadano es reconocido a lo largo de

su vida e incluso despueacutes de su muerte por otras personas yo autoridades En el mundo de la

informacioacuten cada dato deberiacutea viajar con un identificador uacutenico que le permita ser encontrado

y reconocido faacutecilmente entre los demaacutes datos

Ahora bien si usted o su entidad publican continuamente datos establecer un sistema de

identificacioacuten comuacuten le permitiraacute identificar raacutepidamente los datos y los haraacute comparables por

cualquier usuario de manera confiable Esta condicioacuten es previa para lograr una correcta

gestioacuten y reutilizacioacuten de sus datos

iquestQueacute logro

Ampliar el espectro de usuarios que consultan utilizan y reutilizan mis datos

Que mis datos sean maacutes interoperables y maacutes procesados

Que mis datos sean compartidos en maacutes plataformas

Que mis datos puedan vincularse a otros datos en el entorno Web

Que mis datos sean encontrados usados y citados inequiacutevocamente

Garantizar y monitorear la reutilizacioacuten de mis datos

Reducir del uso erroacuteneo de mis datos

iexclRecomendaciones

Establezca un sistema de identificacioacuten comuacuten para los datos que va a publicar

Utilice siempre el identificador asignado para publicar sus datos

29 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo

IDECA ha dispuesto el Sistema de Registro de Iacutetems geograacuteficos

httpgeoitemsidecagovcogeoitemsano una herramienta web desarrollada para la

creacioacuten aprobacioacuten publicacioacuten y mantenimiento de iacutetems geograacuteficos que permite la

asignacioacuten concertada de identificadores y significados uacutenicos que contribuyen a la definicioacuten

de un lenguaje comuacuten para el desarrollo de nuevos sistema de informacioacuten en el Distrito

garantizando con ello su fiabilidad e interoperabilidad Adicionalmente permite almacenar

descripciones de la informacioacuten oficial producida e identificar su respectivo custodio jugando

asiacute un papel importante en el control y seguimiento de la produccioacuten de informacioacuten

geograacutefica

Este sistema asigna un identificador uacutenico a cada uno de los iacutetems creados Dentro de los iacutetems

publicados se reconoce el ID 65 como unidad de planeamiento y siempre que se hace

referencia a este objeto es suficiente nombrarlo asiacute para entender que se habla de ldquoUnidades

territoriales de anaacutelisis planeamiento y gestioacuten que tienen como propoacutesito definir y precisar el

planeamiento del suelo urbano de expansioacuten y ruralrdquo

30 Buenas praacutecticas para la publicacioacuten de datos

OBTENGA EL MAacuteS ALTO NIVEL EN PUBLICACIOacuteN DE DATOS

Hasta aquiacute hemos publicado las que consideramos como mejores praacutecticas de publicacioacuten de datos Ahora usted como publicador o como entidad debe evaluar si sus datos se estaacuten disponiendo con los maacutes altos y mejores estaacutendares de publicacioacuten

Lo invitamos a que valide en queacute nivel de publicacioacuten se encuentra su entidad teniendo en cuenta el siguiente listado

Nivel Baacutesico

En este nivel se encuentran aquellas entidades que publican sus datos en formatos estaacutendar y reutilizables (praacutectica 5) que integran a la publicacioacuten sus respectivos metadatos (praacutectica 1) y que acompantildean la publicacioacuten con una licencia asociada (praacutectica 2)

Nivel Intermedio

Este nivel lo alcanzan las entidades que superando el nivel baacutesico disponen un mayor volumen de informacioacuten gracias a que anonimizan sus datos (praacutectica 4) implementan medidas de calidad que aumentan la confianza en sus datos (praacutectica 8) incorporan el componente geograacutefico proporcionando valor agregado a sus datos (praacutectica 9) y publican un diccionario de datos que facilita la interpretacioacuten de los datos publicados (praacutectica 6)

Nivel Avanzado

Las entidades que superando el nivel intermedio utilizan vocabularios estandarizados en sus nuevas publicaciones (praacutectica 3) acompantildean la publicacioacuten de sus datos con enlaces a otros recursos (praacutectica 7) y asignan un identificador uacutenico para dato logrando asiacute aumentar su descubrimiento y reutilizacioacuten (praacutectica 10)

31 Buenas praacutecticas para la publicacioacuten de datos

REFERENCIAS

Bernadette Farias Loacutescio Caroline Burle Newton Calegari W3C Data on the Web Best

Practices 31 de enero de 2017 W3C Recommendation URL httpswwww3orgTRdwbp

Bernadette Hyland Ghislain Auguste Atemezing Boris Villazoacuten-Terrazas W3C Best Practices

for Publishing Linked Data 9 de enero de 2014 W3C Note URL httpswwww3orgTRld-bp

Dan Brickley Libby Miller FOAF project FOAF Vocabulary Specification 099 (Paddington

Edition) 14 de enero de 2014 URL httpxmlnscomfoafspec

Dublin Core metadata initiative DCMI Metadata Terms 14 de junio de 2012 DCMI

Recommendation URL httpdublincoreorgdocumentsdcmi-terms

Fadi Maali John Erickson W3C Data Catalog Vocabulary (DCAT) 16 de enero de 2014 W3C

Recommendation URL httpswwww3orgTRvocab-dcat

ISO 19115-12014 (E) Geographic information ndash Metadata Part1 Fundamentals 01 de abril de

2014 International Standard

ISO 191262009 (E) Geographic information -- Feature concept dictionaries and registers

noviembre de 2009 International Standard

ISO 191572013 (E) Geographic information ndash Data quality 15 de diciembre de 2013

International Standard

Jeremy Tandy Payam Barnaghi Linda van den Brink W3C Spatial Data on the Web Best

Practices 5 de enero 2017 W3C Note URL httpswwww3orgTRsdw-bp

T Berners-Lee R Fielding L Masinter IETF Uniform Resource Identifier (URI) Generic Syntax

Enero de 2005 Internet Standard URL httpstoolsietforghtmlrfc3986

World Wide Web Foundation Open Data Barometer URL httpopendatabarometerorg

W3C OWL Working Group W3C OWL 2 Web Ontology Language Document Overview (Second

Edition) 11 de diciembre de 2012 W3C Recommendation URL httpswwww3orgTRowl2-

overview

W3org Semantic Web - W3C URL httpswwww3orgstandardssemanticweb Consultado

el 12 de septiembre de 2018

Page 20: PARA LA PUBLICACIÓN DE DATOSideca.gov.co/.../files/documentacion/buenaspracticaspublicaciondat… · La obtención de datos la realiza cada entidad en el desarrollo de sus actividades

20 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo

Para el conjunto de datos ldquoEstablecimientos Educativos en Bogotaacuterdquo publicariacuteamos un

diccionario de datos similar al siguiente

Nombre del atributo Definicioacuten Tipo de dato

Unidad de Medida

Dominio

Coacutedigo del establecimiento

Coacutedigo DANE asignado al Institucioacuten Educativa Decimal

Nombre del establecimiento

Nombre de la Institucioacuten Educativa Cadena de Caracteres

Aacuterea construida del establecimiento

Aacuterea construida de la Institucioacuten Educativa Decimal Metros

cuadrados

Sector

Clasificacioacuten asignada seguacuten la naturaleza juriacutedica la cual define las principales caracteriacutesticas que desde lo juriacutedico - administrativo y tiene que ver con el origen de su creacioacuten

Entero

EESector

No podriacuteamos olvidar detallar el dominio asociado

Atributo Nombre del Dominio Coacutedigo Definicioacuten

EESector

Oficial 1

Es una institucioacuten donde su naturaleza de servicio puacuteblico cultural y su funcioacuten social le es inherente cumpliendo con las disposiciones legales y estatutarias que las rigen donde sus rentas se conservan y se aplican debidamente

Privado 2

Es una institucioacuten constituida como persona juriacutedica de utilidad comuacuten donde sus rentas se conservan y se aplican debidamente y que en todo lo esencial se cumple con la voluntad de sus fundadores

21 Buenas praacutecticas para la publicacioacuten de datos

7 Acompantildear la publicacioacuten de los datos con enlaces a otros recursos

Un enlace es definido como una secuencia de caracteres que se utiliza como direccioacuten para

acceder a informacioacuten adicional16 maacutes sencillo puede definirse como una expresioacuten que

conecta una cierta informacioacuten con otra17Ahora bien un recurso se puede entender como

cualquier medio que satisfaga una necesidad por ejemplo datos servicios documentos o

software

En teacuterminos generales se sugiere que para facilitar al usuario la comprensioacuten de los datos

publicados se proporcionen recursos o documentos adicionales que puedan ser consultados

yo descargados traveacutes de enlaces o links de otro sitio Web

Dentro de los recursos adicionales que pueden publicarse para acompantildear el dato estaacuten los

procedimientos de captura del dato los cataacutelogos de objetos las especificaciones teacutecnicas los

documentos normativos los cataacutelogos de simbologiacutea los reportes de evaluacioacuten de calidad

entre otros

iquestQueacute logro

Mejorar la consulta utilizacioacuten y reutilizacioacuten de mis datos

Que los usuarios comprendan mejor mis datos

Que mis datos sean compartidos e intercambiados por un mayor nuacutemero de usuarios

iexclRecomendaciones

Disponga informacioacuten adicional de sus datos que le permita a los usuarios ampliar el

horizonte de las aplicaciones y funcionalidades en las que pueda utilizar y explotar del

dato

No olvide vincular o registrar esta informacioacuten en el metadato

16 httpdleraeesid=FTVRKyj 17 httpssistemascomenlacephp

22 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo 1

El ldquoMapa de Referencia para Bogotaacuterdquo publicado en httpswwwidecagovcoesserviciosmapa-de-referencia tiene publicados varios enlaces a otros recursos

Especificacioacuten teacutecnica para la elaboracioacuten del Mapa de Referencia para Bogotaacute DC V0318

Cataacutelogo de Objetos del Mapa de Referencia de Bogotaacute DC V 57

Cataacutelogo de Representacioacuten del Mapa de Referencia de Bogotaacute DC V30

Reporte de evaluacioacuten de calidad generado al Mapa de Referencia del Distrito Capital V1217

Ejemplo 2

La informacioacuten de los ldquohumedales de Bogotaacuterdquo publicada en

httpambientebogotagovcowebsdahumedales tiene publicados enlaces a otros recursos

o Gestioacuten de los humedales

o Poliacutetica de Humedales del Distrito Capital

o Normatividad

o Planes de Manejo Ambiental

o Comiteacute distrital de humedales documentos de consulta normatividad

23 Buenas praacutecticas para la publicacioacuten de datos

8 Depurar sus datos antes de publicarlos para garantizar su calidad y aumentar su confianza

La calidad estaacute definida como el conjunto de propiedades inherentes a algo que permiten

juzgar su valor18 para el caso que nos concierne este algo hace referencia al dato publicado

Ahora bien la calidad tambieacuten es entendida como la capacidad del dato publicado para

satisfacer los requerimientos y las necesidades de los usuarios respetando una serie de normas

y especificaciones establecidas

Actualmente existen muacuteltiples elementos de calidad de los datos que identifican las cualidades

de estos sin embargo en este aparte citaremos los elementos principales que usted o su

entidad deben tener en cuenta para publicar sus datos con un estaacutendar miacutenimo de calidad

Para maacutes informacioacuten consulte el Procedimiento para evaluar y reportar la calidad de

los datos espaciales

iquestQueacute logro

Que mis datos sean consultados utilizados y reutilizados por maacutes usuarios

Que los usuarios hablen bien de mis datos

Que mis datos sean maacutes interoperables y maacutes procesados

Que mis datos sean maacutes compartidos

Que mis datos sean maacutes confiables

Recomendacioacuten 1

Establezca si dentro de su conjunto de datos existen capos vaciacuteos o nulos con informacioacuten

descontextualizada sobrante o duplicada Si existen compleacutetelos o elimiacutenelos seguacuten

corresponda antes de la publicacioacuten El elemento de calidad asociado se denomina ldquototalidadrdquo

Localidad Atendidos Localidad Atendidos

Suba 200 Suba 200

Suba 200 Tunjuelito 500

Ameacutericas 100

850

Tunjuelito 500

18 httpdleraeesid=6nVpk8P|6nXVL1Z

Campo duplicado

Campo inconsistente

Campo vaciacuteo

24 Buenas praacutecticas para la publicacioacuten de datos

Recomendacioacuten 2

Identifique y transforme si es necesario los datos que hayan sido registrados en un formato

diferente al establecido para su conjunto de datos Es decir estandarice el formato de salida

del dato que va a publicar El elemento de calidad asociado se denomina ldquoconsistencia de

formatordquo

Localidad Atendidos Localidad Atendidos

Suba 200 Suba 200

Tunjuelito 5008 Tunjuelito 500

Fontiboacuten 40 Fontiboacuten 430

Tunjuelito 500 Tunjuelito 500

Recomendacioacuten 3

Si sus datos tienen alguacuten tipo de clasificacioacuten o rangos previo a la publicacioacuten valide que estos

se hayan registrado correctamente El elemento de calidad asociado se denomina ldquoexactitud de

clasificacioacutenrdquo

Geacutenero Edad Rango de Edad Geacutenero Edad Rango de Edad

Femenino 5 0 lt Edad le 10 Femenino 5 0 lt Edad le 10

Masculino 15 0 lt Edad le 10 Masculino 15 10 lt Edad le 20

Femenino 35 40 lt Edad le 50 Femenino 35 30 lt Edad le 40

Recomendacioacuten 4

Si sus datos representan atributos cuantitativos verifique antes de la publicacioacuten que estos

correspondan a valores conocidos como verdaderos El elemento de calidad asociado se

denomina ldquoexactitud de atributos cuantitativosrdquo

Localidad Mes Temperatura Localidad Mes Temperatura

Chapinero Enero 7degC Chapinero Enero 7degC

Suba Agosto -15degC Suba Agosto 15degC

Tunjuelito Abril 60degC Tunjuelito Abril 16degC

Clasificacioacuten inconsistente

Formato inconsistente

Valor inconsistente

25 Buenas praacutecticas para la publicacioacuten de datos

Recomendacioacuten 5

Si los datos a publicar tienen asociadas fechas de captura o recoleccioacuten de informacioacuten (Por

ejemplo registro de incidentes registro de vacunacioacuten conteo de vehiacuteculos etc) valide que

las fechas registradas coincidan con la fecha del evento capturado El elemento de calidad

asociado se denomina ldquoexactitud de la medicioacuten del tiempordquo

Precipitacioacuten (mm) Fecha de registro Precipitacioacuten (mm) Fecha de registro

00 20580101 00 20180101

01 20180102 01 20180102

126 20510403 126 20180103

20 20180104 20 20180104

Recomendacioacuten 6

Cuando sus datos reflejen informacioacuten determinada por un orden de eventos garantice antes

de la publicacioacuten que este orden sea el adecuado El elemento de calidad asociado se

denomina ldquoconsistencia temporalrdquo

Usuario Escolaridad Periodo de Estudio Usuario Escolaridad Periodo de Estudio

Usuario 1 Preescolar 20030101 ndash 20051231 Usuario 1 Preescolar 20030101 ndash 20051231

Usuario 1 Primaria 20030101 ndash 20101231 Usuario 1 Primaria 20060101 ndash 20101231

Usuario 1 Secundaria 20060101 ndash 20163112 Usuario 1 Secundaria 20110101 ndash 20143112

Usuario 1 Media 20150101 - 20163112 Usuario 1 Media 20150101 - 20163112

Recomendacioacuten 7

Si sus datos incluyen alguna ubicacioacuten (direccioacuten lugar coordenadas) verifique que esta

corresponda a la ubicacioacuten real El elemento de calidad asociado se denomina ldquoexactitud

posicionalrdquo

Eventos Deportivos Lugar Eventos Deportivos Lugar

Evento 1 AK 30 25 90 Evento 1 AK 30 25 90

Evento 2 AC 63 215 20 Evento 2 Parque La Florida

Evento 3 Parque Simoacuten Boliacutevar Evento 3 Parque Simoacuten Boliacutevar

Fecha

inconsistente

Fechas no secuenciales

Lugar inexistente

26 Buenas praacutecticas para la publicacioacuten de datos

9 Incorporar el componente geograacutefico en los datos publicados para optimizar su comprensioacuten uso re-uso y visualizacioacuten

El espacio geograacutefico es un punto de la superficie terrestre que se vea afectado o que afecte de

alguna manera a la humanidad19 Este punto de la superficie puede ser la direccioacuten de una

institucioacuten educativa la ubicacioacuten de un centro de vacunacioacuten el lugar donde se miden las

variaciones de traacutensito en la ciudad los parques de Bogotaacute el edificio en donde se llevan a

cabo los traacutemites de una entidad etc

Los datos que usted captura o recolecta en su quehacer misional siempre estaacuten asociados a un

espacio geograacutefico por lo tanto este componente deberiacutea ser incluido en los datos publicados

Tenga en cuenta que el componente geograacutefico lo puede incorporar incluyendo una ubicacioacuten

asociada a una direccioacuten a un lugar a una localidad a un barrio al nombre de un

establecimiento puacuteblicamente reconocido o a cualquier punto que permita al usuario

identificar la localizacioacuten del dato publicado

iquestQueacute logro

Ampliar el espectro de usuarios que consultan utilizan y reutilizan mis datos

Que mis datos sean maacutes interoperables y maacutes procesados

Que mis datos sean puedan compartir en maacutes plataformas

Que los usuarios puedan visualizar mis datos en un mapa

iexclRecomendaciones

Disponga sus datos agregando un atributo de ubicacioacuten como direcciones coordenadas o

lugares geograacuteficos

Ejemplo 1

Incluya direcciones que permitan localizar espacialmente sus datos

Programa Direccioacuten

Registro de atencioacuten a la ciudadaniacutea CL 138 108 16

Centro de autocuidado KR 18 D 77 A 11 SUR

Familias con un nintildeo en cupos cofinanciados CL 70 A SUR 20 46

Centro de autocuidado KR 18 D 73 A 33 SUR

19 httpenciclopediabanrepculturalorgindexphptitle=Espacio_geogrC3A1fico

27 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo 2

Utilice coordenadas para indicar la ubicacioacuten de sus datos

EPS Coordenada X Coordenada Y

EPS Convida 9087496334 1051342164

Capital Salud EPS 986321006 954875808

EPS Famisanar 9742508812 8837031501

Aliansalud EPS 9716943356 9659706891

Salud Total EPS 9215624975 9625189518

Tenga en cuenta que para publicar datos con coordenadas tendraacute que incluir dentro

de su metadato el Sistema de referencia empleado

MAGNA ndash SIRGAS EPSG 4686 httpsepsgio4686

MAGNA ndash SIRGAS EPSG 3116 httpsepsgio3116

MAGNA ndash BOGOTAacute SR-ORG 7458 httpspatialreferenceorgrefsr-org7458

Ejemplo 3

Tambieacuten puede incluir lugares geograacuteficos descriptivos asiacute

Usuario Vacunado Lugar de Vacunacioacuten

Usuario 1 BOSQUE IZQUIERDO

Usuario 2 LAGUNITAS URBANO

Usuario 3 LA CAPUCHINA

Usuario 4 SAN JOSE SUR

Usuario 5 VENECIA

28 Buenas praacutecticas para la publicacioacuten de datos

10 Asignar un identificador uacutenico que permita aumentar la consulta uso e interoperabilidad del dato publicado

Considere un identificador uacutenico como un texto que permite identificar inequiacutevocamente el

dato publicado Si usted va a publicar un dato buscando que este sea reutilizado por los

usuarios y por su propia entidad asignar un identificador facilitaraacute el descubrimiento y la

citacioacuten del dato a traveacutes del tiempo independientemente del estado la disponibilidad o el

formato de este

En la vida cotidiana mediante la ceacutedula de ciudadaniacutea se asigna a cada ciudadano un nuacutemero

de identificacioacuten uacutenico y a traveacutes de este identificador el ciudadano es reconocido a lo largo de

su vida e incluso despueacutes de su muerte por otras personas yo autoridades En el mundo de la

informacioacuten cada dato deberiacutea viajar con un identificador uacutenico que le permita ser encontrado

y reconocido faacutecilmente entre los demaacutes datos

Ahora bien si usted o su entidad publican continuamente datos establecer un sistema de

identificacioacuten comuacuten le permitiraacute identificar raacutepidamente los datos y los haraacute comparables por

cualquier usuario de manera confiable Esta condicioacuten es previa para lograr una correcta

gestioacuten y reutilizacioacuten de sus datos

iquestQueacute logro

Ampliar el espectro de usuarios que consultan utilizan y reutilizan mis datos

Que mis datos sean maacutes interoperables y maacutes procesados

Que mis datos sean compartidos en maacutes plataformas

Que mis datos puedan vincularse a otros datos en el entorno Web

Que mis datos sean encontrados usados y citados inequiacutevocamente

Garantizar y monitorear la reutilizacioacuten de mis datos

Reducir del uso erroacuteneo de mis datos

iexclRecomendaciones

Establezca un sistema de identificacioacuten comuacuten para los datos que va a publicar

Utilice siempre el identificador asignado para publicar sus datos

29 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo

IDECA ha dispuesto el Sistema de Registro de Iacutetems geograacuteficos

httpgeoitemsidecagovcogeoitemsano una herramienta web desarrollada para la

creacioacuten aprobacioacuten publicacioacuten y mantenimiento de iacutetems geograacuteficos que permite la

asignacioacuten concertada de identificadores y significados uacutenicos que contribuyen a la definicioacuten

de un lenguaje comuacuten para el desarrollo de nuevos sistema de informacioacuten en el Distrito

garantizando con ello su fiabilidad e interoperabilidad Adicionalmente permite almacenar

descripciones de la informacioacuten oficial producida e identificar su respectivo custodio jugando

asiacute un papel importante en el control y seguimiento de la produccioacuten de informacioacuten

geograacutefica

Este sistema asigna un identificador uacutenico a cada uno de los iacutetems creados Dentro de los iacutetems

publicados se reconoce el ID 65 como unidad de planeamiento y siempre que se hace

referencia a este objeto es suficiente nombrarlo asiacute para entender que se habla de ldquoUnidades

territoriales de anaacutelisis planeamiento y gestioacuten que tienen como propoacutesito definir y precisar el

planeamiento del suelo urbano de expansioacuten y ruralrdquo

30 Buenas praacutecticas para la publicacioacuten de datos

OBTENGA EL MAacuteS ALTO NIVEL EN PUBLICACIOacuteN DE DATOS

Hasta aquiacute hemos publicado las que consideramos como mejores praacutecticas de publicacioacuten de datos Ahora usted como publicador o como entidad debe evaluar si sus datos se estaacuten disponiendo con los maacutes altos y mejores estaacutendares de publicacioacuten

Lo invitamos a que valide en queacute nivel de publicacioacuten se encuentra su entidad teniendo en cuenta el siguiente listado

Nivel Baacutesico

En este nivel se encuentran aquellas entidades que publican sus datos en formatos estaacutendar y reutilizables (praacutectica 5) que integran a la publicacioacuten sus respectivos metadatos (praacutectica 1) y que acompantildean la publicacioacuten con una licencia asociada (praacutectica 2)

Nivel Intermedio

Este nivel lo alcanzan las entidades que superando el nivel baacutesico disponen un mayor volumen de informacioacuten gracias a que anonimizan sus datos (praacutectica 4) implementan medidas de calidad que aumentan la confianza en sus datos (praacutectica 8) incorporan el componente geograacutefico proporcionando valor agregado a sus datos (praacutectica 9) y publican un diccionario de datos que facilita la interpretacioacuten de los datos publicados (praacutectica 6)

Nivel Avanzado

Las entidades que superando el nivel intermedio utilizan vocabularios estandarizados en sus nuevas publicaciones (praacutectica 3) acompantildean la publicacioacuten de sus datos con enlaces a otros recursos (praacutectica 7) y asignan un identificador uacutenico para dato logrando asiacute aumentar su descubrimiento y reutilizacioacuten (praacutectica 10)

31 Buenas praacutecticas para la publicacioacuten de datos

REFERENCIAS

Bernadette Farias Loacutescio Caroline Burle Newton Calegari W3C Data on the Web Best

Practices 31 de enero de 2017 W3C Recommendation URL httpswwww3orgTRdwbp

Bernadette Hyland Ghislain Auguste Atemezing Boris Villazoacuten-Terrazas W3C Best Practices

for Publishing Linked Data 9 de enero de 2014 W3C Note URL httpswwww3orgTRld-bp

Dan Brickley Libby Miller FOAF project FOAF Vocabulary Specification 099 (Paddington

Edition) 14 de enero de 2014 URL httpxmlnscomfoafspec

Dublin Core metadata initiative DCMI Metadata Terms 14 de junio de 2012 DCMI

Recommendation URL httpdublincoreorgdocumentsdcmi-terms

Fadi Maali John Erickson W3C Data Catalog Vocabulary (DCAT) 16 de enero de 2014 W3C

Recommendation URL httpswwww3orgTRvocab-dcat

ISO 19115-12014 (E) Geographic information ndash Metadata Part1 Fundamentals 01 de abril de

2014 International Standard

ISO 191262009 (E) Geographic information -- Feature concept dictionaries and registers

noviembre de 2009 International Standard

ISO 191572013 (E) Geographic information ndash Data quality 15 de diciembre de 2013

International Standard

Jeremy Tandy Payam Barnaghi Linda van den Brink W3C Spatial Data on the Web Best

Practices 5 de enero 2017 W3C Note URL httpswwww3orgTRsdw-bp

T Berners-Lee R Fielding L Masinter IETF Uniform Resource Identifier (URI) Generic Syntax

Enero de 2005 Internet Standard URL httpstoolsietforghtmlrfc3986

World Wide Web Foundation Open Data Barometer URL httpopendatabarometerorg

W3C OWL Working Group W3C OWL 2 Web Ontology Language Document Overview (Second

Edition) 11 de diciembre de 2012 W3C Recommendation URL httpswwww3orgTRowl2-

overview

W3org Semantic Web - W3C URL httpswwww3orgstandardssemanticweb Consultado

el 12 de septiembre de 2018

Page 21: PARA LA PUBLICACIÓN DE DATOSideca.gov.co/.../files/documentacion/buenaspracticaspublicaciondat… · La obtención de datos la realiza cada entidad en el desarrollo de sus actividades

21 Buenas praacutecticas para la publicacioacuten de datos

7 Acompantildear la publicacioacuten de los datos con enlaces a otros recursos

Un enlace es definido como una secuencia de caracteres que se utiliza como direccioacuten para

acceder a informacioacuten adicional16 maacutes sencillo puede definirse como una expresioacuten que

conecta una cierta informacioacuten con otra17Ahora bien un recurso se puede entender como

cualquier medio que satisfaga una necesidad por ejemplo datos servicios documentos o

software

En teacuterminos generales se sugiere que para facilitar al usuario la comprensioacuten de los datos

publicados se proporcionen recursos o documentos adicionales que puedan ser consultados

yo descargados traveacutes de enlaces o links de otro sitio Web

Dentro de los recursos adicionales que pueden publicarse para acompantildear el dato estaacuten los

procedimientos de captura del dato los cataacutelogos de objetos las especificaciones teacutecnicas los

documentos normativos los cataacutelogos de simbologiacutea los reportes de evaluacioacuten de calidad

entre otros

iquestQueacute logro

Mejorar la consulta utilizacioacuten y reutilizacioacuten de mis datos

Que los usuarios comprendan mejor mis datos

Que mis datos sean compartidos e intercambiados por un mayor nuacutemero de usuarios

iexclRecomendaciones

Disponga informacioacuten adicional de sus datos que le permita a los usuarios ampliar el

horizonte de las aplicaciones y funcionalidades en las que pueda utilizar y explotar del

dato

No olvide vincular o registrar esta informacioacuten en el metadato

16 httpdleraeesid=FTVRKyj 17 httpssistemascomenlacephp

22 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo 1

El ldquoMapa de Referencia para Bogotaacuterdquo publicado en httpswwwidecagovcoesserviciosmapa-de-referencia tiene publicados varios enlaces a otros recursos

Especificacioacuten teacutecnica para la elaboracioacuten del Mapa de Referencia para Bogotaacute DC V0318

Cataacutelogo de Objetos del Mapa de Referencia de Bogotaacute DC V 57

Cataacutelogo de Representacioacuten del Mapa de Referencia de Bogotaacute DC V30

Reporte de evaluacioacuten de calidad generado al Mapa de Referencia del Distrito Capital V1217

Ejemplo 2

La informacioacuten de los ldquohumedales de Bogotaacuterdquo publicada en

httpambientebogotagovcowebsdahumedales tiene publicados enlaces a otros recursos

o Gestioacuten de los humedales

o Poliacutetica de Humedales del Distrito Capital

o Normatividad

o Planes de Manejo Ambiental

o Comiteacute distrital de humedales documentos de consulta normatividad

23 Buenas praacutecticas para la publicacioacuten de datos

8 Depurar sus datos antes de publicarlos para garantizar su calidad y aumentar su confianza

La calidad estaacute definida como el conjunto de propiedades inherentes a algo que permiten

juzgar su valor18 para el caso que nos concierne este algo hace referencia al dato publicado

Ahora bien la calidad tambieacuten es entendida como la capacidad del dato publicado para

satisfacer los requerimientos y las necesidades de los usuarios respetando una serie de normas

y especificaciones establecidas

Actualmente existen muacuteltiples elementos de calidad de los datos que identifican las cualidades

de estos sin embargo en este aparte citaremos los elementos principales que usted o su

entidad deben tener en cuenta para publicar sus datos con un estaacutendar miacutenimo de calidad

Para maacutes informacioacuten consulte el Procedimiento para evaluar y reportar la calidad de

los datos espaciales

iquestQueacute logro

Que mis datos sean consultados utilizados y reutilizados por maacutes usuarios

Que los usuarios hablen bien de mis datos

Que mis datos sean maacutes interoperables y maacutes procesados

Que mis datos sean maacutes compartidos

Que mis datos sean maacutes confiables

Recomendacioacuten 1

Establezca si dentro de su conjunto de datos existen capos vaciacuteos o nulos con informacioacuten

descontextualizada sobrante o duplicada Si existen compleacutetelos o elimiacutenelos seguacuten

corresponda antes de la publicacioacuten El elemento de calidad asociado se denomina ldquototalidadrdquo

Localidad Atendidos Localidad Atendidos

Suba 200 Suba 200

Suba 200 Tunjuelito 500

Ameacutericas 100

850

Tunjuelito 500

18 httpdleraeesid=6nVpk8P|6nXVL1Z

Campo duplicado

Campo inconsistente

Campo vaciacuteo

24 Buenas praacutecticas para la publicacioacuten de datos

Recomendacioacuten 2

Identifique y transforme si es necesario los datos que hayan sido registrados en un formato

diferente al establecido para su conjunto de datos Es decir estandarice el formato de salida

del dato que va a publicar El elemento de calidad asociado se denomina ldquoconsistencia de

formatordquo

Localidad Atendidos Localidad Atendidos

Suba 200 Suba 200

Tunjuelito 5008 Tunjuelito 500

Fontiboacuten 40 Fontiboacuten 430

Tunjuelito 500 Tunjuelito 500

Recomendacioacuten 3

Si sus datos tienen alguacuten tipo de clasificacioacuten o rangos previo a la publicacioacuten valide que estos

se hayan registrado correctamente El elemento de calidad asociado se denomina ldquoexactitud de

clasificacioacutenrdquo

Geacutenero Edad Rango de Edad Geacutenero Edad Rango de Edad

Femenino 5 0 lt Edad le 10 Femenino 5 0 lt Edad le 10

Masculino 15 0 lt Edad le 10 Masculino 15 10 lt Edad le 20

Femenino 35 40 lt Edad le 50 Femenino 35 30 lt Edad le 40

Recomendacioacuten 4

Si sus datos representan atributos cuantitativos verifique antes de la publicacioacuten que estos

correspondan a valores conocidos como verdaderos El elemento de calidad asociado se

denomina ldquoexactitud de atributos cuantitativosrdquo

Localidad Mes Temperatura Localidad Mes Temperatura

Chapinero Enero 7degC Chapinero Enero 7degC

Suba Agosto -15degC Suba Agosto 15degC

Tunjuelito Abril 60degC Tunjuelito Abril 16degC

Clasificacioacuten inconsistente

Formato inconsistente

Valor inconsistente

25 Buenas praacutecticas para la publicacioacuten de datos

Recomendacioacuten 5

Si los datos a publicar tienen asociadas fechas de captura o recoleccioacuten de informacioacuten (Por

ejemplo registro de incidentes registro de vacunacioacuten conteo de vehiacuteculos etc) valide que

las fechas registradas coincidan con la fecha del evento capturado El elemento de calidad

asociado se denomina ldquoexactitud de la medicioacuten del tiempordquo

Precipitacioacuten (mm) Fecha de registro Precipitacioacuten (mm) Fecha de registro

00 20580101 00 20180101

01 20180102 01 20180102

126 20510403 126 20180103

20 20180104 20 20180104

Recomendacioacuten 6

Cuando sus datos reflejen informacioacuten determinada por un orden de eventos garantice antes

de la publicacioacuten que este orden sea el adecuado El elemento de calidad asociado se

denomina ldquoconsistencia temporalrdquo

Usuario Escolaridad Periodo de Estudio Usuario Escolaridad Periodo de Estudio

Usuario 1 Preescolar 20030101 ndash 20051231 Usuario 1 Preescolar 20030101 ndash 20051231

Usuario 1 Primaria 20030101 ndash 20101231 Usuario 1 Primaria 20060101 ndash 20101231

Usuario 1 Secundaria 20060101 ndash 20163112 Usuario 1 Secundaria 20110101 ndash 20143112

Usuario 1 Media 20150101 - 20163112 Usuario 1 Media 20150101 - 20163112

Recomendacioacuten 7

Si sus datos incluyen alguna ubicacioacuten (direccioacuten lugar coordenadas) verifique que esta

corresponda a la ubicacioacuten real El elemento de calidad asociado se denomina ldquoexactitud

posicionalrdquo

Eventos Deportivos Lugar Eventos Deportivos Lugar

Evento 1 AK 30 25 90 Evento 1 AK 30 25 90

Evento 2 AC 63 215 20 Evento 2 Parque La Florida

Evento 3 Parque Simoacuten Boliacutevar Evento 3 Parque Simoacuten Boliacutevar

Fecha

inconsistente

Fechas no secuenciales

Lugar inexistente

26 Buenas praacutecticas para la publicacioacuten de datos

9 Incorporar el componente geograacutefico en los datos publicados para optimizar su comprensioacuten uso re-uso y visualizacioacuten

El espacio geograacutefico es un punto de la superficie terrestre que se vea afectado o que afecte de

alguna manera a la humanidad19 Este punto de la superficie puede ser la direccioacuten de una

institucioacuten educativa la ubicacioacuten de un centro de vacunacioacuten el lugar donde se miden las

variaciones de traacutensito en la ciudad los parques de Bogotaacute el edificio en donde se llevan a

cabo los traacutemites de una entidad etc

Los datos que usted captura o recolecta en su quehacer misional siempre estaacuten asociados a un

espacio geograacutefico por lo tanto este componente deberiacutea ser incluido en los datos publicados

Tenga en cuenta que el componente geograacutefico lo puede incorporar incluyendo una ubicacioacuten

asociada a una direccioacuten a un lugar a una localidad a un barrio al nombre de un

establecimiento puacuteblicamente reconocido o a cualquier punto que permita al usuario

identificar la localizacioacuten del dato publicado

iquestQueacute logro

Ampliar el espectro de usuarios que consultan utilizan y reutilizan mis datos

Que mis datos sean maacutes interoperables y maacutes procesados

Que mis datos sean puedan compartir en maacutes plataformas

Que los usuarios puedan visualizar mis datos en un mapa

iexclRecomendaciones

Disponga sus datos agregando un atributo de ubicacioacuten como direcciones coordenadas o

lugares geograacuteficos

Ejemplo 1

Incluya direcciones que permitan localizar espacialmente sus datos

Programa Direccioacuten

Registro de atencioacuten a la ciudadaniacutea CL 138 108 16

Centro de autocuidado KR 18 D 77 A 11 SUR

Familias con un nintildeo en cupos cofinanciados CL 70 A SUR 20 46

Centro de autocuidado KR 18 D 73 A 33 SUR

19 httpenciclopediabanrepculturalorgindexphptitle=Espacio_geogrC3A1fico

27 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo 2

Utilice coordenadas para indicar la ubicacioacuten de sus datos

EPS Coordenada X Coordenada Y

EPS Convida 9087496334 1051342164

Capital Salud EPS 986321006 954875808

EPS Famisanar 9742508812 8837031501

Aliansalud EPS 9716943356 9659706891

Salud Total EPS 9215624975 9625189518

Tenga en cuenta que para publicar datos con coordenadas tendraacute que incluir dentro

de su metadato el Sistema de referencia empleado

MAGNA ndash SIRGAS EPSG 4686 httpsepsgio4686

MAGNA ndash SIRGAS EPSG 3116 httpsepsgio3116

MAGNA ndash BOGOTAacute SR-ORG 7458 httpspatialreferenceorgrefsr-org7458

Ejemplo 3

Tambieacuten puede incluir lugares geograacuteficos descriptivos asiacute

Usuario Vacunado Lugar de Vacunacioacuten

Usuario 1 BOSQUE IZQUIERDO

Usuario 2 LAGUNITAS URBANO

Usuario 3 LA CAPUCHINA

Usuario 4 SAN JOSE SUR

Usuario 5 VENECIA

28 Buenas praacutecticas para la publicacioacuten de datos

10 Asignar un identificador uacutenico que permita aumentar la consulta uso e interoperabilidad del dato publicado

Considere un identificador uacutenico como un texto que permite identificar inequiacutevocamente el

dato publicado Si usted va a publicar un dato buscando que este sea reutilizado por los

usuarios y por su propia entidad asignar un identificador facilitaraacute el descubrimiento y la

citacioacuten del dato a traveacutes del tiempo independientemente del estado la disponibilidad o el

formato de este

En la vida cotidiana mediante la ceacutedula de ciudadaniacutea se asigna a cada ciudadano un nuacutemero

de identificacioacuten uacutenico y a traveacutes de este identificador el ciudadano es reconocido a lo largo de

su vida e incluso despueacutes de su muerte por otras personas yo autoridades En el mundo de la

informacioacuten cada dato deberiacutea viajar con un identificador uacutenico que le permita ser encontrado

y reconocido faacutecilmente entre los demaacutes datos

Ahora bien si usted o su entidad publican continuamente datos establecer un sistema de

identificacioacuten comuacuten le permitiraacute identificar raacutepidamente los datos y los haraacute comparables por

cualquier usuario de manera confiable Esta condicioacuten es previa para lograr una correcta

gestioacuten y reutilizacioacuten de sus datos

iquestQueacute logro

Ampliar el espectro de usuarios que consultan utilizan y reutilizan mis datos

Que mis datos sean maacutes interoperables y maacutes procesados

Que mis datos sean compartidos en maacutes plataformas

Que mis datos puedan vincularse a otros datos en el entorno Web

Que mis datos sean encontrados usados y citados inequiacutevocamente

Garantizar y monitorear la reutilizacioacuten de mis datos

Reducir del uso erroacuteneo de mis datos

iexclRecomendaciones

Establezca un sistema de identificacioacuten comuacuten para los datos que va a publicar

Utilice siempre el identificador asignado para publicar sus datos

29 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo

IDECA ha dispuesto el Sistema de Registro de Iacutetems geograacuteficos

httpgeoitemsidecagovcogeoitemsano una herramienta web desarrollada para la

creacioacuten aprobacioacuten publicacioacuten y mantenimiento de iacutetems geograacuteficos que permite la

asignacioacuten concertada de identificadores y significados uacutenicos que contribuyen a la definicioacuten

de un lenguaje comuacuten para el desarrollo de nuevos sistema de informacioacuten en el Distrito

garantizando con ello su fiabilidad e interoperabilidad Adicionalmente permite almacenar

descripciones de la informacioacuten oficial producida e identificar su respectivo custodio jugando

asiacute un papel importante en el control y seguimiento de la produccioacuten de informacioacuten

geograacutefica

Este sistema asigna un identificador uacutenico a cada uno de los iacutetems creados Dentro de los iacutetems

publicados se reconoce el ID 65 como unidad de planeamiento y siempre que se hace

referencia a este objeto es suficiente nombrarlo asiacute para entender que se habla de ldquoUnidades

territoriales de anaacutelisis planeamiento y gestioacuten que tienen como propoacutesito definir y precisar el

planeamiento del suelo urbano de expansioacuten y ruralrdquo

30 Buenas praacutecticas para la publicacioacuten de datos

OBTENGA EL MAacuteS ALTO NIVEL EN PUBLICACIOacuteN DE DATOS

Hasta aquiacute hemos publicado las que consideramos como mejores praacutecticas de publicacioacuten de datos Ahora usted como publicador o como entidad debe evaluar si sus datos se estaacuten disponiendo con los maacutes altos y mejores estaacutendares de publicacioacuten

Lo invitamos a que valide en queacute nivel de publicacioacuten se encuentra su entidad teniendo en cuenta el siguiente listado

Nivel Baacutesico

En este nivel se encuentran aquellas entidades que publican sus datos en formatos estaacutendar y reutilizables (praacutectica 5) que integran a la publicacioacuten sus respectivos metadatos (praacutectica 1) y que acompantildean la publicacioacuten con una licencia asociada (praacutectica 2)

Nivel Intermedio

Este nivel lo alcanzan las entidades que superando el nivel baacutesico disponen un mayor volumen de informacioacuten gracias a que anonimizan sus datos (praacutectica 4) implementan medidas de calidad que aumentan la confianza en sus datos (praacutectica 8) incorporan el componente geograacutefico proporcionando valor agregado a sus datos (praacutectica 9) y publican un diccionario de datos que facilita la interpretacioacuten de los datos publicados (praacutectica 6)

Nivel Avanzado

Las entidades que superando el nivel intermedio utilizan vocabularios estandarizados en sus nuevas publicaciones (praacutectica 3) acompantildean la publicacioacuten de sus datos con enlaces a otros recursos (praacutectica 7) y asignan un identificador uacutenico para dato logrando asiacute aumentar su descubrimiento y reutilizacioacuten (praacutectica 10)

31 Buenas praacutecticas para la publicacioacuten de datos

REFERENCIAS

Bernadette Farias Loacutescio Caroline Burle Newton Calegari W3C Data on the Web Best

Practices 31 de enero de 2017 W3C Recommendation URL httpswwww3orgTRdwbp

Bernadette Hyland Ghislain Auguste Atemezing Boris Villazoacuten-Terrazas W3C Best Practices

for Publishing Linked Data 9 de enero de 2014 W3C Note URL httpswwww3orgTRld-bp

Dan Brickley Libby Miller FOAF project FOAF Vocabulary Specification 099 (Paddington

Edition) 14 de enero de 2014 URL httpxmlnscomfoafspec

Dublin Core metadata initiative DCMI Metadata Terms 14 de junio de 2012 DCMI

Recommendation URL httpdublincoreorgdocumentsdcmi-terms

Fadi Maali John Erickson W3C Data Catalog Vocabulary (DCAT) 16 de enero de 2014 W3C

Recommendation URL httpswwww3orgTRvocab-dcat

ISO 19115-12014 (E) Geographic information ndash Metadata Part1 Fundamentals 01 de abril de

2014 International Standard

ISO 191262009 (E) Geographic information -- Feature concept dictionaries and registers

noviembre de 2009 International Standard

ISO 191572013 (E) Geographic information ndash Data quality 15 de diciembre de 2013

International Standard

Jeremy Tandy Payam Barnaghi Linda van den Brink W3C Spatial Data on the Web Best

Practices 5 de enero 2017 W3C Note URL httpswwww3orgTRsdw-bp

T Berners-Lee R Fielding L Masinter IETF Uniform Resource Identifier (URI) Generic Syntax

Enero de 2005 Internet Standard URL httpstoolsietforghtmlrfc3986

World Wide Web Foundation Open Data Barometer URL httpopendatabarometerorg

W3C OWL Working Group W3C OWL 2 Web Ontology Language Document Overview (Second

Edition) 11 de diciembre de 2012 W3C Recommendation URL httpswwww3orgTRowl2-

overview

W3org Semantic Web - W3C URL httpswwww3orgstandardssemanticweb Consultado

el 12 de septiembre de 2018

Page 22: PARA LA PUBLICACIÓN DE DATOSideca.gov.co/.../files/documentacion/buenaspracticaspublicaciondat… · La obtención de datos la realiza cada entidad en el desarrollo de sus actividades

22 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo 1

El ldquoMapa de Referencia para Bogotaacuterdquo publicado en httpswwwidecagovcoesserviciosmapa-de-referencia tiene publicados varios enlaces a otros recursos

Especificacioacuten teacutecnica para la elaboracioacuten del Mapa de Referencia para Bogotaacute DC V0318

Cataacutelogo de Objetos del Mapa de Referencia de Bogotaacute DC V 57

Cataacutelogo de Representacioacuten del Mapa de Referencia de Bogotaacute DC V30

Reporte de evaluacioacuten de calidad generado al Mapa de Referencia del Distrito Capital V1217

Ejemplo 2

La informacioacuten de los ldquohumedales de Bogotaacuterdquo publicada en

httpambientebogotagovcowebsdahumedales tiene publicados enlaces a otros recursos

o Gestioacuten de los humedales

o Poliacutetica de Humedales del Distrito Capital

o Normatividad

o Planes de Manejo Ambiental

o Comiteacute distrital de humedales documentos de consulta normatividad

23 Buenas praacutecticas para la publicacioacuten de datos

8 Depurar sus datos antes de publicarlos para garantizar su calidad y aumentar su confianza

La calidad estaacute definida como el conjunto de propiedades inherentes a algo que permiten

juzgar su valor18 para el caso que nos concierne este algo hace referencia al dato publicado

Ahora bien la calidad tambieacuten es entendida como la capacidad del dato publicado para

satisfacer los requerimientos y las necesidades de los usuarios respetando una serie de normas

y especificaciones establecidas

Actualmente existen muacuteltiples elementos de calidad de los datos que identifican las cualidades

de estos sin embargo en este aparte citaremos los elementos principales que usted o su

entidad deben tener en cuenta para publicar sus datos con un estaacutendar miacutenimo de calidad

Para maacutes informacioacuten consulte el Procedimiento para evaluar y reportar la calidad de

los datos espaciales

iquestQueacute logro

Que mis datos sean consultados utilizados y reutilizados por maacutes usuarios

Que los usuarios hablen bien de mis datos

Que mis datos sean maacutes interoperables y maacutes procesados

Que mis datos sean maacutes compartidos

Que mis datos sean maacutes confiables

Recomendacioacuten 1

Establezca si dentro de su conjunto de datos existen capos vaciacuteos o nulos con informacioacuten

descontextualizada sobrante o duplicada Si existen compleacutetelos o elimiacutenelos seguacuten

corresponda antes de la publicacioacuten El elemento de calidad asociado se denomina ldquototalidadrdquo

Localidad Atendidos Localidad Atendidos

Suba 200 Suba 200

Suba 200 Tunjuelito 500

Ameacutericas 100

850

Tunjuelito 500

18 httpdleraeesid=6nVpk8P|6nXVL1Z

Campo duplicado

Campo inconsistente

Campo vaciacuteo

24 Buenas praacutecticas para la publicacioacuten de datos

Recomendacioacuten 2

Identifique y transforme si es necesario los datos que hayan sido registrados en un formato

diferente al establecido para su conjunto de datos Es decir estandarice el formato de salida

del dato que va a publicar El elemento de calidad asociado se denomina ldquoconsistencia de

formatordquo

Localidad Atendidos Localidad Atendidos

Suba 200 Suba 200

Tunjuelito 5008 Tunjuelito 500

Fontiboacuten 40 Fontiboacuten 430

Tunjuelito 500 Tunjuelito 500

Recomendacioacuten 3

Si sus datos tienen alguacuten tipo de clasificacioacuten o rangos previo a la publicacioacuten valide que estos

se hayan registrado correctamente El elemento de calidad asociado se denomina ldquoexactitud de

clasificacioacutenrdquo

Geacutenero Edad Rango de Edad Geacutenero Edad Rango de Edad

Femenino 5 0 lt Edad le 10 Femenino 5 0 lt Edad le 10

Masculino 15 0 lt Edad le 10 Masculino 15 10 lt Edad le 20

Femenino 35 40 lt Edad le 50 Femenino 35 30 lt Edad le 40

Recomendacioacuten 4

Si sus datos representan atributos cuantitativos verifique antes de la publicacioacuten que estos

correspondan a valores conocidos como verdaderos El elemento de calidad asociado se

denomina ldquoexactitud de atributos cuantitativosrdquo

Localidad Mes Temperatura Localidad Mes Temperatura

Chapinero Enero 7degC Chapinero Enero 7degC

Suba Agosto -15degC Suba Agosto 15degC

Tunjuelito Abril 60degC Tunjuelito Abril 16degC

Clasificacioacuten inconsistente

Formato inconsistente

Valor inconsistente

25 Buenas praacutecticas para la publicacioacuten de datos

Recomendacioacuten 5

Si los datos a publicar tienen asociadas fechas de captura o recoleccioacuten de informacioacuten (Por

ejemplo registro de incidentes registro de vacunacioacuten conteo de vehiacuteculos etc) valide que

las fechas registradas coincidan con la fecha del evento capturado El elemento de calidad

asociado se denomina ldquoexactitud de la medicioacuten del tiempordquo

Precipitacioacuten (mm) Fecha de registro Precipitacioacuten (mm) Fecha de registro

00 20580101 00 20180101

01 20180102 01 20180102

126 20510403 126 20180103

20 20180104 20 20180104

Recomendacioacuten 6

Cuando sus datos reflejen informacioacuten determinada por un orden de eventos garantice antes

de la publicacioacuten que este orden sea el adecuado El elemento de calidad asociado se

denomina ldquoconsistencia temporalrdquo

Usuario Escolaridad Periodo de Estudio Usuario Escolaridad Periodo de Estudio

Usuario 1 Preescolar 20030101 ndash 20051231 Usuario 1 Preescolar 20030101 ndash 20051231

Usuario 1 Primaria 20030101 ndash 20101231 Usuario 1 Primaria 20060101 ndash 20101231

Usuario 1 Secundaria 20060101 ndash 20163112 Usuario 1 Secundaria 20110101 ndash 20143112

Usuario 1 Media 20150101 - 20163112 Usuario 1 Media 20150101 - 20163112

Recomendacioacuten 7

Si sus datos incluyen alguna ubicacioacuten (direccioacuten lugar coordenadas) verifique que esta

corresponda a la ubicacioacuten real El elemento de calidad asociado se denomina ldquoexactitud

posicionalrdquo

Eventos Deportivos Lugar Eventos Deportivos Lugar

Evento 1 AK 30 25 90 Evento 1 AK 30 25 90

Evento 2 AC 63 215 20 Evento 2 Parque La Florida

Evento 3 Parque Simoacuten Boliacutevar Evento 3 Parque Simoacuten Boliacutevar

Fecha

inconsistente

Fechas no secuenciales

Lugar inexistente

26 Buenas praacutecticas para la publicacioacuten de datos

9 Incorporar el componente geograacutefico en los datos publicados para optimizar su comprensioacuten uso re-uso y visualizacioacuten

El espacio geograacutefico es un punto de la superficie terrestre que se vea afectado o que afecte de

alguna manera a la humanidad19 Este punto de la superficie puede ser la direccioacuten de una

institucioacuten educativa la ubicacioacuten de un centro de vacunacioacuten el lugar donde se miden las

variaciones de traacutensito en la ciudad los parques de Bogotaacute el edificio en donde se llevan a

cabo los traacutemites de una entidad etc

Los datos que usted captura o recolecta en su quehacer misional siempre estaacuten asociados a un

espacio geograacutefico por lo tanto este componente deberiacutea ser incluido en los datos publicados

Tenga en cuenta que el componente geograacutefico lo puede incorporar incluyendo una ubicacioacuten

asociada a una direccioacuten a un lugar a una localidad a un barrio al nombre de un

establecimiento puacuteblicamente reconocido o a cualquier punto que permita al usuario

identificar la localizacioacuten del dato publicado

iquestQueacute logro

Ampliar el espectro de usuarios que consultan utilizan y reutilizan mis datos

Que mis datos sean maacutes interoperables y maacutes procesados

Que mis datos sean puedan compartir en maacutes plataformas

Que los usuarios puedan visualizar mis datos en un mapa

iexclRecomendaciones

Disponga sus datos agregando un atributo de ubicacioacuten como direcciones coordenadas o

lugares geograacuteficos

Ejemplo 1

Incluya direcciones que permitan localizar espacialmente sus datos

Programa Direccioacuten

Registro de atencioacuten a la ciudadaniacutea CL 138 108 16

Centro de autocuidado KR 18 D 77 A 11 SUR

Familias con un nintildeo en cupos cofinanciados CL 70 A SUR 20 46

Centro de autocuidado KR 18 D 73 A 33 SUR

19 httpenciclopediabanrepculturalorgindexphptitle=Espacio_geogrC3A1fico

27 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo 2

Utilice coordenadas para indicar la ubicacioacuten de sus datos

EPS Coordenada X Coordenada Y

EPS Convida 9087496334 1051342164

Capital Salud EPS 986321006 954875808

EPS Famisanar 9742508812 8837031501

Aliansalud EPS 9716943356 9659706891

Salud Total EPS 9215624975 9625189518

Tenga en cuenta que para publicar datos con coordenadas tendraacute que incluir dentro

de su metadato el Sistema de referencia empleado

MAGNA ndash SIRGAS EPSG 4686 httpsepsgio4686

MAGNA ndash SIRGAS EPSG 3116 httpsepsgio3116

MAGNA ndash BOGOTAacute SR-ORG 7458 httpspatialreferenceorgrefsr-org7458

Ejemplo 3

Tambieacuten puede incluir lugares geograacuteficos descriptivos asiacute

Usuario Vacunado Lugar de Vacunacioacuten

Usuario 1 BOSQUE IZQUIERDO

Usuario 2 LAGUNITAS URBANO

Usuario 3 LA CAPUCHINA

Usuario 4 SAN JOSE SUR

Usuario 5 VENECIA

28 Buenas praacutecticas para la publicacioacuten de datos

10 Asignar un identificador uacutenico que permita aumentar la consulta uso e interoperabilidad del dato publicado

Considere un identificador uacutenico como un texto que permite identificar inequiacutevocamente el

dato publicado Si usted va a publicar un dato buscando que este sea reutilizado por los

usuarios y por su propia entidad asignar un identificador facilitaraacute el descubrimiento y la

citacioacuten del dato a traveacutes del tiempo independientemente del estado la disponibilidad o el

formato de este

En la vida cotidiana mediante la ceacutedula de ciudadaniacutea se asigna a cada ciudadano un nuacutemero

de identificacioacuten uacutenico y a traveacutes de este identificador el ciudadano es reconocido a lo largo de

su vida e incluso despueacutes de su muerte por otras personas yo autoridades En el mundo de la

informacioacuten cada dato deberiacutea viajar con un identificador uacutenico que le permita ser encontrado

y reconocido faacutecilmente entre los demaacutes datos

Ahora bien si usted o su entidad publican continuamente datos establecer un sistema de

identificacioacuten comuacuten le permitiraacute identificar raacutepidamente los datos y los haraacute comparables por

cualquier usuario de manera confiable Esta condicioacuten es previa para lograr una correcta

gestioacuten y reutilizacioacuten de sus datos

iquestQueacute logro

Ampliar el espectro de usuarios que consultan utilizan y reutilizan mis datos

Que mis datos sean maacutes interoperables y maacutes procesados

Que mis datos sean compartidos en maacutes plataformas

Que mis datos puedan vincularse a otros datos en el entorno Web

Que mis datos sean encontrados usados y citados inequiacutevocamente

Garantizar y monitorear la reutilizacioacuten de mis datos

Reducir del uso erroacuteneo de mis datos

iexclRecomendaciones

Establezca un sistema de identificacioacuten comuacuten para los datos que va a publicar

Utilice siempre el identificador asignado para publicar sus datos

29 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo

IDECA ha dispuesto el Sistema de Registro de Iacutetems geograacuteficos

httpgeoitemsidecagovcogeoitemsano una herramienta web desarrollada para la

creacioacuten aprobacioacuten publicacioacuten y mantenimiento de iacutetems geograacuteficos que permite la

asignacioacuten concertada de identificadores y significados uacutenicos que contribuyen a la definicioacuten

de un lenguaje comuacuten para el desarrollo de nuevos sistema de informacioacuten en el Distrito

garantizando con ello su fiabilidad e interoperabilidad Adicionalmente permite almacenar

descripciones de la informacioacuten oficial producida e identificar su respectivo custodio jugando

asiacute un papel importante en el control y seguimiento de la produccioacuten de informacioacuten

geograacutefica

Este sistema asigna un identificador uacutenico a cada uno de los iacutetems creados Dentro de los iacutetems

publicados se reconoce el ID 65 como unidad de planeamiento y siempre que se hace

referencia a este objeto es suficiente nombrarlo asiacute para entender que se habla de ldquoUnidades

territoriales de anaacutelisis planeamiento y gestioacuten que tienen como propoacutesito definir y precisar el

planeamiento del suelo urbano de expansioacuten y ruralrdquo

30 Buenas praacutecticas para la publicacioacuten de datos

OBTENGA EL MAacuteS ALTO NIVEL EN PUBLICACIOacuteN DE DATOS

Hasta aquiacute hemos publicado las que consideramos como mejores praacutecticas de publicacioacuten de datos Ahora usted como publicador o como entidad debe evaluar si sus datos se estaacuten disponiendo con los maacutes altos y mejores estaacutendares de publicacioacuten

Lo invitamos a que valide en queacute nivel de publicacioacuten se encuentra su entidad teniendo en cuenta el siguiente listado

Nivel Baacutesico

En este nivel se encuentran aquellas entidades que publican sus datos en formatos estaacutendar y reutilizables (praacutectica 5) que integran a la publicacioacuten sus respectivos metadatos (praacutectica 1) y que acompantildean la publicacioacuten con una licencia asociada (praacutectica 2)

Nivel Intermedio

Este nivel lo alcanzan las entidades que superando el nivel baacutesico disponen un mayor volumen de informacioacuten gracias a que anonimizan sus datos (praacutectica 4) implementan medidas de calidad que aumentan la confianza en sus datos (praacutectica 8) incorporan el componente geograacutefico proporcionando valor agregado a sus datos (praacutectica 9) y publican un diccionario de datos que facilita la interpretacioacuten de los datos publicados (praacutectica 6)

Nivel Avanzado

Las entidades que superando el nivel intermedio utilizan vocabularios estandarizados en sus nuevas publicaciones (praacutectica 3) acompantildean la publicacioacuten de sus datos con enlaces a otros recursos (praacutectica 7) y asignan un identificador uacutenico para dato logrando asiacute aumentar su descubrimiento y reutilizacioacuten (praacutectica 10)

31 Buenas praacutecticas para la publicacioacuten de datos

REFERENCIAS

Bernadette Farias Loacutescio Caroline Burle Newton Calegari W3C Data on the Web Best

Practices 31 de enero de 2017 W3C Recommendation URL httpswwww3orgTRdwbp

Bernadette Hyland Ghislain Auguste Atemezing Boris Villazoacuten-Terrazas W3C Best Practices

for Publishing Linked Data 9 de enero de 2014 W3C Note URL httpswwww3orgTRld-bp

Dan Brickley Libby Miller FOAF project FOAF Vocabulary Specification 099 (Paddington

Edition) 14 de enero de 2014 URL httpxmlnscomfoafspec

Dublin Core metadata initiative DCMI Metadata Terms 14 de junio de 2012 DCMI

Recommendation URL httpdublincoreorgdocumentsdcmi-terms

Fadi Maali John Erickson W3C Data Catalog Vocabulary (DCAT) 16 de enero de 2014 W3C

Recommendation URL httpswwww3orgTRvocab-dcat

ISO 19115-12014 (E) Geographic information ndash Metadata Part1 Fundamentals 01 de abril de

2014 International Standard

ISO 191262009 (E) Geographic information -- Feature concept dictionaries and registers

noviembre de 2009 International Standard

ISO 191572013 (E) Geographic information ndash Data quality 15 de diciembre de 2013

International Standard

Jeremy Tandy Payam Barnaghi Linda van den Brink W3C Spatial Data on the Web Best

Practices 5 de enero 2017 W3C Note URL httpswwww3orgTRsdw-bp

T Berners-Lee R Fielding L Masinter IETF Uniform Resource Identifier (URI) Generic Syntax

Enero de 2005 Internet Standard URL httpstoolsietforghtmlrfc3986

World Wide Web Foundation Open Data Barometer URL httpopendatabarometerorg

W3C OWL Working Group W3C OWL 2 Web Ontology Language Document Overview (Second

Edition) 11 de diciembre de 2012 W3C Recommendation URL httpswwww3orgTRowl2-

overview

W3org Semantic Web - W3C URL httpswwww3orgstandardssemanticweb Consultado

el 12 de septiembre de 2018

Page 23: PARA LA PUBLICACIÓN DE DATOSideca.gov.co/.../files/documentacion/buenaspracticaspublicaciondat… · La obtención de datos la realiza cada entidad en el desarrollo de sus actividades

23 Buenas praacutecticas para la publicacioacuten de datos

8 Depurar sus datos antes de publicarlos para garantizar su calidad y aumentar su confianza

La calidad estaacute definida como el conjunto de propiedades inherentes a algo que permiten

juzgar su valor18 para el caso que nos concierne este algo hace referencia al dato publicado

Ahora bien la calidad tambieacuten es entendida como la capacidad del dato publicado para

satisfacer los requerimientos y las necesidades de los usuarios respetando una serie de normas

y especificaciones establecidas

Actualmente existen muacuteltiples elementos de calidad de los datos que identifican las cualidades

de estos sin embargo en este aparte citaremos los elementos principales que usted o su

entidad deben tener en cuenta para publicar sus datos con un estaacutendar miacutenimo de calidad

Para maacutes informacioacuten consulte el Procedimiento para evaluar y reportar la calidad de

los datos espaciales

iquestQueacute logro

Que mis datos sean consultados utilizados y reutilizados por maacutes usuarios

Que los usuarios hablen bien de mis datos

Que mis datos sean maacutes interoperables y maacutes procesados

Que mis datos sean maacutes compartidos

Que mis datos sean maacutes confiables

Recomendacioacuten 1

Establezca si dentro de su conjunto de datos existen capos vaciacuteos o nulos con informacioacuten

descontextualizada sobrante o duplicada Si existen compleacutetelos o elimiacutenelos seguacuten

corresponda antes de la publicacioacuten El elemento de calidad asociado se denomina ldquototalidadrdquo

Localidad Atendidos Localidad Atendidos

Suba 200 Suba 200

Suba 200 Tunjuelito 500

Ameacutericas 100

850

Tunjuelito 500

18 httpdleraeesid=6nVpk8P|6nXVL1Z

Campo duplicado

Campo inconsistente

Campo vaciacuteo

24 Buenas praacutecticas para la publicacioacuten de datos

Recomendacioacuten 2

Identifique y transforme si es necesario los datos que hayan sido registrados en un formato

diferente al establecido para su conjunto de datos Es decir estandarice el formato de salida

del dato que va a publicar El elemento de calidad asociado se denomina ldquoconsistencia de

formatordquo

Localidad Atendidos Localidad Atendidos

Suba 200 Suba 200

Tunjuelito 5008 Tunjuelito 500

Fontiboacuten 40 Fontiboacuten 430

Tunjuelito 500 Tunjuelito 500

Recomendacioacuten 3

Si sus datos tienen alguacuten tipo de clasificacioacuten o rangos previo a la publicacioacuten valide que estos

se hayan registrado correctamente El elemento de calidad asociado se denomina ldquoexactitud de

clasificacioacutenrdquo

Geacutenero Edad Rango de Edad Geacutenero Edad Rango de Edad

Femenino 5 0 lt Edad le 10 Femenino 5 0 lt Edad le 10

Masculino 15 0 lt Edad le 10 Masculino 15 10 lt Edad le 20

Femenino 35 40 lt Edad le 50 Femenino 35 30 lt Edad le 40

Recomendacioacuten 4

Si sus datos representan atributos cuantitativos verifique antes de la publicacioacuten que estos

correspondan a valores conocidos como verdaderos El elemento de calidad asociado se

denomina ldquoexactitud de atributos cuantitativosrdquo

Localidad Mes Temperatura Localidad Mes Temperatura

Chapinero Enero 7degC Chapinero Enero 7degC

Suba Agosto -15degC Suba Agosto 15degC

Tunjuelito Abril 60degC Tunjuelito Abril 16degC

Clasificacioacuten inconsistente

Formato inconsistente

Valor inconsistente

25 Buenas praacutecticas para la publicacioacuten de datos

Recomendacioacuten 5

Si los datos a publicar tienen asociadas fechas de captura o recoleccioacuten de informacioacuten (Por

ejemplo registro de incidentes registro de vacunacioacuten conteo de vehiacuteculos etc) valide que

las fechas registradas coincidan con la fecha del evento capturado El elemento de calidad

asociado se denomina ldquoexactitud de la medicioacuten del tiempordquo

Precipitacioacuten (mm) Fecha de registro Precipitacioacuten (mm) Fecha de registro

00 20580101 00 20180101

01 20180102 01 20180102

126 20510403 126 20180103

20 20180104 20 20180104

Recomendacioacuten 6

Cuando sus datos reflejen informacioacuten determinada por un orden de eventos garantice antes

de la publicacioacuten que este orden sea el adecuado El elemento de calidad asociado se

denomina ldquoconsistencia temporalrdquo

Usuario Escolaridad Periodo de Estudio Usuario Escolaridad Periodo de Estudio

Usuario 1 Preescolar 20030101 ndash 20051231 Usuario 1 Preescolar 20030101 ndash 20051231

Usuario 1 Primaria 20030101 ndash 20101231 Usuario 1 Primaria 20060101 ndash 20101231

Usuario 1 Secundaria 20060101 ndash 20163112 Usuario 1 Secundaria 20110101 ndash 20143112

Usuario 1 Media 20150101 - 20163112 Usuario 1 Media 20150101 - 20163112

Recomendacioacuten 7

Si sus datos incluyen alguna ubicacioacuten (direccioacuten lugar coordenadas) verifique que esta

corresponda a la ubicacioacuten real El elemento de calidad asociado se denomina ldquoexactitud

posicionalrdquo

Eventos Deportivos Lugar Eventos Deportivos Lugar

Evento 1 AK 30 25 90 Evento 1 AK 30 25 90

Evento 2 AC 63 215 20 Evento 2 Parque La Florida

Evento 3 Parque Simoacuten Boliacutevar Evento 3 Parque Simoacuten Boliacutevar

Fecha

inconsistente

Fechas no secuenciales

Lugar inexistente

26 Buenas praacutecticas para la publicacioacuten de datos

9 Incorporar el componente geograacutefico en los datos publicados para optimizar su comprensioacuten uso re-uso y visualizacioacuten

El espacio geograacutefico es un punto de la superficie terrestre que se vea afectado o que afecte de

alguna manera a la humanidad19 Este punto de la superficie puede ser la direccioacuten de una

institucioacuten educativa la ubicacioacuten de un centro de vacunacioacuten el lugar donde se miden las

variaciones de traacutensito en la ciudad los parques de Bogotaacute el edificio en donde se llevan a

cabo los traacutemites de una entidad etc

Los datos que usted captura o recolecta en su quehacer misional siempre estaacuten asociados a un

espacio geograacutefico por lo tanto este componente deberiacutea ser incluido en los datos publicados

Tenga en cuenta que el componente geograacutefico lo puede incorporar incluyendo una ubicacioacuten

asociada a una direccioacuten a un lugar a una localidad a un barrio al nombre de un

establecimiento puacuteblicamente reconocido o a cualquier punto que permita al usuario

identificar la localizacioacuten del dato publicado

iquestQueacute logro

Ampliar el espectro de usuarios que consultan utilizan y reutilizan mis datos

Que mis datos sean maacutes interoperables y maacutes procesados

Que mis datos sean puedan compartir en maacutes plataformas

Que los usuarios puedan visualizar mis datos en un mapa

iexclRecomendaciones

Disponga sus datos agregando un atributo de ubicacioacuten como direcciones coordenadas o

lugares geograacuteficos

Ejemplo 1

Incluya direcciones que permitan localizar espacialmente sus datos

Programa Direccioacuten

Registro de atencioacuten a la ciudadaniacutea CL 138 108 16

Centro de autocuidado KR 18 D 77 A 11 SUR

Familias con un nintildeo en cupos cofinanciados CL 70 A SUR 20 46

Centro de autocuidado KR 18 D 73 A 33 SUR

19 httpenciclopediabanrepculturalorgindexphptitle=Espacio_geogrC3A1fico

27 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo 2

Utilice coordenadas para indicar la ubicacioacuten de sus datos

EPS Coordenada X Coordenada Y

EPS Convida 9087496334 1051342164

Capital Salud EPS 986321006 954875808

EPS Famisanar 9742508812 8837031501

Aliansalud EPS 9716943356 9659706891

Salud Total EPS 9215624975 9625189518

Tenga en cuenta que para publicar datos con coordenadas tendraacute que incluir dentro

de su metadato el Sistema de referencia empleado

MAGNA ndash SIRGAS EPSG 4686 httpsepsgio4686

MAGNA ndash SIRGAS EPSG 3116 httpsepsgio3116

MAGNA ndash BOGOTAacute SR-ORG 7458 httpspatialreferenceorgrefsr-org7458

Ejemplo 3

Tambieacuten puede incluir lugares geograacuteficos descriptivos asiacute

Usuario Vacunado Lugar de Vacunacioacuten

Usuario 1 BOSQUE IZQUIERDO

Usuario 2 LAGUNITAS URBANO

Usuario 3 LA CAPUCHINA

Usuario 4 SAN JOSE SUR

Usuario 5 VENECIA

28 Buenas praacutecticas para la publicacioacuten de datos

10 Asignar un identificador uacutenico que permita aumentar la consulta uso e interoperabilidad del dato publicado

Considere un identificador uacutenico como un texto que permite identificar inequiacutevocamente el

dato publicado Si usted va a publicar un dato buscando que este sea reutilizado por los

usuarios y por su propia entidad asignar un identificador facilitaraacute el descubrimiento y la

citacioacuten del dato a traveacutes del tiempo independientemente del estado la disponibilidad o el

formato de este

En la vida cotidiana mediante la ceacutedula de ciudadaniacutea se asigna a cada ciudadano un nuacutemero

de identificacioacuten uacutenico y a traveacutes de este identificador el ciudadano es reconocido a lo largo de

su vida e incluso despueacutes de su muerte por otras personas yo autoridades En el mundo de la

informacioacuten cada dato deberiacutea viajar con un identificador uacutenico que le permita ser encontrado

y reconocido faacutecilmente entre los demaacutes datos

Ahora bien si usted o su entidad publican continuamente datos establecer un sistema de

identificacioacuten comuacuten le permitiraacute identificar raacutepidamente los datos y los haraacute comparables por

cualquier usuario de manera confiable Esta condicioacuten es previa para lograr una correcta

gestioacuten y reutilizacioacuten de sus datos

iquestQueacute logro

Ampliar el espectro de usuarios que consultan utilizan y reutilizan mis datos

Que mis datos sean maacutes interoperables y maacutes procesados

Que mis datos sean compartidos en maacutes plataformas

Que mis datos puedan vincularse a otros datos en el entorno Web

Que mis datos sean encontrados usados y citados inequiacutevocamente

Garantizar y monitorear la reutilizacioacuten de mis datos

Reducir del uso erroacuteneo de mis datos

iexclRecomendaciones

Establezca un sistema de identificacioacuten comuacuten para los datos que va a publicar

Utilice siempre el identificador asignado para publicar sus datos

29 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo

IDECA ha dispuesto el Sistema de Registro de Iacutetems geograacuteficos

httpgeoitemsidecagovcogeoitemsano una herramienta web desarrollada para la

creacioacuten aprobacioacuten publicacioacuten y mantenimiento de iacutetems geograacuteficos que permite la

asignacioacuten concertada de identificadores y significados uacutenicos que contribuyen a la definicioacuten

de un lenguaje comuacuten para el desarrollo de nuevos sistema de informacioacuten en el Distrito

garantizando con ello su fiabilidad e interoperabilidad Adicionalmente permite almacenar

descripciones de la informacioacuten oficial producida e identificar su respectivo custodio jugando

asiacute un papel importante en el control y seguimiento de la produccioacuten de informacioacuten

geograacutefica

Este sistema asigna un identificador uacutenico a cada uno de los iacutetems creados Dentro de los iacutetems

publicados se reconoce el ID 65 como unidad de planeamiento y siempre que se hace

referencia a este objeto es suficiente nombrarlo asiacute para entender que se habla de ldquoUnidades

territoriales de anaacutelisis planeamiento y gestioacuten que tienen como propoacutesito definir y precisar el

planeamiento del suelo urbano de expansioacuten y ruralrdquo

30 Buenas praacutecticas para la publicacioacuten de datos

OBTENGA EL MAacuteS ALTO NIVEL EN PUBLICACIOacuteN DE DATOS

Hasta aquiacute hemos publicado las que consideramos como mejores praacutecticas de publicacioacuten de datos Ahora usted como publicador o como entidad debe evaluar si sus datos se estaacuten disponiendo con los maacutes altos y mejores estaacutendares de publicacioacuten

Lo invitamos a que valide en queacute nivel de publicacioacuten se encuentra su entidad teniendo en cuenta el siguiente listado

Nivel Baacutesico

En este nivel se encuentran aquellas entidades que publican sus datos en formatos estaacutendar y reutilizables (praacutectica 5) que integran a la publicacioacuten sus respectivos metadatos (praacutectica 1) y que acompantildean la publicacioacuten con una licencia asociada (praacutectica 2)

Nivel Intermedio

Este nivel lo alcanzan las entidades que superando el nivel baacutesico disponen un mayor volumen de informacioacuten gracias a que anonimizan sus datos (praacutectica 4) implementan medidas de calidad que aumentan la confianza en sus datos (praacutectica 8) incorporan el componente geograacutefico proporcionando valor agregado a sus datos (praacutectica 9) y publican un diccionario de datos que facilita la interpretacioacuten de los datos publicados (praacutectica 6)

Nivel Avanzado

Las entidades que superando el nivel intermedio utilizan vocabularios estandarizados en sus nuevas publicaciones (praacutectica 3) acompantildean la publicacioacuten de sus datos con enlaces a otros recursos (praacutectica 7) y asignan un identificador uacutenico para dato logrando asiacute aumentar su descubrimiento y reutilizacioacuten (praacutectica 10)

31 Buenas praacutecticas para la publicacioacuten de datos

REFERENCIAS

Bernadette Farias Loacutescio Caroline Burle Newton Calegari W3C Data on the Web Best

Practices 31 de enero de 2017 W3C Recommendation URL httpswwww3orgTRdwbp

Bernadette Hyland Ghislain Auguste Atemezing Boris Villazoacuten-Terrazas W3C Best Practices

for Publishing Linked Data 9 de enero de 2014 W3C Note URL httpswwww3orgTRld-bp

Dan Brickley Libby Miller FOAF project FOAF Vocabulary Specification 099 (Paddington

Edition) 14 de enero de 2014 URL httpxmlnscomfoafspec

Dublin Core metadata initiative DCMI Metadata Terms 14 de junio de 2012 DCMI

Recommendation URL httpdublincoreorgdocumentsdcmi-terms

Fadi Maali John Erickson W3C Data Catalog Vocabulary (DCAT) 16 de enero de 2014 W3C

Recommendation URL httpswwww3orgTRvocab-dcat

ISO 19115-12014 (E) Geographic information ndash Metadata Part1 Fundamentals 01 de abril de

2014 International Standard

ISO 191262009 (E) Geographic information -- Feature concept dictionaries and registers

noviembre de 2009 International Standard

ISO 191572013 (E) Geographic information ndash Data quality 15 de diciembre de 2013

International Standard

Jeremy Tandy Payam Barnaghi Linda van den Brink W3C Spatial Data on the Web Best

Practices 5 de enero 2017 W3C Note URL httpswwww3orgTRsdw-bp

T Berners-Lee R Fielding L Masinter IETF Uniform Resource Identifier (URI) Generic Syntax

Enero de 2005 Internet Standard URL httpstoolsietforghtmlrfc3986

World Wide Web Foundation Open Data Barometer URL httpopendatabarometerorg

W3C OWL Working Group W3C OWL 2 Web Ontology Language Document Overview (Second

Edition) 11 de diciembre de 2012 W3C Recommendation URL httpswwww3orgTRowl2-

overview

W3org Semantic Web - W3C URL httpswwww3orgstandardssemanticweb Consultado

el 12 de septiembre de 2018

Page 24: PARA LA PUBLICACIÓN DE DATOSideca.gov.co/.../files/documentacion/buenaspracticaspublicaciondat… · La obtención de datos la realiza cada entidad en el desarrollo de sus actividades

24 Buenas praacutecticas para la publicacioacuten de datos

Recomendacioacuten 2

Identifique y transforme si es necesario los datos que hayan sido registrados en un formato

diferente al establecido para su conjunto de datos Es decir estandarice el formato de salida

del dato que va a publicar El elemento de calidad asociado se denomina ldquoconsistencia de

formatordquo

Localidad Atendidos Localidad Atendidos

Suba 200 Suba 200

Tunjuelito 5008 Tunjuelito 500

Fontiboacuten 40 Fontiboacuten 430

Tunjuelito 500 Tunjuelito 500

Recomendacioacuten 3

Si sus datos tienen alguacuten tipo de clasificacioacuten o rangos previo a la publicacioacuten valide que estos

se hayan registrado correctamente El elemento de calidad asociado se denomina ldquoexactitud de

clasificacioacutenrdquo

Geacutenero Edad Rango de Edad Geacutenero Edad Rango de Edad

Femenino 5 0 lt Edad le 10 Femenino 5 0 lt Edad le 10

Masculino 15 0 lt Edad le 10 Masculino 15 10 lt Edad le 20

Femenino 35 40 lt Edad le 50 Femenino 35 30 lt Edad le 40

Recomendacioacuten 4

Si sus datos representan atributos cuantitativos verifique antes de la publicacioacuten que estos

correspondan a valores conocidos como verdaderos El elemento de calidad asociado se

denomina ldquoexactitud de atributos cuantitativosrdquo

Localidad Mes Temperatura Localidad Mes Temperatura

Chapinero Enero 7degC Chapinero Enero 7degC

Suba Agosto -15degC Suba Agosto 15degC

Tunjuelito Abril 60degC Tunjuelito Abril 16degC

Clasificacioacuten inconsistente

Formato inconsistente

Valor inconsistente

25 Buenas praacutecticas para la publicacioacuten de datos

Recomendacioacuten 5

Si los datos a publicar tienen asociadas fechas de captura o recoleccioacuten de informacioacuten (Por

ejemplo registro de incidentes registro de vacunacioacuten conteo de vehiacuteculos etc) valide que

las fechas registradas coincidan con la fecha del evento capturado El elemento de calidad

asociado se denomina ldquoexactitud de la medicioacuten del tiempordquo

Precipitacioacuten (mm) Fecha de registro Precipitacioacuten (mm) Fecha de registro

00 20580101 00 20180101

01 20180102 01 20180102

126 20510403 126 20180103

20 20180104 20 20180104

Recomendacioacuten 6

Cuando sus datos reflejen informacioacuten determinada por un orden de eventos garantice antes

de la publicacioacuten que este orden sea el adecuado El elemento de calidad asociado se

denomina ldquoconsistencia temporalrdquo

Usuario Escolaridad Periodo de Estudio Usuario Escolaridad Periodo de Estudio

Usuario 1 Preescolar 20030101 ndash 20051231 Usuario 1 Preescolar 20030101 ndash 20051231

Usuario 1 Primaria 20030101 ndash 20101231 Usuario 1 Primaria 20060101 ndash 20101231

Usuario 1 Secundaria 20060101 ndash 20163112 Usuario 1 Secundaria 20110101 ndash 20143112

Usuario 1 Media 20150101 - 20163112 Usuario 1 Media 20150101 - 20163112

Recomendacioacuten 7

Si sus datos incluyen alguna ubicacioacuten (direccioacuten lugar coordenadas) verifique que esta

corresponda a la ubicacioacuten real El elemento de calidad asociado se denomina ldquoexactitud

posicionalrdquo

Eventos Deportivos Lugar Eventos Deportivos Lugar

Evento 1 AK 30 25 90 Evento 1 AK 30 25 90

Evento 2 AC 63 215 20 Evento 2 Parque La Florida

Evento 3 Parque Simoacuten Boliacutevar Evento 3 Parque Simoacuten Boliacutevar

Fecha

inconsistente

Fechas no secuenciales

Lugar inexistente

26 Buenas praacutecticas para la publicacioacuten de datos

9 Incorporar el componente geograacutefico en los datos publicados para optimizar su comprensioacuten uso re-uso y visualizacioacuten

El espacio geograacutefico es un punto de la superficie terrestre que se vea afectado o que afecte de

alguna manera a la humanidad19 Este punto de la superficie puede ser la direccioacuten de una

institucioacuten educativa la ubicacioacuten de un centro de vacunacioacuten el lugar donde se miden las

variaciones de traacutensito en la ciudad los parques de Bogotaacute el edificio en donde se llevan a

cabo los traacutemites de una entidad etc

Los datos que usted captura o recolecta en su quehacer misional siempre estaacuten asociados a un

espacio geograacutefico por lo tanto este componente deberiacutea ser incluido en los datos publicados

Tenga en cuenta que el componente geograacutefico lo puede incorporar incluyendo una ubicacioacuten

asociada a una direccioacuten a un lugar a una localidad a un barrio al nombre de un

establecimiento puacuteblicamente reconocido o a cualquier punto que permita al usuario

identificar la localizacioacuten del dato publicado

iquestQueacute logro

Ampliar el espectro de usuarios que consultan utilizan y reutilizan mis datos

Que mis datos sean maacutes interoperables y maacutes procesados

Que mis datos sean puedan compartir en maacutes plataformas

Que los usuarios puedan visualizar mis datos en un mapa

iexclRecomendaciones

Disponga sus datos agregando un atributo de ubicacioacuten como direcciones coordenadas o

lugares geograacuteficos

Ejemplo 1

Incluya direcciones que permitan localizar espacialmente sus datos

Programa Direccioacuten

Registro de atencioacuten a la ciudadaniacutea CL 138 108 16

Centro de autocuidado KR 18 D 77 A 11 SUR

Familias con un nintildeo en cupos cofinanciados CL 70 A SUR 20 46

Centro de autocuidado KR 18 D 73 A 33 SUR

19 httpenciclopediabanrepculturalorgindexphptitle=Espacio_geogrC3A1fico

27 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo 2

Utilice coordenadas para indicar la ubicacioacuten de sus datos

EPS Coordenada X Coordenada Y

EPS Convida 9087496334 1051342164

Capital Salud EPS 986321006 954875808

EPS Famisanar 9742508812 8837031501

Aliansalud EPS 9716943356 9659706891

Salud Total EPS 9215624975 9625189518

Tenga en cuenta que para publicar datos con coordenadas tendraacute que incluir dentro

de su metadato el Sistema de referencia empleado

MAGNA ndash SIRGAS EPSG 4686 httpsepsgio4686

MAGNA ndash SIRGAS EPSG 3116 httpsepsgio3116

MAGNA ndash BOGOTAacute SR-ORG 7458 httpspatialreferenceorgrefsr-org7458

Ejemplo 3

Tambieacuten puede incluir lugares geograacuteficos descriptivos asiacute

Usuario Vacunado Lugar de Vacunacioacuten

Usuario 1 BOSQUE IZQUIERDO

Usuario 2 LAGUNITAS URBANO

Usuario 3 LA CAPUCHINA

Usuario 4 SAN JOSE SUR

Usuario 5 VENECIA

28 Buenas praacutecticas para la publicacioacuten de datos

10 Asignar un identificador uacutenico que permita aumentar la consulta uso e interoperabilidad del dato publicado

Considere un identificador uacutenico como un texto que permite identificar inequiacutevocamente el

dato publicado Si usted va a publicar un dato buscando que este sea reutilizado por los

usuarios y por su propia entidad asignar un identificador facilitaraacute el descubrimiento y la

citacioacuten del dato a traveacutes del tiempo independientemente del estado la disponibilidad o el

formato de este

En la vida cotidiana mediante la ceacutedula de ciudadaniacutea se asigna a cada ciudadano un nuacutemero

de identificacioacuten uacutenico y a traveacutes de este identificador el ciudadano es reconocido a lo largo de

su vida e incluso despueacutes de su muerte por otras personas yo autoridades En el mundo de la

informacioacuten cada dato deberiacutea viajar con un identificador uacutenico que le permita ser encontrado

y reconocido faacutecilmente entre los demaacutes datos

Ahora bien si usted o su entidad publican continuamente datos establecer un sistema de

identificacioacuten comuacuten le permitiraacute identificar raacutepidamente los datos y los haraacute comparables por

cualquier usuario de manera confiable Esta condicioacuten es previa para lograr una correcta

gestioacuten y reutilizacioacuten de sus datos

iquestQueacute logro

Ampliar el espectro de usuarios que consultan utilizan y reutilizan mis datos

Que mis datos sean maacutes interoperables y maacutes procesados

Que mis datos sean compartidos en maacutes plataformas

Que mis datos puedan vincularse a otros datos en el entorno Web

Que mis datos sean encontrados usados y citados inequiacutevocamente

Garantizar y monitorear la reutilizacioacuten de mis datos

Reducir del uso erroacuteneo de mis datos

iexclRecomendaciones

Establezca un sistema de identificacioacuten comuacuten para los datos que va a publicar

Utilice siempre el identificador asignado para publicar sus datos

29 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo

IDECA ha dispuesto el Sistema de Registro de Iacutetems geograacuteficos

httpgeoitemsidecagovcogeoitemsano una herramienta web desarrollada para la

creacioacuten aprobacioacuten publicacioacuten y mantenimiento de iacutetems geograacuteficos que permite la

asignacioacuten concertada de identificadores y significados uacutenicos que contribuyen a la definicioacuten

de un lenguaje comuacuten para el desarrollo de nuevos sistema de informacioacuten en el Distrito

garantizando con ello su fiabilidad e interoperabilidad Adicionalmente permite almacenar

descripciones de la informacioacuten oficial producida e identificar su respectivo custodio jugando

asiacute un papel importante en el control y seguimiento de la produccioacuten de informacioacuten

geograacutefica

Este sistema asigna un identificador uacutenico a cada uno de los iacutetems creados Dentro de los iacutetems

publicados se reconoce el ID 65 como unidad de planeamiento y siempre que se hace

referencia a este objeto es suficiente nombrarlo asiacute para entender que se habla de ldquoUnidades

territoriales de anaacutelisis planeamiento y gestioacuten que tienen como propoacutesito definir y precisar el

planeamiento del suelo urbano de expansioacuten y ruralrdquo

30 Buenas praacutecticas para la publicacioacuten de datos

OBTENGA EL MAacuteS ALTO NIVEL EN PUBLICACIOacuteN DE DATOS

Hasta aquiacute hemos publicado las que consideramos como mejores praacutecticas de publicacioacuten de datos Ahora usted como publicador o como entidad debe evaluar si sus datos se estaacuten disponiendo con los maacutes altos y mejores estaacutendares de publicacioacuten

Lo invitamos a que valide en queacute nivel de publicacioacuten se encuentra su entidad teniendo en cuenta el siguiente listado

Nivel Baacutesico

En este nivel se encuentran aquellas entidades que publican sus datos en formatos estaacutendar y reutilizables (praacutectica 5) que integran a la publicacioacuten sus respectivos metadatos (praacutectica 1) y que acompantildean la publicacioacuten con una licencia asociada (praacutectica 2)

Nivel Intermedio

Este nivel lo alcanzan las entidades que superando el nivel baacutesico disponen un mayor volumen de informacioacuten gracias a que anonimizan sus datos (praacutectica 4) implementan medidas de calidad que aumentan la confianza en sus datos (praacutectica 8) incorporan el componente geograacutefico proporcionando valor agregado a sus datos (praacutectica 9) y publican un diccionario de datos que facilita la interpretacioacuten de los datos publicados (praacutectica 6)

Nivel Avanzado

Las entidades que superando el nivel intermedio utilizan vocabularios estandarizados en sus nuevas publicaciones (praacutectica 3) acompantildean la publicacioacuten de sus datos con enlaces a otros recursos (praacutectica 7) y asignan un identificador uacutenico para dato logrando asiacute aumentar su descubrimiento y reutilizacioacuten (praacutectica 10)

31 Buenas praacutecticas para la publicacioacuten de datos

REFERENCIAS

Bernadette Farias Loacutescio Caroline Burle Newton Calegari W3C Data on the Web Best

Practices 31 de enero de 2017 W3C Recommendation URL httpswwww3orgTRdwbp

Bernadette Hyland Ghislain Auguste Atemezing Boris Villazoacuten-Terrazas W3C Best Practices

for Publishing Linked Data 9 de enero de 2014 W3C Note URL httpswwww3orgTRld-bp

Dan Brickley Libby Miller FOAF project FOAF Vocabulary Specification 099 (Paddington

Edition) 14 de enero de 2014 URL httpxmlnscomfoafspec

Dublin Core metadata initiative DCMI Metadata Terms 14 de junio de 2012 DCMI

Recommendation URL httpdublincoreorgdocumentsdcmi-terms

Fadi Maali John Erickson W3C Data Catalog Vocabulary (DCAT) 16 de enero de 2014 W3C

Recommendation URL httpswwww3orgTRvocab-dcat

ISO 19115-12014 (E) Geographic information ndash Metadata Part1 Fundamentals 01 de abril de

2014 International Standard

ISO 191262009 (E) Geographic information -- Feature concept dictionaries and registers

noviembre de 2009 International Standard

ISO 191572013 (E) Geographic information ndash Data quality 15 de diciembre de 2013

International Standard

Jeremy Tandy Payam Barnaghi Linda van den Brink W3C Spatial Data on the Web Best

Practices 5 de enero 2017 W3C Note URL httpswwww3orgTRsdw-bp

T Berners-Lee R Fielding L Masinter IETF Uniform Resource Identifier (URI) Generic Syntax

Enero de 2005 Internet Standard URL httpstoolsietforghtmlrfc3986

World Wide Web Foundation Open Data Barometer URL httpopendatabarometerorg

W3C OWL Working Group W3C OWL 2 Web Ontology Language Document Overview (Second

Edition) 11 de diciembre de 2012 W3C Recommendation URL httpswwww3orgTRowl2-

overview

W3org Semantic Web - W3C URL httpswwww3orgstandardssemanticweb Consultado

el 12 de septiembre de 2018

Page 25: PARA LA PUBLICACIÓN DE DATOSideca.gov.co/.../files/documentacion/buenaspracticaspublicaciondat… · La obtención de datos la realiza cada entidad en el desarrollo de sus actividades

25 Buenas praacutecticas para la publicacioacuten de datos

Recomendacioacuten 5

Si los datos a publicar tienen asociadas fechas de captura o recoleccioacuten de informacioacuten (Por

ejemplo registro de incidentes registro de vacunacioacuten conteo de vehiacuteculos etc) valide que

las fechas registradas coincidan con la fecha del evento capturado El elemento de calidad

asociado se denomina ldquoexactitud de la medicioacuten del tiempordquo

Precipitacioacuten (mm) Fecha de registro Precipitacioacuten (mm) Fecha de registro

00 20580101 00 20180101

01 20180102 01 20180102

126 20510403 126 20180103

20 20180104 20 20180104

Recomendacioacuten 6

Cuando sus datos reflejen informacioacuten determinada por un orden de eventos garantice antes

de la publicacioacuten que este orden sea el adecuado El elemento de calidad asociado se

denomina ldquoconsistencia temporalrdquo

Usuario Escolaridad Periodo de Estudio Usuario Escolaridad Periodo de Estudio

Usuario 1 Preescolar 20030101 ndash 20051231 Usuario 1 Preescolar 20030101 ndash 20051231

Usuario 1 Primaria 20030101 ndash 20101231 Usuario 1 Primaria 20060101 ndash 20101231

Usuario 1 Secundaria 20060101 ndash 20163112 Usuario 1 Secundaria 20110101 ndash 20143112

Usuario 1 Media 20150101 - 20163112 Usuario 1 Media 20150101 - 20163112

Recomendacioacuten 7

Si sus datos incluyen alguna ubicacioacuten (direccioacuten lugar coordenadas) verifique que esta

corresponda a la ubicacioacuten real El elemento de calidad asociado se denomina ldquoexactitud

posicionalrdquo

Eventos Deportivos Lugar Eventos Deportivos Lugar

Evento 1 AK 30 25 90 Evento 1 AK 30 25 90

Evento 2 AC 63 215 20 Evento 2 Parque La Florida

Evento 3 Parque Simoacuten Boliacutevar Evento 3 Parque Simoacuten Boliacutevar

Fecha

inconsistente

Fechas no secuenciales

Lugar inexistente

26 Buenas praacutecticas para la publicacioacuten de datos

9 Incorporar el componente geograacutefico en los datos publicados para optimizar su comprensioacuten uso re-uso y visualizacioacuten

El espacio geograacutefico es un punto de la superficie terrestre que se vea afectado o que afecte de

alguna manera a la humanidad19 Este punto de la superficie puede ser la direccioacuten de una

institucioacuten educativa la ubicacioacuten de un centro de vacunacioacuten el lugar donde se miden las

variaciones de traacutensito en la ciudad los parques de Bogotaacute el edificio en donde se llevan a

cabo los traacutemites de una entidad etc

Los datos que usted captura o recolecta en su quehacer misional siempre estaacuten asociados a un

espacio geograacutefico por lo tanto este componente deberiacutea ser incluido en los datos publicados

Tenga en cuenta que el componente geograacutefico lo puede incorporar incluyendo una ubicacioacuten

asociada a una direccioacuten a un lugar a una localidad a un barrio al nombre de un

establecimiento puacuteblicamente reconocido o a cualquier punto que permita al usuario

identificar la localizacioacuten del dato publicado

iquestQueacute logro

Ampliar el espectro de usuarios que consultan utilizan y reutilizan mis datos

Que mis datos sean maacutes interoperables y maacutes procesados

Que mis datos sean puedan compartir en maacutes plataformas

Que los usuarios puedan visualizar mis datos en un mapa

iexclRecomendaciones

Disponga sus datos agregando un atributo de ubicacioacuten como direcciones coordenadas o

lugares geograacuteficos

Ejemplo 1

Incluya direcciones que permitan localizar espacialmente sus datos

Programa Direccioacuten

Registro de atencioacuten a la ciudadaniacutea CL 138 108 16

Centro de autocuidado KR 18 D 77 A 11 SUR

Familias con un nintildeo en cupos cofinanciados CL 70 A SUR 20 46

Centro de autocuidado KR 18 D 73 A 33 SUR

19 httpenciclopediabanrepculturalorgindexphptitle=Espacio_geogrC3A1fico

27 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo 2

Utilice coordenadas para indicar la ubicacioacuten de sus datos

EPS Coordenada X Coordenada Y

EPS Convida 9087496334 1051342164

Capital Salud EPS 986321006 954875808

EPS Famisanar 9742508812 8837031501

Aliansalud EPS 9716943356 9659706891

Salud Total EPS 9215624975 9625189518

Tenga en cuenta que para publicar datos con coordenadas tendraacute que incluir dentro

de su metadato el Sistema de referencia empleado

MAGNA ndash SIRGAS EPSG 4686 httpsepsgio4686

MAGNA ndash SIRGAS EPSG 3116 httpsepsgio3116

MAGNA ndash BOGOTAacute SR-ORG 7458 httpspatialreferenceorgrefsr-org7458

Ejemplo 3

Tambieacuten puede incluir lugares geograacuteficos descriptivos asiacute

Usuario Vacunado Lugar de Vacunacioacuten

Usuario 1 BOSQUE IZQUIERDO

Usuario 2 LAGUNITAS URBANO

Usuario 3 LA CAPUCHINA

Usuario 4 SAN JOSE SUR

Usuario 5 VENECIA

28 Buenas praacutecticas para la publicacioacuten de datos

10 Asignar un identificador uacutenico que permita aumentar la consulta uso e interoperabilidad del dato publicado

Considere un identificador uacutenico como un texto que permite identificar inequiacutevocamente el

dato publicado Si usted va a publicar un dato buscando que este sea reutilizado por los

usuarios y por su propia entidad asignar un identificador facilitaraacute el descubrimiento y la

citacioacuten del dato a traveacutes del tiempo independientemente del estado la disponibilidad o el

formato de este

En la vida cotidiana mediante la ceacutedula de ciudadaniacutea se asigna a cada ciudadano un nuacutemero

de identificacioacuten uacutenico y a traveacutes de este identificador el ciudadano es reconocido a lo largo de

su vida e incluso despueacutes de su muerte por otras personas yo autoridades En el mundo de la

informacioacuten cada dato deberiacutea viajar con un identificador uacutenico que le permita ser encontrado

y reconocido faacutecilmente entre los demaacutes datos

Ahora bien si usted o su entidad publican continuamente datos establecer un sistema de

identificacioacuten comuacuten le permitiraacute identificar raacutepidamente los datos y los haraacute comparables por

cualquier usuario de manera confiable Esta condicioacuten es previa para lograr una correcta

gestioacuten y reutilizacioacuten de sus datos

iquestQueacute logro

Ampliar el espectro de usuarios que consultan utilizan y reutilizan mis datos

Que mis datos sean maacutes interoperables y maacutes procesados

Que mis datos sean compartidos en maacutes plataformas

Que mis datos puedan vincularse a otros datos en el entorno Web

Que mis datos sean encontrados usados y citados inequiacutevocamente

Garantizar y monitorear la reutilizacioacuten de mis datos

Reducir del uso erroacuteneo de mis datos

iexclRecomendaciones

Establezca un sistema de identificacioacuten comuacuten para los datos que va a publicar

Utilice siempre el identificador asignado para publicar sus datos

29 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo

IDECA ha dispuesto el Sistema de Registro de Iacutetems geograacuteficos

httpgeoitemsidecagovcogeoitemsano una herramienta web desarrollada para la

creacioacuten aprobacioacuten publicacioacuten y mantenimiento de iacutetems geograacuteficos que permite la

asignacioacuten concertada de identificadores y significados uacutenicos que contribuyen a la definicioacuten

de un lenguaje comuacuten para el desarrollo de nuevos sistema de informacioacuten en el Distrito

garantizando con ello su fiabilidad e interoperabilidad Adicionalmente permite almacenar

descripciones de la informacioacuten oficial producida e identificar su respectivo custodio jugando

asiacute un papel importante en el control y seguimiento de la produccioacuten de informacioacuten

geograacutefica

Este sistema asigna un identificador uacutenico a cada uno de los iacutetems creados Dentro de los iacutetems

publicados se reconoce el ID 65 como unidad de planeamiento y siempre que se hace

referencia a este objeto es suficiente nombrarlo asiacute para entender que se habla de ldquoUnidades

territoriales de anaacutelisis planeamiento y gestioacuten que tienen como propoacutesito definir y precisar el

planeamiento del suelo urbano de expansioacuten y ruralrdquo

30 Buenas praacutecticas para la publicacioacuten de datos

OBTENGA EL MAacuteS ALTO NIVEL EN PUBLICACIOacuteN DE DATOS

Hasta aquiacute hemos publicado las que consideramos como mejores praacutecticas de publicacioacuten de datos Ahora usted como publicador o como entidad debe evaluar si sus datos se estaacuten disponiendo con los maacutes altos y mejores estaacutendares de publicacioacuten

Lo invitamos a que valide en queacute nivel de publicacioacuten se encuentra su entidad teniendo en cuenta el siguiente listado

Nivel Baacutesico

En este nivel se encuentran aquellas entidades que publican sus datos en formatos estaacutendar y reutilizables (praacutectica 5) que integran a la publicacioacuten sus respectivos metadatos (praacutectica 1) y que acompantildean la publicacioacuten con una licencia asociada (praacutectica 2)

Nivel Intermedio

Este nivel lo alcanzan las entidades que superando el nivel baacutesico disponen un mayor volumen de informacioacuten gracias a que anonimizan sus datos (praacutectica 4) implementan medidas de calidad que aumentan la confianza en sus datos (praacutectica 8) incorporan el componente geograacutefico proporcionando valor agregado a sus datos (praacutectica 9) y publican un diccionario de datos que facilita la interpretacioacuten de los datos publicados (praacutectica 6)

Nivel Avanzado

Las entidades que superando el nivel intermedio utilizan vocabularios estandarizados en sus nuevas publicaciones (praacutectica 3) acompantildean la publicacioacuten de sus datos con enlaces a otros recursos (praacutectica 7) y asignan un identificador uacutenico para dato logrando asiacute aumentar su descubrimiento y reutilizacioacuten (praacutectica 10)

31 Buenas praacutecticas para la publicacioacuten de datos

REFERENCIAS

Bernadette Farias Loacutescio Caroline Burle Newton Calegari W3C Data on the Web Best

Practices 31 de enero de 2017 W3C Recommendation URL httpswwww3orgTRdwbp

Bernadette Hyland Ghislain Auguste Atemezing Boris Villazoacuten-Terrazas W3C Best Practices

for Publishing Linked Data 9 de enero de 2014 W3C Note URL httpswwww3orgTRld-bp

Dan Brickley Libby Miller FOAF project FOAF Vocabulary Specification 099 (Paddington

Edition) 14 de enero de 2014 URL httpxmlnscomfoafspec

Dublin Core metadata initiative DCMI Metadata Terms 14 de junio de 2012 DCMI

Recommendation URL httpdublincoreorgdocumentsdcmi-terms

Fadi Maali John Erickson W3C Data Catalog Vocabulary (DCAT) 16 de enero de 2014 W3C

Recommendation URL httpswwww3orgTRvocab-dcat

ISO 19115-12014 (E) Geographic information ndash Metadata Part1 Fundamentals 01 de abril de

2014 International Standard

ISO 191262009 (E) Geographic information -- Feature concept dictionaries and registers

noviembre de 2009 International Standard

ISO 191572013 (E) Geographic information ndash Data quality 15 de diciembre de 2013

International Standard

Jeremy Tandy Payam Barnaghi Linda van den Brink W3C Spatial Data on the Web Best

Practices 5 de enero 2017 W3C Note URL httpswwww3orgTRsdw-bp

T Berners-Lee R Fielding L Masinter IETF Uniform Resource Identifier (URI) Generic Syntax

Enero de 2005 Internet Standard URL httpstoolsietforghtmlrfc3986

World Wide Web Foundation Open Data Barometer URL httpopendatabarometerorg

W3C OWL Working Group W3C OWL 2 Web Ontology Language Document Overview (Second

Edition) 11 de diciembre de 2012 W3C Recommendation URL httpswwww3orgTRowl2-

overview

W3org Semantic Web - W3C URL httpswwww3orgstandardssemanticweb Consultado

el 12 de septiembre de 2018

Page 26: PARA LA PUBLICACIÓN DE DATOSideca.gov.co/.../files/documentacion/buenaspracticaspublicaciondat… · La obtención de datos la realiza cada entidad en el desarrollo de sus actividades

26 Buenas praacutecticas para la publicacioacuten de datos

9 Incorporar el componente geograacutefico en los datos publicados para optimizar su comprensioacuten uso re-uso y visualizacioacuten

El espacio geograacutefico es un punto de la superficie terrestre que se vea afectado o que afecte de

alguna manera a la humanidad19 Este punto de la superficie puede ser la direccioacuten de una

institucioacuten educativa la ubicacioacuten de un centro de vacunacioacuten el lugar donde se miden las

variaciones de traacutensito en la ciudad los parques de Bogotaacute el edificio en donde se llevan a

cabo los traacutemites de una entidad etc

Los datos que usted captura o recolecta en su quehacer misional siempre estaacuten asociados a un

espacio geograacutefico por lo tanto este componente deberiacutea ser incluido en los datos publicados

Tenga en cuenta que el componente geograacutefico lo puede incorporar incluyendo una ubicacioacuten

asociada a una direccioacuten a un lugar a una localidad a un barrio al nombre de un

establecimiento puacuteblicamente reconocido o a cualquier punto que permita al usuario

identificar la localizacioacuten del dato publicado

iquestQueacute logro

Ampliar el espectro de usuarios que consultan utilizan y reutilizan mis datos

Que mis datos sean maacutes interoperables y maacutes procesados

Que mis datos sean puedan compartir en maacutes plataformas

Que los usuarios puedan visualizar mis datos en un mapa

iexclRecomendaciones

Disponga sus datos agregando un atributo de ubicacioacuten como direcciones coordenadas o

lugares geograacuteficos

Ejemplo 1

Incluya direcciones que permitan localizar espacialmente sus datos

Programa Direccioacuten

Registro de atencioacuten a la ciudadaniacutea CL 138 108 16

Centro de autocuidado KR 18 D 77 A 11 SUR

Familias con un nintildeo en cupos cofinanciados CL 70 A SUR 20 46

Centro de autocuidado KR 18 D 73 A 33 SUR

19 httpenciclopediabanrepculturalorgindexphptitle=Espacio_geogrC3A1fico

27 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo 2

Utilice coordenadas para indicar la ubicacioacuten de sus datos

EPS Coordenada X Coordenada Y

EPS Convida 9087496334 1051342164

Capital Salud EPS 986321006 954875808

EPS Famisanar 9742508812 8837031501

Aliansalud EPS 9716943356 9659706891

Salud Total EPS 9215624975 9625189518

Tenga en cuenta que para publicar datos con coordenadas tendraacute que incluir dentro

de su metadato el Sistema de referencia empleado

MAGNA ndash SIRGAS EPSG 4686 httpsepsgio4686

MAGNA ndash SIRGAS EPSG 3116 httpsepsgio3116

MAGNA ndash BOGOTAacute SR-ORG 7458 httpspatialreferenceorgrefsr-org7458

Ejemplo 3

Tambieacuten puede incluir lugares geograacuteficos descriptivos asiacute

Usuario Vacunado Lugar de Vacunacioacuten

Usuario 1 BOSQUE IZQUIERDO

Usuario 2 LAGUNITAS URBANO

Usuario 3 LA CAPUCHINA

Usuario 4 SAN JOSE SUR

Usuario 5 VENECIA

28 Buenas praacutecticas para la publicacioacuten de datos

10 Asignar un identificador uacutenico que permita aumentar la consulta uso e interoperabilidad del dato publicado

Considere un identificador uacutenico como un texto que permite identificar inequiacutevocamente el

dato publicado Si usted va a publicar un dato buscando que este sea reutilizado por los

usuarios y por su propia entidad asignar un identificador facilitaraacute el descubrimiento y la

citacioacuten del dato a traveacutes del tiempo independientemente del estado la disponibilidad o el

formato de este

En la vida cotidiana mediante la ceacutedula de ciudadaniacutea se asigna a cada ciudadano un nuacutemero

de identificacioacuten uacutenico y a traveacutes de este identificador el ciudadano es reconocido a lo largo de

su vida e incluso despueacutes de su muerte por otras personas yo autoridades En el mundo de la

informacioacuten cada dato deberiacutea viajar con un identificador uacutenico que le permita ser encontrado

y reconocido faacutecilmente entre los demaacutes datos

Ahora bien si usted o su entidad publican continuamente datos establecer un sistema de

identificacioacuten comuacuten le permitiraacute identificar raacutepidamente los datos y los haraacute comparables por

cualquier usuario de manera confiable Esta condicioacuten es previa para lograr una correcta

gestioacuten y reutilizacioacuten de sus datos

iquestQueacute logro

Ampliar el espectro de usuarios que consultan utilizan y reutilizan mis datos

Que mis datos sean maacutes interoperables y maacutes procesados

Que mis datos sean compartidos en maacutes plataformas

Que mis datos puedan vincularse a otros datos en el entorno Web

Que mis datos sean encontrados usados y citados inequiacutevocamente

Garantizar y monitorear la reutilizacioacuten de mis datos

Reducir del uso erroacuteneo de mis datos

iexclRecomendaciones

Establezca un sistema de identificacioacuten comuacuten para los datos que va a publicar

Utilice siempre el identificador asignado para publicar sus datos

29 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo

IDECA ha dispuesto el Sistema de Registro de Iacutetems geograacuteficos

httpgeoitemsidecagovcogeoitemsano una herramienta web desarrollada para la

creacioacuten aprobacioacuten publicacioacuten y mantenimiento de iacutetems geograacuteficos que permite la

asignacioacuten concertada de identificadores y significados uacutenicos que contribuyen a la definicioacuten

de un lenguaje comuacuten para el desarrollo de nuevos sistema de informacioacuten en el Distrito

garantizando con ello su fiabilidad e interoperabilidad Adicionalmente permite almacenar

descripciones de la informacioacuten oficial producida e identificar su respectivo custodio jugando

asiacute un papel importante en el control y seguimiento de la produccioacuten de informacioacuten

geograacutefica

Este sistema asigna un identificador uacutenico a cada uno de los iacutetems creados Dentro de los iacutetems

publicados se reconoce el ID 65 como unidad de planeamiento y siempre que se hace

referencia a este objeto es suficiente nombrarlo asiacute para entender que se habla de ldquoUnidades

territoriales de anaacutelisis planeamiento y gestioacuten que tienen como propoacutesito definir y precisar el

planeamiento del suelo urbano de expansioacuten y ruralrdquo

30 Buenas praacutecticas para la publicacioacuten de datos

OBTENGA EL MAacuteS ALTO NIVEL EN PUBLICACIOacuteN DE DATOS

Hasta aquiacute hemos publicado las que consideramos como mejores praacutecticas de publicacioacuten de datos Ahora usted como publicador o como entidad debe evaluar si sus datos se estaacuten disponiendo con los maacutes altos y mejores estaacutendares de publicacioacuten

Lo invitamos a que valide en queacute nivel de publicacioacuten se encuentra su entidad teniendo en cuenta el siguiente listado

Nivel Baacutesico

En este nivel se encuentran aquellas entidades que publican sus datos en formatos estaacutendar y reutilizables (praacutectica 5) que integran a la publicacioacuten sus respectivos metadatos (praacutectica 1) y que acompantildean la publicacioacuten con una licencia asociada (praacutectica 2)

Nivel Intermedio

Este nivel lo alcanzan las entidades que superando el nivel baacutesico disponen un mayor volumen de informacioacuten gracias a que anonimizan sus datos (praacutectica 4) implementan medidas de calidad que aumentan la confianza en sus datos (praacutectica 8) incorporan el componente geograacutefico proporcionando valor agregado a sus datos (praacutectica 9) y publican un diccionario de datos que facilita la interpretacioacuten de los datos publicados (praacutectica 6)

Nivel Avanzado

Las entidades que superando el nivel intermedio utilizan vocabularios estandarizados en sus nuevas publicaciones (praacutectica 3) acompantildean la publicacioacuten de sus datos con enlaces a otros recursos (praacutectica 7) y asignan un identificador uacutenico para dato logrando asiacute aumentar su descubrimiento y reutilizacioacuten (praacutectica 10)

31 Buenas praacutecticas para la publicacioacuten de datos

REFERENCIAS

Bernadette Farias Loacutescio Caroline Burle Newton Calegari W3C Data on the Web Best

Practices 31 de enero de 2017 W3C Recommendation URL httpswwww3orgTRdwbp

Bernadette Hyland Ghislain Auguste Atemezing Boris Villazoacuten-Terrazas W3C Best Practices

for Publishing Linked Data 9 de enero de 2014 W3C Note URL httpswwww3orgTRld-bp

Dan Brickley Libby Miller FOAF project FOAF Vocabulary Specification 099 (Paddington

Edition) 14 de enero de 2014 URL httpxmlnscomfoafspec

Dublin Core metadata initiative DCMI Metadata Terms 14 de junio de 2012 DCMI

Recommendation URL httpdublincoreorgdocumentsdcmi-terms

Fadi Maali John Erickson W3C Data Catalog Vocabulary (DCAT) 16 de enero de 2014 W3C

Recommendation URL httpswwww3orgTRvocab-dcat

ISO 19115-12014 (E) Geographic information ndash Metadata Part1 Fundamentals 01 de abril de

2014 International Standard

ISO 191262009 (E) Geographic information -- Feature concept dictionaries and registers

noviembre de 2009 International Standard

ISO 191572013 (E) Geographic information ndash Data quality 15 de diciembre de 2013

International Standard

Jeremy Tandy Payam Barnaghi Linda van den Brink W3C Spatial Data on the Web Best

Practices 5 de enero 2017 W3C Note URL httpswwww3orgTRsdw-bp

T Berners-Lee R Fielding L Masinter IETF Uniform Resource Identifier (URI) Generic Syntax

Enero de 2005 Internet Standard URL httpstoolsietforghtmlrfc3986

World Wide Web Foundation Open Data Barometer URL httpopendatabarometerorg

W3C OWL Working Group W3C OWL 2 Web Ontology Language Document Overview (Second

Edition) 11 de diciembre de 2012 W3C Recommendation URL httpswwww3orgTRowl2-

overview

W3org Semantic Web - W3C URL httpswwww3orgstandardssemanticweb Consultado

el 12 de septiembre de 2018

Page 27: PARA LA PUBLICACIÓN DE DATOSideca.gov.co/.../files/documentacion/buenaspracticaspublicaciondat… · La obtención de datos la realiza cada entidad en el desarrollo de sus actividades

27 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo 2

Utilice coordenadas para indicar la ubicacioacuten de sus datos

EPS Coordenada X Coordenada Y

EPS Convida 9087496334 1051342164

Capital Salud EPS 986321006 954875808

EPS Famisanar 9742508812 8837031501

Aliansalud EPS 9716943356 9659706891

Salud Total EPS 9215624975 9625189518

Tenga en cuenta que para publicar datos con coordenadas tendraacute que incluir dentro

de su metadato el Sistema de referencia empleado

MAGNA ndash SIRGAS EPSG 4686 httpsepsgio4686

MAGNA ndash SIRGAS EPSG 3116 httpsepsgio3116

MAGNA ndash BOGOTAacute SR-ORG 7458 httpspatialreferenceorgrefsr-org7458

Ejemplo 3

Tambieacuten puede incluir lugares geograacuteficos descriptivos asiacute

Usuario Vacunado Lugar de Vacunacioacuten

Usuario 1 BOSQUE IZQUIERDO

Usuario 2 LAGUNITAS URBANO

Usuario 3 LA CAPUCHINA

Usuario 4 SAN JOSE SUR

Usuario 5 VENECIA

28 Buenas praacutecticas para la publicacioacuten de datos

10 Asignar un identificador uacutenico que permita aumentar la consulta uso e interoperabilidad del dato publicado

Considere un identificador uacutenico como un texto que permite identificar inequiacutevocamente el

dato publicado Si usted va a publicar un dato buscando que este sea reutilizado por los

usuarios y por su propia entidad asignar un identificador facilitaraacute el descubrimiento y la

citacioacuten del dato a traveacutes del tiempo independientemente del estado la disponibilidad o el

formato de este

En la vida cotidiana mediante la ceacutedula de ciudadaniacutea se asigna a cada ciudadano un nuacutemero

de identificacioacuten uacutenico y a traveacutes de este identificador el ciudadano es reconocido a lo largo de

su vida e incluso despueacutes de su muerte por otras personas yo autoridades En el mundo de la

informacioacuten cada dato deberiacutea viajar con un identificador uacutenico que le permita ser encontrado

y reconocido faacutecilmente entre los demaacutes datos

Ahora bien si usted o su entidad publican continuamente datos establecer un sistema de

identificacioacuten comuacuten le permitiraacute identificar raacutepidamente los datos y los haraacute comparables por

cualquier usuario de manera confiable Esta condicioacuten es previa para lograr una correcta

gestioacuten y reutilizacioacuten de sus datos

iquestQueacute logro

Ampliar el espectro de usuarios que consultan utilizan y reutilizan mis datos

Que mis datos sean maacutes interoperables y maacutes procesados

Que mis datos sean compartidos en maacutes plataformas

Que mis datos puedan vincularse a otros datos en el entorno Web

Que mis datos sean encontrados usados y citados inequiacutevocamente

Garantizar y monitorear la reutilizacioacuten de mis datos

Reducir del uso erroacuteneo de mis datos

iexclRecomendaciones

Establezca un sistema de identificacioacuten comuacuten para los datos que va a publicar

Utilice siempre el identificador asignado para publicar sus datos

29 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo

IDECA ha dispuesto el Sistema de Registro de Iacutetems geograacuteficos

httpgeoitemsidecagovcogeoitemsano una herramienta web desarrollada para la

creacioacuten aprobacioacuten publicacioacuten y mantenimiento de iacutetems geograacuteficos que permite la

asignacioacuten concertada de identificadores y significados uacutenicos que contribuyen a la definicioacuten

de un lenguaje comuacuten para el desarrollo de nuevos sistema de informacioacuten en el Distrito

garantizando con ello su fiabilidad e interoperabilidad Adicionalmente permite almacenar

descripciones de la informacioacuten oficial producida e identificar su respectivo custodio jugando

asiacute un papel importante en el control y seguimiento de la produccioacuten de informacioacuten

geograacutefica

Este sistema asigna un identificador uacutenico a cada uno de los iacutetems creados Dentro de los iacutetems

publicados se reconoce el ID 65 como unidad de planeamiento y siempre que se hace

referencia a este objeto es suficiente nombrarlo asiacute para entender que se habla de ldquoUnidades

territoriales de anaacutelisis planeamiento y gestioacuten que tienen como propoacutesito definir y precisar el

planeamiento del suelo urbano de expansioacuten y ruralrdquo

30 Buenas praacutecticas para la publicacioacuten de datos

OBTENGA EL MAacuteS ALTO NIVEL EN PUBLICACIOacuteN DE DATOS

Hasta aquiacute hemos publicado las que consideramos como mejores praacutecticas de publicacioacuten de datos Ahora usted como publicador o como entidad debe evaluar si sus datos se estaacuten disponiendo con los maacutes altos y mejores estaacutendares de publicacioacuten

Lo invitamos a que valide en queacute nivel de publicacioacuten se encuentra su entidad teniendo en cuenta el siguiente listado

Nivel Baacutesico

En este nivel se encuentran aquellas entidades que publican sus datos en formatos estaacutendar y reutilizables (praacutectica 5) que integran a la publicacioacuten sus respectivos metadatos (praacutectica 1) y que acompantildean la publicacioacuten con una licencia asociada (praacutectica 2)

Nivel Intermedio

Este nivel lo alcanzan las entidades que superando el nivel baacutesico disponen un mayor volumen de informacioacuten gracias a que anonimizan sus datos (praacutectica 4) implementan medidas de calidad que aumentan la confianza en sus datos (praacutectica 8) incorporan el componente geograacutefico proporcionando valor agregado a sus datos (praacutectica 9) y publican un diccionario de datos que facilita la interpretacioacuten de los datos publicados (praacutectica 6)

Nivel Avanzado

Las entidades que superando el nivel intermedio utilizan vocabularios estandarizados en sus nuevas publicaciones (praacutectica 3) acompantildean la publicacioacuten de sus datos con enlaces a otros recursos (praacutectica 7) y asignan un identificador uacutenico para dato logrando asiacute aumentar su descubrimiento y reutilizacioacuten (praacutectica 10)

31 Buenas praacutecticas para la publicacioacuten de datos

REFERENCIAS

Bernadette Farias Loacutescio Caroline Burle Newton Calegari W3C Data on the Web Best

Practices 31 de enero de 2017 W3C Recommendation URL httpswwww3orgTRdwbp

Bernadette Hyland Ghislain Auguste Atemezing Boris Villazoacuten-Terrazas W3C Best Practices

for Publishing Linked Data 9 de enero de 2014 W3C Note URL httpswwww3orgTRld-bp

Dan Brickley Libby Miller FOAF project FOAF Vocabulary Specification 099 (Paddington

Edition) 14 de enero de 2014 URL httpxmlnscomfoafspec

Dublin Core metadata initiative DCMI Metadata Terms 14 de junio de 2012 DCMI

Recommendation URL httpdublincoreorgdocumentsdcmi-terms

Fadi Maali John Erickson W3C Data Catalog Vocabulary (DCAT) 16 de enero de 2014 W3C

Recommendation URL httpswwww3orgTRvocab-dcat

ISO 19115-12014 (E) Geographic information ndash Metadata Part1 Fundamentals 01 de abril de

2014 International Standard

ISO 191262009 (E) Geographic information -- Feature concept dictionaries and registers

noviembre de 2009 International Standard

ISO 191572013 (E) Geographic information ndash Data quality 15 de diciembre de 2013

International Standard

Jeremy Tandy Payam Barnaghi Linda van den Brink W3C Spatial Data on the Web Best

Practices 5 de enero 2017 W3C Note URL httpswwww3orgTRsdw-bp

T Berners-Lee R Fielding L Masinter IETF Uniform Resource Identifier (URI) Generic Syntax

Enero de 2005 Internet Standard URL httpstoolsietforghtmlrfc3986

World Wide Web Foundation Open Data Barometer URL httpopendatabarometerorg

W3C OWL Working Group W3C OWL 2 Web Ontology Language Document Overview (Second

Edition) 11 de diciembre de 2012 W3C Recommendation URL httpswwww3orgTRowl2-

overview

W3org Semantic Web - W3C URL httpswwww3orgstandardssemanticweb Consultado

el 12 de septiembre de 2018

Page 28: PARA LA PUBLICACIÓN DE DATOSideca.gov.co/.../files/documentacion/buenaspracticaspublicaciondat… · La obtención de datos la realiza cada entidad en el desarrollo de sus actividades

28 Buenas praacutecticas para la publicacioacuten de datos

10 Asignar un identificador uacutenico que permita aumentar la consulta uso e interoperabilidad del dato publicado

Considere un identificador uacutenico como un texto que permite identificar inequiacutevocamente el

dato publicado Si usted va a publicar un dato buscando que este sea reutilizado por los

usuarios y por su propia entidad asignar un identificador facilitaraacute el descubrimiento y la

citacioacuten del dato a traveacutes del tiempo independientemente del estado la disponibilidad o el

formato de este

En la vida cotidiana mediante la ceacutedula de ciudadaniacutea se asigna a cada ciudadano un nuacutemero

de identificacioacuten uacutenico y a traveacutes de este identificador el ciudadano es reconocido a lo largo de

su vida e incluso despueacutes de su muerte por otras personas yo autoridades En el mundo de la

informacioacuten cada dato deberiacutea viajar con un identificador uacutenico que le permita ser encontrado

y reconocido faacutecilmente entre los demaacutes datos

Ahora bien si usted o su entidad publican continuamente datos establecer un sistema de

identificacioacuten comuacuten le permitiraacute identificar raacutepidamente los datos y los haraacute comparables por

cualquier usuario de manera confiable Esta condicioacuten es previa para lograr una correcta

gestioacuten y reutilizacioacuten de sus datos

iquestQueacute logro

Ampliar el espectro de usuarios que consultan utilizan y reutilizan mis datos

Que mis datos sean maacutes interoperables y maacutes procesados

Que mis datos sean compartidos en maacutes plataformas

Que mis datos puedan vincularse a otros datos en el entorno Web

Que mis datos sean encontrados usados y citados inequiacutevocamente

Garantizar y monitorear la reutilizacioacuten de mis datos

Reducir del uso erroacuteneo de mis datos

iexclRecomendaciones

Establezca un sistema de identificacioacuten comuacuten para los datos que va a publicar

Utilice siempre el identificador asignado para publicar sus datos

29 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo

IDECA ha dispuesto el Sistema de Registro de Iacutetems geograacuteficos

httpgeoitemsidecagovcogeoitemsano una herramienta web desarrollada para la

creacioacuten aprobacioacuten publicacioacuten y mantenimiento de iacutetems geograacuteficos que permite la

asignacioacuten concertada de identificadores y significados uacutenicos que contribuyen a la definicioacuten

de un lenguaje comuacuten para el desarrollo de nuevos sistema de informacioacuten en el Distrito

garantizando con ello su fiabilidad e interoperabilidad Adicionalmente permite almacenar

descripciones de la informacioacuten oficial producida e identificar su respectivo custodio jugando

asiacute un papel importante en el control y seguimiento de la produccioacuten de informacioacuten

geograacutefica

Este sistema asigna un identificador uacutenico a cada uno de los iacutetems creados Dentro de los iacutetems

publicados se reconoce el ID 65 como unidad de planeamiento y siempre que se hace

referencia a este objeto es suficiente nombrarlo asiacute para entender que se habla de ldquoUnidades

territoriales de anaacutelisis planeamiento y gestioacuten que tienen como propoacutesito definir y precisar el

planeamiento del suelo urbano de expansioacuten y ruralrdquo

30 Buenas praacutecticas para la publicacioacuten de datos

OBTENGA EL MAacuteS ALTO NIVEL EN PUBLICACIOacuteN DE DATOS

Hasta aquiacute hemos publicado las que consideramos como mejores praacutecticas de publicacioacuten de datos Ahora usted como publicador o como entidad debe evaluar si sus datos se estaacuten disponiendo con los maacutes altos y mejores estaacutendares de publicacioacuten

Lo invitamos a que valide en queacute nivel de publicacioacuten se encuentra su entidad teniendo en cuenta el siguiente listado

Nivel Baacutesico

En este nivel se encuentran aquellas entidades que publican sus datos en formatos estaacutendar y reutilizables (praacutectica 5) que integran a la publicacioacuten sus respectivos metadatos (praacutectica 1) y que acompantildean la publicacioacuten con una licencia asociada (praacutectica 2)

Nivel Intermedio

Este nivel lo alcanzan las entidades que superando el nivel baacutesico disponen un mayor volumen de informacioacuten gracias a que anonimizan sus datos (praacutectica 4) implementan medidas de calidad que aumentan la confianza en sus datos (praacutectica 8) incorporan el componente geograacutefico proporcionando valor agregado a sus datos (praacutectica 9) y publican un diccionario de datos que facilita la interpretacioacuten de los datos publicados (praacutectica 6)

Nivel Avanzado

Las entidades que superando el nivel intermedio utilizan vocabularios estandarizados en sus nuevas publicaciones (praacutectica 3) acompantildean la publicacioacuten de sus datos con enlaces a otros recursos (praacutectica 7) y asignan un identificador uacutenico para dato logrando asiacute aumentar su descubrimiento y reutilizacioacuten (praacutectica 10)

31 Buenas praacutecticas para la publicacioacuten de datos

REFERENCIAS

Bernadette Farias Loacutescio Caroline Burle Newton Calegari W3C Data on the Web Best

Practices 31 de enero de 2017 W3C Recommendation URL httpswwww3orgTRdwbp

Bernadette Hyland Ghislain Auguste Atemezing Boris Villazoacuten-Terrazas W3C Best Practices

for Publishing Linked Data 9 de enero de 2014 W3C Note URL httpswwww3orgTRld-bp

Dan Brickley Libby Miller FOAF project FOAF Vocabulary Specification 099 (Paddington

Edition) 14 de enero de 2014 URL httpxmlnscomfoafspec

Dublin Core metadata initiative DCMI Metadata Terms 14 de junio de 2012 DCMI

Recommendation URL httpdublincoreorgdocumentsdcmi-terms

Fadi Maali John Erickson W3C Data Catalog Vocabulary (DCAT) 16 de enero de 2014 W3C

Recommendation URL httpswwww3orgTRvocab-dcat

ISO 19115-12014 (E) Geographic information ndash Metadata Part1 Fundamentals 01 de abril de

2014 International Standard

ISO 191262009 (E) Geographic information -- Feature concept dictionaries and registers

noviembre de 2009 International Standard

ISO 191572013 (E) Geographic information ndash Data quality 15 de diciembre de 2013

International Standard

Jeremy Tandy Payam Barnaghi Linda van den Brink W3C Spatial Data on the Web Best

Practices 5 de enero 2017 W3C Note URL httpswwww3orgTRsdw-bp

T Berners-Lee R Fielding L Masinter IETF Uniform Resource Identifier (URI) Generic Syntax

Enero de 2005 Internet Standard URL httpstoolsietforghtmlrfc3986

World Wide Web Foundation Open Data Barometer URL httpopendatabarometerorg

W3C OWL Working Group W3C OWL 2 Web Ontology Language Document Overview (Second

Edition) 11 de diciembre de 2012 W3C Recommendation URL httpswwww3orgTRowl2-

overview

W3org Semantic Web - W3C URL httpswwww3orgstandardssemanticweb Consultado

el 12 de septiembre de 2018

Page 29: PARA LA PUBLICACIÓN DE DATOSideca.gov.co/.../files/documentacion/buenaspracticaspublicaciondat… · La obtención de datos la realiza cada entidad en el desarrollo de sus actividades

29 Buenas praacutecticas para la publicacioacuten de datos

Ejemplo

IDECA ha dispuesto el Sistema de Registro de Iacutetems geograacuteficos

httpgeoitemsidecagovcogeoitemsano una herramienta web desarrollada para la

creacioacuten aprobacioacuten publicacioacuten y mantenimiento de iacutetems geograacuteficos que permite la

asignacioacuten concertada de identificadores y significados uacutenicos que contribuyen a la definicioacuten

de un lenguaje comuacuten para el desarrollo de nuevos sistema de informacioacuten en el Distrito

garantizando con ello su fiabilidad e interoperabilidad Adicionalmente permite almacenar

descripciones de la informacioacuten oficial producida e identificar su respectivo custodio jugando

asiacute un papel importante en el control y seguimiento de la produccioacuten de informacioacuten

geograacutefica

Este sistema asigna un identificador uacutenico a cada uno de los iacutetems creados Dentro de los iacutetems

publicados se reconoce el ID 65 como unidad de planeamiento y siempre que se hace

referencia a este objeto es suficiente nombrarlo asiacute para entender que se habla de ldquoUnidades

territoriales de anaacutelisis planeamiento y gestioacuten que tienen como propoacutesito definir y precisar el

planeamiento del suelo urbano de expansioacuten y ruralrdquo

30 Buenas praacutecticas para la publicacioacuten de datos

OBTENGA EL MAacuteS ALTO NIVEL EN PUBLICACIOacuteN DE DATOS

Hasta aquiacute hemos publicado las que consideramos como mejores praacutecticas de publicacioacuten de datos Ahora usted como publicador o como entidad debe evaluar si sus datos se estaacuten disponiendo con los maacutes altos y mejores estaacutendares de publicacioacuten

Lo invitamos a que valide en queacute nivel de publicacioacuten se encuentra su entidad teniendo en cuenta el siguiente listado

Nivel Baacutesico

En este nivel se encuentran aquellas entidades que publican sus datos en formatos estaacutendar y reutilizables (praacutectica 5) que integran a la publicacioacuten sus respectivos metadatos (praacutectica 1) y que acompantildean la publicacioacuten con una licencia asociada (praacutectica 2)

Nivel Intermedio

Este nivel lo alcanzan las entidades que superando el nivel baacutesico disponen un mayor volumen de informacioacuten gracias a que anonimizan sus datos (praacutectica 4) implementan medidas de calidad que aumentan la confianza en sus datos (praacutectica 8) incorporan el componente geograacutefico proporcionando valor agregado a sus datos (praacutectica 9) y publican un diccionario de datos que facilita la interpretacioacuten de los datos publicados (praacutectica 6)

Nivel Avanzado

Las entidades que superando el nivel intermedio utilizan vocabularios estandarizados en sus nuevas publicaciones (praacutectica 3) acompantildean la publicacioacuten de sus datos con enlaces a otros recursos (praacutectica 7) y asignan un identificador uacutenico para dato logrando asiacute aumentar su descubrimiento y reutilizacioacuten (praacutectica 10)

31 Buenas praacutecticas para la publicacioacuten de datos

REFERENCIAS

Bernadette Farias Loacutescio Caroline Burle Newton Calegari W3C Data on the Web Best

Practices 31 de enero de 2017 W3C Recommendation URL httpswwww3orgTRdwbp

Bernadette Hyland Ghislain Auguste Atemezing Boris Villazoacuten-Terrazas W3C Best Practices

for Publishing Linked Data 9 de enero de 2014 W3C Note URL httpswwww3orgTRld-bp

Dan Brickley Libby Miller FOAF project FOAF Vocabulary Specification 099 (Paddington

Edition) 14 de enero de 2014 URL httpxmlnscomfoafspec

Dublin Core metadata initiative DCMI Metadata Terms 14 de junio de 2012 DCMI

Recommendation URL httpdublincoreorgdocumentsdcmi-terms

Fadi Maali John Erickson W3C Data Catalog Vocabulary (DCAT) 16 de enero de 2014 W3C

Recommendation URL httpswwww3orgTRvocab-dcat

ISO 19115-12014 (E) Geographic information ndash Metadata Part1 Fundamentals 01 de abril de

2014 International Standard

ISO 191262009 (E) Geographic information -- Feature concept dictionaries and registers

noviembre de 2009 International Standard

ISO 191572013 (E) Geographic information ndash Data quality 15 de diciembre de 2013

International Standard

Jeremy Tandy Payam Barnaghi Linda van den Brink W3C Spatial Data on the Web Best

Practices 5 de enero 2017 W3C Note URL httpswwww3orgTRsdw-bp

T Berners-Lee R Fielding L Masinter IETF Uniform Resource Identifier (URI) Generic Syntax

Enero de 2005 Internet Standard URL httpstoolsietforghtmlrfc3986

World Wide Web Foundation Open Data Barometer URL httpopendatabarometerorg

W3C OWL Working Group W3C OWL 2 Web Ontology Language Document Overview (Second

Edition) 11 de diciembre de 2012 W3C Recommendation URL httpswwww3orgTRowl2-

overview

W3org Semantic Web - W3C URL httpswwww3orgstandardssemanticweb Consultado

el 12 de septiembre de 2018

Page 30: PARA LA PUBLICACIÓN DE DATOSideca.gov.co/.../files/documentacion/buenaspracticaspublicaciondat… · La obtención de datos la realiza cada entidad en el desarrollo de sus actividades

30 Buenas praacutecticas para la publicacioacuten de datos

OBTENGA EL MAacuteS ALTO NIVEL EN PUBLICACIOacuteN DE DATOS

Hasta aquiacute hemos publicado las que consideramos como mejores praacutecticas de publicacioacuten de datos Ahora usted como publicador o como entidad debe evaluar si sus datos se estaacuten disponiendo con los maacutes altos y mejores estaacutendares de publicacioacuten

Lo invitamos a que valide en queacute nivel de publicacioacuten se encuentra su entidad teniendo en cuenta el siguiente listado

Nivel Baacutesico

En este nivel se encuentran aquellas entidades que publican sus datos en formatos estaacutendar y reutilizables (praacutectica 5) que integran a la publicacioacuten sus respectivos metadatos (praacutectica 1) y que acompantildean la publicacioacuten con una licencia asociada (praacutectica 2)

Nivel Intermedio

Este nivel lo alcanzan las entidades que superando el nivel baacutesico disponen un mayor volumen de informacioacuten gracias a que anonimizan sus datos (praacutectica 4) implementan medidas de calidad que aumentan la confianza en sus datos (praacutectica 8) incorporan el componente geograacutefico proporcionando valor agregado a sus datos (praacutectica 9) y publican un diccionario de datos que facilita la interpretacioacuten de los datos publicados (praacutectica 6)

Nivel Avanzado

Las entidades que superando el nivel intermedio utilizan vocabularios estandarizados en sus nuevas publicaciones (praacutectica 3) acompantildean la publicacioacuten de sus datos con enlaces a otros recursos (praacutectica 7) y asignan un identificador uacutenico para dato logrando asiacute aumentar su descubrimiento y reutilizacioacuten (praacutectica 10)

31 Buenas praacutecticas para la publicacioacuten de datos

REFERENCIAS

Bernadette Farias Loacutescio Caroline Burle Newton Calegari W3C Data on the Web Best

Practices 31 de enero de 2017 W3C Recommendation URL httpswwww3orgTRdwbp

Bernadette Hyland Ghislain Auguste Atemezing Boris Villazoacuten-Terrazas W3C Best Practices

for Publishing Linked Data 9 de enero de 2014 W3C Note URL httpswwww3orgTRld-bp

Dan Brickley Libby Miller FOAF project FOAF Vocabulary Specification 099 (Paddington

Edition) 14 de enero de 2014 URL httpxmlnscomfoafspec

Dublin Core metadata initiative DCMI Metadata Terms 14 de junio de 2012 DCMI

Recommendation URL httpdublincoreorgdocumentsdcmi-terms

Fadi Maali John Erickson W3C Data Catalog Vocabulary (DCAT) 16 de enero de 2014 W3C

Recommendation URL httpswwww3orgTRvocab-dcat

ISO 19115-12014 (E) Geographic information ndash Metadata Part1 Fundamentals 01 de abril de

2014 International Standard

ISO 191262009 (E) Geographic information -- Feature concept dictionaries and registers

noviembre de 2009 International Standard

ISO 191572013 (E) Geographic information ndash Data quality 15 de diciembre de 2013

International Standard

Jeremy Tandy Payam Barnaghi Linda van den Brink W3C Spatial Data on the Web Best

Practices 5 de enero 2017 W3C Note URL httpswwww3orgTRsdw-bp

T Berners-Lee R Fielding L Masinter IETF Uniform Resource Identifier (URI) Generic Syntax

Enero de 2005 Internet Standard URL httpstoolsietforghtmlrfc3986

World Wide Web Foundation Open Data Barometer URL httpopendatabarometerorg

W3C OWL Working Group W3C OWL 2 Web Ontology Language Document Overview (Second

Edition) 11 de diciembre de 2012 W3C Recommendation URL httpswwww3orgTRowl2-

overview

W3org Semantic Web - W3C URL httpswwww3orgstandardssemanticweb Consultado

el 12 de septiembre de 2018

Page 31: PARA LA PUBLICACIÓN DE DATOSideca.gov.co/.../files/documentacion/buenaspracticaspublicaciondat… · La obtención de datos la realiza cada entidad en el desarrollo de sus actividades

31 Buenas praacutecticas para la publicacioacuten de datos

REFERENCIAS

Bernadette Farias Loacutescio Caroline Burle Newton Calegari W3C Data on the Web Best

Practices 31 de enero de 2017 W3C Recommendation URL httpswwww3orgTRdwbp

Bernadette Hyland Ghislain Auguste Atemezing Boris Villazoacuten-Terrazas W3C Best Practices

for Publishing Linked Data 9 de enero de 2014 W3C Note URL httpswwww3orgTRld-bp

Dan Brickley Libby Miller FOAF project FOAF Vocabulary Specification 099 (Paddington

Edition) 14 de enero de 2014 URL httpxmlnscomfoafspec

Dublin Core metadata initiative DCMI Metadata Terms 14 de junio de 2012 DCMI

Recommendation URL httpdublincoreorgdocumentsdcmi-terms

Fadi Maali John Erickson W3C Data Catalog Vocabulary (DCAT) 16 de enero de 2014 W3C

Recommendation URL httpswwww3orgTRvocab-dcat

ISO 19115-12014 (E) Geographic information ndash Metadata Part1 Fundamentals 01 de abril de

2014 International Standard

ISO 191262009 (E) Geographic information -- Feature concept dictionaries and registers

noviembre de 2009 International Standard

ISO 191572013 (E) Geographic information ndash Data quality 15 de diciembre de 2013

International Standard

Jeremy Tandy Payam Barnaghi Linda van den Brink W3C Spatial Data on the Web Best

Practices 5 de enero 2017 W3C Note URL httpswwww3orgTRsdw-bp

T Berners-Lee R Fielding L Masinter IETF Uniform Resource Identifier (URI) Generic Syntax

Enero de 2005 Internet Standard URL httpstoolsietforghtmlrfc3986

World Wide Web Foundation Open Data Barometer URL httpopendatabarometerorg

W3C OWL Working Group W3C OWL 2 Web Ontology Language Document Overview (Second

Edition) 11 de diciembre de 2012 W3C Recommendation URL httpswwww3orgTRowl2-

overview

W3org Semantic Web - W3C URL httpswwww3orgstandardssemanticweb Consultado

el 12 de septiembre de 2018