Algunos pasos del grupo OpenDARA: Contexto y web semántica

En diciembre de 2015 se constituyó el grupo OpenDARA: contexto y web semántica para "utilizar la tecnología de la web semántica en DARA y en los archivos de Aragón, analizando necesidades, posibilidades y servicios sobre los que construir un marco innovador de uso de los documentos y sus descripciones asociadas". Desde entonces se el grupo de trabajo OpenDARA ha trabajado en los siguientes puntos:

1 Utilización de Drupal como sistema de gestión de contenidos para el trabajo del Grupo.

Drupal es un CMS comúnmente utilizado para gestionar portales y servicios. La elección de este gestor se debió a sus posibilidades, desarrollos existentes y medios con los que cuenta el grupo. La versión elegida fue la 7.

2 Diseño de un modelo entidad-relación que represente a los Archivos y documentos de Aragón.

Para su configuración se tomaron como base algunas de las normas archivísticas internacionales más reconocidas, modelos conceptuales como el Modelo Conceptual de Descripción Archivística de la CNEDA, documentos técnicos sobre gestión de contenidos y recursos desarrollados por los diferentes grupos de trabajo de los Archivos de Aragón. Como resultado se establecieron como punto de partida las siguientes entidades:
  • Documentos
  • Agentes
  • Lugares
  • Conceptos, objetos o acontecimientos
  • Contenidos: Elemento que sin ser ninguna de las entidades anteriores, guarda relación con ellas. Por ejemplo un blog, una página institucional, una noticia, un artículo de experto, etc. 

Con esa estructura inicial de entidades el grupo OpenDARA ha desarrollado el modelo de datos y se han configurado las siguientes relaciones entre entidades: Agente-Concepto, Agente-Agente, Agente-Contenido, Agente-Lugar, Concepto-Contenido, Documento-Concepto, Documento-Contenido, Documento-Documento, Documento-Lugar, Documento-Agente, Lugar-Contenido y Lugar-Lugar.

En la siguiente figura se presenta el modelo multientidad del Grupo de Trabajo OpenDARA bajo el gestor de contenidos Drupal, con diferentes entidades y relaciones generadas a modo de ejemplo.


3 Inicios de la serialización a RDF de las entidades utilizadas.

El proceso de serialización de las entidades, contenidos y datos a RDF se encuentra en fase inicial de desarrollo. El trabajo está consistiendo en identificar y representar cada uno de los elementos mediante RDF en el conjunto de la web.
Por ejemplo, sirviendo de resumen y aprovechando que viene por defecto en Drupal,  el uso de etiquetado mediante SKOS de una taxonomía creada para representar  "1.1.4 Nivel" de la entidad Documento.  Primero se ha creado el vocabulario “Nivel de descripción” con los siguientes elementos relacionados y jerárquicos:

Estos elementos se representan jerárquicamente  y etiquetan el concepto siguiendo SKOS:

<a href="/nivel-de-descripci%C3%B3n/expediente" typeof="skos:Concept" property="rdfs:label skos:prefLabel" datatype="">Expediente</a>

También otro ejemplo, se ha empezado a relacionar la entidad 03 Lugares con Place de "schema.org". De esta manera la entidad "Monreal de Ariza" queda definida y marcada como un "lugar":

<div id="node-23" class="node node-lugares node-unpublished" about="/content/monreal-de-ariza" typeof="schema:Place sioc:Item foaf:Document"> 
...
<div class="field-item even" property="schema:addressLocality">Monreal de Ariza</div>

O sus coordenadas que equivalen a la propiedad "geo" de Place.

Todo este "marcado" y serialización va a permitir definir las entidades y sus elementos en el conjunto de la web,  y también en segunda instancia va a permitir relacionarlo con otras fuentes y datos.

Con estos trabajos se pretende que cada elemento de las diferentes entidades, o algunos de ellos, sean serializados a RDF para que estén identificados dentro de la web. Se está valorando el modelo y estructuras a emplear para definir con qué elementos se representan y compaginan, utilizando por ejemplo schema.org u otros junto con las utilidades y módulos disponibles en Drupal.

Y en este sentido, indicar que hay una versión inicial para Archivos en schema.org denominada architype que aspira a crear un modelo que "serialice" las descripciones de los archivos a RDF y otros formatos acordes con la web semántica.

Los siguientes pasos.... 

El grupo OpenDARA pretende continuar sus trabajos y seguir en la configuración de un gestor de contenidos que cubra las demandas en cuanto a acceso, gestión y difusión de los Archivos de Aragón, pensando en el usuario y ciudadano. Otro de sus objetivos prioritarios es utilizar las posibilidades de la web semántica para ofrecer y enriquecer el contenido que se genere.
De momento los trabajos muestran un prototipo inicial, que pretende seguir avanzando, enriqueciéndose, recopilando datos más concretos, e ir dando nuevos pasos.
Al ser un prototipo que acaba de empezar, las características técnicas y funcionales citadas en este post podrán cambiar. El camino sólo acaba de empezar...

Para más información.



Comentarios