Los cambios en Europeana Data Model 5.2.5 y 5.2.6

Versión para impresiónVersión para impresión
Francisca Hernández
Consultora, DIGIBÍS

Definition of the Europeana Data Model v5.2.5. Disponible a: http://travesia.mcu.es/portalnb/jspui/bitstream/10421/3861/1/EDM%20Defin... 27/05/2015]
Definition of the Europeana Data Model v5.2.6. Disponible a: http://pro.europeana.eu/files/Europeana_Professional/Share_your_data/Tec... [Consulta: 27/05/2015]

Aunque la documentación de los cambios introducidos en cada nueva versión del modelo es algo confusa, nos referiremos a los más significativos de las dos versiones de 2014 y dejaremos aparte aquellas modificaciones que tienen que ver con la propia organización y estructura del documento o que suponen un cambio menor. Señalaremos, pues, aquellos cambios que Europeana debe introducir para una mayor interrelación y navegación entre los datos, para una mejor gestión de los datos, y para distinguir los tratamientos que realiza de los datos proporcionados por los proveedores.

En la versión 5.2.5 se añadieron nuevas propiedades: edm:europeanaProxy, edm:begin, edm:end, edm:preview y edm:datasetName. La propiedad edm:europeanaProxy consiste en una marca de uso interno de Europeana para distinguir los proxies de los proveedores de los proxies que forma Europeana. Debe recordarse que los proxies son uno de los mecanismos que ofrece EDM para crear las agregaciones de objetos de patrimonio culturales (Cultural Heritage Objects) y sus representaciones digitales, y que este mecanismo puede ser utilizado tanto por los proveedores de contenido como por Europeana, de ahí la necesidad de distinguir de algún modo quién realiza la agregación.

Una de las diferencias entre el modelo de datos de Europeana y el de la Digital Public Library of America, que publicó su Metadata Application Profile v.3.1 el 3 de julio de 2014, es que esta última biblioteca digital vio desde el principio la importancia de crear clases y propiedades para diferenciar colecciones de objetos digitales aparte de por el proveedor de los datos y distinguía la pertenencia de un objeto a una determinada colección, así como las características de esta colección. De hecho, las relaciones de pertenencia de un objeto a un determinado conjunto, especialmente las jerárquicas, a una colección, o a un subconjunto temático o de tratamiento son las razones que han motivado los cambios más importantes en Europeana Data Model de las últimas versiones. 

Europeana Data Model, por su parte, ha incluido la clase dcat:Dataset en la version 5.2.5, a la que define como “una colección de datos, publicada o tratada por un único agente y disponible para su acceso o descarga en uno o más formatos”. Aún siendo similar a la definición de dcmitype:Collection de la DPLA introduce un matiz diferenciador. La clase dcat:Dataset (conjunto de datos) es tanto un paquete de información (Information Package) como una colección de datos. Un conjunto de datos puede ser una agrupación temática, puede haberse generado por una determinada fuente o proceso, o pueden proceder de un proveedor determinado. Es decir, en el marco de Europeana un dataset puede coincidir con la colección de un determinado proveedor o bien puede tratarse de un subjconjunto de datos que incluyan parcial o totalmente varias colecciones. Si se reflexiona un poco se pueden apreciar los motivos por los que es necesario identificar un determinado conjunto de datos: para crear agrupaciones de datos con el fin de facilitar el acceso y la consulta, para procesar y tratar de forma diferenciada determinados conjuntos de datos y mantener un control de auditoría (por ejemplo, depuración, enriquecimiento, etc.), o para publicarlos en Linked Open Data como subconjuntos de Europeana. De hecho, la propiedad edm:datasetName, también nueva en esta versión 5.2.5 permite asignar identificadores a cualquier conjunto de datos de Europeana. Por medio de la asignación de este identificador, en el proceso de ingesta de datos, Europeana puede relacionar todos los objetos que pertenecen a un conjunto de datos.

Esta modificación, se consolida en la versión 5.2.6, de 17 de diciembre, al introducirse un nuevo namespace dentro del Europeana Data Model. Aunque las clases dcat:Dataset y dcat:datasetName se crean en la versión anterior, como hemos dicho, es en la vigente 5.2.6 en la que se añade el W3C Data Catalog Vocabulary (DCAT) y, además, se resalta en el documento de referencia la clase dcat:Dataset al incorporarla al epígrafe “Relevant Classes from other namespaces”. Sin duda es una muestra de la importancia que el equipo de desarrollo de la norma asigna a esta clase.

Vemos así, que el modelo de datos de Europeana va evolucionando sobre nuevas propiedades dentro del espacio de nombres de Europeana Data Model (edm) y con la adición de nuevas clases y propiedades importadas de otros modelos de datos más genéricos como DCAT. Un análisis más profundo nos permitiría ver cómo se referencian también las equivalencias con otros modelos de datos específicos como el CIDOC Conceptual Reference Model. 

En la versión 5.2.6 se modificó el comentario de la propiedad dc:creator para que su uso fuera compatible con la clase edm:WebResource. Este pequeño cambio es muy revelador del proceso que debe seguir el mantenimiento de un modelo de datos común para mantener una comprensión exacta por parte de cualquier usuario y que no induzca a un mal uso por vaguedades o indefiniciones. Además, refleja que el avance y consolidación de los procesos de digitalización y de la creación de bibliotecas, archivos y museos digitales en la web requiere cada vez más de la identificación del autor de un recurso web.

Por último, hay que mencionar la introducción de la clase cc:License, a partir del namespace de Creative Commons Rights Expression Language, y el cambio en la etiqueta de la propiedad edm:rights. edm:Rights que queda definida en esta versión como “Declaración normalizada de Derechos” (Standardized Rights Statement), cuando en la versión anterior se decía simplemente “Europeana Rights“. Se aprecia con claridad hasta qué punto las líneas estratégicas de Europeana para 2015-2020 tienen su correlato en el Europeana Data Model: “Vamos a innovar y a transformar el proceso de agregación alejándonos de la integración lineal de datos en un repositorio central, yendo hacia una arquitectura distribuida, basada en la tecnología, que dé acceso sin restricciones a los objetos digitales, de acuerdo con las condiciones aplicadas por los titulares de los derechos. Esto permitirá triplicar la cantidad de material disponible a través de Europeana, al mismo tiempo que, y esto es lo más importante, se hace del modo más adecuado a este objetivo.