Els canvis a Europeana Data Model 5.2.5 i 5.2.6

Versió per a imprimirVersió per a imprimir
Francisca Hernández
Consultora, DIGIBÍS

Definition of the Europeana Data Model v5.2.5. Disponible a: http://travesia.mcu.es/portalnb/jspui/bitstream/10421/3861/1/EDM%20Defin... 27/05/2015]
Definition of the Europeana Data Model v5.2.6. Disponible a: http://pro.europeana.eu/files/Europeana_Professional/Share_your_data/Tec... [Consulta: 27/05/2015]

Tot i que la documentació dels canvis introduïts en cada nova versió del model és una cosa confusa, ens referirem als més significatius de les dues versions de 2014 i deixarem a part aquelles modificacions que tenen a veure amb la pròpia organització i estructura del document o que suposen un canvi menor. Assenyalarem, doncs, aquells canvis que Europeana ha d'introduir per a una major interrelació i navegació entre les dades, per a una millor gestió de les dades, i per distingir els tractaments que realitza de les dades proporcionades pels proveïdors.

En la versió 5.2.5 es van afegir noves propietats: edm: europeanaProxy, edm: begin, edm: end, edm: preview i edm: datasetName. La propietat edm: europeanaProxy consisteix en una marca d'ús intern d'Europeana per distingir els proxies dels proveïdors dels proxies que forma Europeana. Cal recordar que els proxies són un dels mecanismes que ofereix EDM per crear les agregacions d'objectes de patrimoni culturals (Cultural Heritage Objects) i les seves representacions digitals, i que aquest mecanisme pot ser utilitzat tant pels proveïdors de contingut com per Europeana, de aquí la necessitat de distingir d'alguna manera qui realitza l'agregació.

Una de les diferències entre el model de dades d'Europeana i el de la Digital Public Library of America, que va publicar el seu Metadata Application Profile v.3.1 el 3 de juliol de 2014, és que aquesta última biblioteca digital va veure des del principi la importància de crear classes i propietats per diferenciar col·leccions d'objectes digitals a part de pel proveïdor de les dades i distingia la pertinença d'un objecte a una col·lecció específica, així com les característiques d'aquesta col·lecció. De fet, les relacions de pertinença d'un objecte a un determinat conjunt, especialment les jeràrquiques, a una col·lecció, o un subconjunt temàtic o de tractament són les raons que han motivat els canvis més importants en Europeana Data Model de les últimes versions.

Europeana Data Model, per la seva banda, ha inclòs la classe DCAT: Dataset en la versió 5.2.5, a la qual defineix com "una col·lecció de dades, publicada o tractada per un únic agent i disponible per al seu accés o descàrrega en un o més formats". Tot i ser similar a la definició de dcmitype: Collection de la DPLA introdueix un matís diferenciador. La classe DCAT: Dataset (conjunt de dades) és tant un paquet d'informació (Information Package) com una col·lecció de dades. Un conjunt de dades pot ser una agrupació temàtica, pot haver-se generat per una determinada font o procés, o poden procedir d'un proveïdor determinat. És a dir, en el marc d'Europeana 1 dataset pot coincidir amb la col·lecció d'un determinat proveïdor o bé pot tractar-se d'un subjconjunto de dades que incloguin parcialment o totalment diverses col·leccions. Si es reflexiona una mica es poden apreciar els motius pels quals cal identificar un determinat conjunt de dades: per crear agrupacions de dades per tal de facilitar l'accés i la consulta, per processar i tractar de forma diferenciada determinats conjunts de dades i mantenir un control d'auditoria (per exemple, depuració, enriquiment, etc.), o per publicar-los en Linked Open Data com subconjunts d'Europeana. De fet, la propietat edm: datasetName, també nova en aquesta versió 5.2.5 permet assignar identificadors a qualsevol conjunt de dades d'Europeana. Per mitjà de l'assignació d'aquest identificador, en el procés d'ingesta de dades, Europeana pot relacionar tots els objectes que pertanyen a un conjunt de dades.

Aquesta modificació, es consolida en la versió 5.2.6, de 17 de desembre, a l'introduir-se un nou namespace dins el Europeana Data Model. Tot i que les classes DCAT: Dataset i DCAT: datasetName es creen en la versió anterior, com hem dit, és en la vigent 5.2.6 en la qual s'afegeix W3C Data Catalog Vocabulary (DCAT) i, a més, es ressalta en el document de referència la classe DCAT: Dataset a incorporar a l'epígraf "Relevant Classes from other namespaces". Sens dubte és una mostra de la importància que l'equip de desenvolupament de la norma assigna a aquesta classe.

Veiem així, que el model de dades d'Europeana va evolucionant sobre noves propietats dins de l'espai de noms de Europeana Data Model (edm) i amb l'addició de noves classes i propietats importades d'altres models de dades més genèrics com DCAT. Una anàlisi més profunda ens permetria veure com es referencien també les equivalències amb altres models de dades específiques com el CIDOC Conceptual Reference Model.

En la versió 5.2.6 es va modificar el comentari de la propietat dc: creator perquè el seu ús fos compatible amb la classe edm: WebResource. Aquest petit canvi és molt revelador del procés que ha de seguir el manteniment d'un model de dades comú per mantenir una comprensió exacta per part de qualsevol usuari i que no indueixi a un mal ús per vaguetats o indefinicions. A més, reflecteix que l'avanç i consolidació dels processos de digitalització i de la creació de biblioteques, arxius i museus digitals al web requereix cada vegada més de la identificació de l'autor d'un recurs web.

Finalment, cal esmentar la introducció de la classe cc: License, a partir del namespace de Creative Commons Rights Expression Language, i el canvi en l'etiqueta de la propietat edm: rights. edm: Rights que queda definida en aquesta versió com "Declaració normalitzada de Drets" (Standardized Rights Statement), quan en la versió anterior es deia simplement "Europeana Rights". S'aprecia amb claredat fins a quin punt les línies estratègiques d'Europeana per 2015-2020 tenen el seu correlat en el Europeana Data Model: "Anem a innovar ia transformar el procés d'agregació allunyant-nos de la integració lineal de dades en un repositori central, anant cap a una arquitectura distribuïda, basada en la tecnologia, que doni accés sense restriccions als objectes digitals, d'acord amb les condicions aplicades pels titulars dels drets. Això permetrà triplicar la quantitat de material disponible a través d'Europeana, al mateix temps que, i això és el més important, es fa de la manera més adequada a aquest objectiu.