Objectes culturals i metadades: cap a l’alliberament de dades a Wikidata

Versió per a imprimirVersió per a imprimir

Jesús Tramullas
Departamento de Ciencias de la Documentación
Universidad de Zaragoza


Fauconnier, Sandra; Lemmens, Bert; Direickx, Barbara (2015). Wikidata: Flemish art collections, Wikidata and Linked Open Data/Whitepaper. Disponible a:  https://www.wikidata.org/wiki/Wikidata:Flemish_art_collections,_Wikidata... [Consulta: 29/03/2016].


Generalment, els projectes de desenvolupament GLAM s’associen a l’alliberament de materials textuals, gràfics o sonors, que es posen a disposició de tots els possibles usuaris, sota llicències lliures, sense que existeixin entrebancs per al seu reaprofitament i ús, sigui comercial o no (nota per a incauts: posar a la web reproduccions d’alta qualitat que només es poden usar per a gaudi privat i individual no és un projecte GLAM d’alliberament i ús de continguts culturals; pot ser estèticament agradable, però resulta fútil).

No obstant, en els propers anys s’apreciarà un nombre creixent de projectes que acompanyaran l’alliberament de continguts amb l’alliberament de les dades semàntiques corresponents. I és que les obres culturals, en l’entorn digital, no són res si no van acompanyades del seu corresponent conjunt de metadades. Europeana ho va tenir clar des dels seus mateixos inicis: el potencial d’ús i reaprofitament del patrimoni cultural s’havia de basar en la publicació i reutilització de les dades semàntiques dels objectes, i dels esquemes de dades necessaris per a la seva interpretació1. Viquipèdia ha desenvolupat des de 2012 Wikidata, “una base de dades secundària lliure, col·laborativa i en diferents idiomes, que recopila dades estructurades per donar suport a Viquipèdia...”2. L’ús de Wikidata creix exponencialment: és l’origen dels grafs que Google presenta com a fitxes destacades en les seves respostes, i de la majoria de les infoboxes dels articles de Viquipèdia. Per definició, Wikidata treballa amb open data3, la qual cosa fa possible la reutilització de dades sense limitacions.

En aquest sentit, els museus flamencs han estat dels primers a iniciar un projecte d’integració i aportació de les dades d’uns 25.000 objectes culturals de les seves col·leccions a Wikidata. El projecte Flemish art collections, Wikidata and Linked Open Data4, iniciat el 2015, està coordinat pel PACKED vzw (Expertisecentrum Digitaal Erfgoer), i hi participen quatre wikimedistes experts, sis museus, i dues col·leccions virtuals. Com un dels resultats “lliurables” del projecte, els participants van publicar l’octubre de 2015 un whitepaper5, que és l’objecte d’aquests paràgrafs.

El document s’estructura en quatre parts principals i un annex. La primera part es dedica a explicar, de forma introductòria, els conceptes de Wikimedia, Viquipèdia i Wikidata (en particular, els dos primers es confonen sovint). La part dedicada a Wikidata és la més extensa i, realment, resulta ser una concisa i necessària explicació de Wikidata. Després d’explicar què és un ítem i els seus components, entra en matèria sobre les característiques que han de tenir les dades, que cal que siguin (i s’inclou textualment perquè és l’explicació més clara i concisa):

  • Free, and more specifically licensed under CC0, for easy use, reuse, and manipulation without legal hassles.
  • Notable, as in relatable to entities featured or qualifying to be featured in Wikimedia projects.
  • Referenced, allowing verification of data and publication of multiple values according to different sources.
  • Queryable, enabling tools to perform publication and maintenance processes as automatically as possible.
  • Editable, like the rest of Wikimedia content, which implies that you must be open to integrate improvements on your data.
  • Maintained, as opposed to dumped once and forgotten – Wikidata is here for a long term relationship.

Cadascuna d’aquestes qüestions és explicada amb més detall en el document mateix. Un cop acabada aquesta secció, la segona part del document desgrana els beneficis i els costos que aquests projectes tenen per a les institucions participants. En concret, cal cridar l’atenció sobre l’apartat dedicat a la “Loss of data exclusivity”, on, i se cita textualment, “Museums distance themselves explicitly from any form of exclusivity over the data they publish to the Wikidata platform. Once the data has been published under CC0, this license is irrevocable. Through Wikidata, museums donate data to society. By doing so, museums discard any possible model of gain/benefit based on making data available for re-use to third parties. Specifically this means for example that a museum can not gain revenue by selling licenses on the collection data.”

No deixa de resultar curiós, alhora que ridícul, que pugui haver-hi institucions que se sentin temptades de fer negoci amb alguna cosa com ara “Autor=Goya, Títol=La família de Carles IV”, sobretot quan són dades públiques, i teclejades i emmagatzemades gràcies a l’ús de diner públic. L’anàlisi mostra que els beneficis per a la societat són molts, mentre que el cost és, precisament, l’ús de fons públics per produir les dades; un cost que, a més, és tècnicament mínim.

És important cridar l’atenció sobre la llicència escollida: CC0 1. Universal Public Domain Dedication6. Es tracta d’una llicència apropiada per als productes culturals lliures, en tots els sentits, i como a tal és senyalada per Creative Commons: “The person who associated a work with this deed has dedicated the work to the public domain...” I és que, a vegades, s’oblida que no totes les llicències CC són lliures ni suposen domini públic...

La tercera part proposa un exemple d’estructura de dades per a obres culturals, amb la indicació de metadades obligatòries, opcionals, l’element corresponent dins de l’esquema general de Wikidata, i unes indicacions per a cada element. Inclou, a més, una orientació sobre els formats de fitxer que s’han d’utilitzar per a la importació i càrrega de dades. La conclusió, última part del document, és un breu (massa breu) resum de posició. Un últim valor afegit és que el document incorpora com annex informatiu les referències a les guies d’ús de dades obertes que apliquen tres institucions de gran prestigi, com són The Museum of Modern Art (MoMA), The Tate Gallery, i The Smithsonian Cooper-Hewitt, National Design Museum. En el seu conjunt, un document que serveix com a punt de partida per plantejar projectes de Cultural Linked Open Data, i per aturar-se a pensar si realment mereix la pena afrontar el descrèdit i rebuig que suposa la mercantilització del patrimoni cultural.


1http://labs.europeana.eu/api/linked-open-data-introduction
2https://www.wikidata.org/wiki/Wikidata:Introduction/ca  
3https://www.wikidata.org/wiki/Wikidata:Wiki_Loves_Open_Data
4https://www.wikidata.org/wiki/Wikidata:Flemish_art_collections,_Wikidata...
5https://www.wikidata.org/wiki/Wikidata:Flemish_art_collections,_Wikidata...
6https://creativecommons.org/publicdomain/zero/1.0/