L’estat de les dades vinculades a biblioteques el 2015

Versió per a imprimirVersió per a imprimir

Xavier Agenjo Bullón
Director de Projectes de la Fundación Ignacio Larramendi

Francisca Hernández
Consultora. DIGIBÍS


Mitchell, Erik T (2016). “Library Linked Data: Early Activity and Development”. Library Technology Reports, Vol. 52, No. 1 (January). American Library Association. Disponible a: https://journals.ala.org/ltr/issue/view/534 [Consulta: 23/05/2016].


Els quatre capítols que composen aquest informe tenen com a finalitat actualitzar l’anterior anàlisi de Mitchell sobre Linked Data, publicat també a Library Technology Reportsi (LTR) el 2013. Les revisions sobre l’estat de la qüestió ofereixen una oportunitat de reflexionar sobre el camí fet, sobre les tendències que van perfilant-se i sobre els interrogants que sorgeixen de l’aplicació de Library Linked Data. Aquest és l’exercici que realitza Erik Mitchell en aquesta primera entrega de l’any 2016 de Library Technology Reports i, en la nostra opinió, la seva aportació més important.

En el capítol 1. The Current State of Linked Data in Libraries, Archives, and Museums, revisa l’estat de l’adopció de Linked Data a biblioteques, arxius i museus, i als objectius i finalitats que aquestes institucions addueixen per implantar aquesta tecnologia. En el capítol 2. Projects, Programs, and Research Initiatives, Mitchell reuneix els projectes, programes i iniciatives d’investigació que considera més significatius per la seva mida, sense pretensions de ser exhaustiu, centrant-se més en els aspectes de la seva definició general i en les característiques de la seva adopció que en els aspectes de disseny tècnic o de model de dades. En el capítol 3. Applied Systems, Vocabularies, and Standards, combina l’anàlisi de l’ús dels llenguatges de representació de models de dades, majoritàriament RDF i RDFS, i els llenguatges de serialització de dades, en els quals destaca la creixent extensió de JSON-LD. Finalment, en el capítol 4. The Evolving Direction of LD Research and Practice, es refereix a les tendències en investigació i pràctiques de Linked Data, que constitueix la part més interessant de l’informe. En general, l’informe d’LTR és una condensació dels projectes, tendències i interrogants plantejats arran de l’aplicació de Linked Dataii a biblioteques, i tot i que hi ha mencions a arxius i museus aquestes mencions resulten escasses. Mitchell se centra, tret de la ineludible menció a Europeana, en l’entorn estatunidenc, de la qual cosa se’n deriva, potser, l’absència de qüestions fonamentals com el multilingüisme.

Principals conclusions i tendències

En totes les anàlisis que realitza Mitchell es pot apreciar que es refereix a una tecnologia en gran mesura ja consolidada. En diferents ocasions, assenyala que les diferents configuracions de l’aplicació de Linked Data tenen a veure, sobretot, amb el grau d’evolució en l’aplicació de la tecnologia, més que no pas amb el grau d’evolució de la tecnologia mateixa. És en les maneres d’aplicació de Linked Data d’on s’extreuen les principals conclusions i tendències.

Així, constata la varietat de models de dades utilitzats: BIBFRAME, Schema.org, Europeana Data Model, DPLA Metadata Application Profile (basat en EDM), FRBR Library Reference Modeliii i moltes altres combinacions de vocabularis, que fa sorgir la pregunta de quin organisme s’encarregarà de la normalització de les metadades per a arxius, biblioteques i museus, i si aquesta normalització s’ha d’afrontar de forma comprensiva o mitjançant la reutilització de diferents ontologies ja existents, encara que procedeixin, fins i tot, de sectors externs als arxius, biblioteques i museus.

Quant a les maneres d’adopció de Linked Data a qualsevol arxiu, biblioteca o museu, i no tan sols a les grans institucions, o als grans projectes finançats en l’àmbit nacional o internacional, assenyala la 'manca de sistemes de suport' i la dificultat de trobar programes que incloguin 'tot en un': mecanismes d’emmagatzematge de tripletes, punts de servei SPARQL, indexació, i interfícies de consulta i catalogació. En aquest últim sentit, es refereix Mitchell a la necessitat de no duplicar la inversió en sistemes tradicionals i sistemes Linked Data, almenys en el període següent a la fase d’investigació o exploració de la viabilitat de la seva aplicació. Per descomptat, no sembla que pugui esperar-se que la Web Semàntica es basi únicament en les dades d’aquelles institucions capaces de desenvolupar projectes d’investigació o de mantenir una duplicació dels canals de producció de dades; això només es pot fer integrant Linked Open Data en el procés dels programes de gestió d’arxius, biblioteques i museusiv.

Un altre interrogant que caracteritzarà l’evolució de Linked Data és el paper dels catalogadors i la necessària redefinició de les tasques de catalogació. Mitchell menciona com MARC21 s’ha anat adaptant per permetre la inclusió d’URI en els registres MARC, i exposa explícitament el dubte que els registres bibliogràfics convencionals serveixin d’alguna cosa en Linked Data, sense que hagin estat prèviament vinculats, enriquits o reconciliats amb diferents fonts LOD.

Moltes institucions estan assumint Linked Data amb un objectiu global de visibilitat, reutilització de dades i preservació. No obstant, Mitchell expressa el temor de la manca de concreció i d’impacte general d’aquests objectius per bé que, paral·lelament, constata exemples avançats de l’ús de dades bibliogràfiques en serveis de visualització per a mòbils, o d’utilització a Google Knowledge Graph, especialment a partir dels grans projectes com ara Europeana o la DPLA.

La darrera pregunta que es fa Mitchell és quin serà l’efecte de tot plegat en la investigació i l’educació, especialment quant al propi ús de la tecnologia Linked Data, la qual cosa afecta en gran manera els programes de formació en biblioteconomia, arxivística, museologia, documentació, habilitats informatives o com sigui que s’anomeni. Per part nostra, ens agradaria ressaltar l’esforç que encara hem de fer perquè els grans sistemes d’informació creats en els darrers deu anys tinguin una veritable utilitat en l’educació, perquè els professors coneguin aquestes eines, perquè les utilitzin en l’ensenyament i perquè ens reclamin el que necessiten i que encara no els proporcionem. No fem perdre el temps als usuaris.

En resum, es tracta d’un informe interessantíssim, amb gran quantitat d’informació, referències i bibliografia, que reflecteix l’avenç i solidesa de Linked Open Data, que exposa la forma en què s’està adoptant aquesta tecnologia i les noves possibilitats i interrogants que obre. Per no perdre-se’l.

L’estat de la qüestió als arxius, biblioteques i museus espanyols

A mesurar que s’avança en la lectura d’aquest informe d’LTR vénen a la memòria diferents projectes espanyols, realment Linked Open Data. Entre els quals cal mencionar datos.bne.es de la Biblioteca Nacional de España, però també altres projectes com la Lista de Encabezamientos para Bibliotecas Públicas en SKOSv, de la Subdirección General de Coordinación Bibliotecaria, que ja està vinculada, a més de amb LCSH, RAMEAU i GND, amb llistes d’encapçalaments en tots els idiomes oficials d’Espanya. També la Subdirección General de los Museos Estatales ha publicat recentment els Tesauros del Patrimonio Cultural de España en Linked Open Datavi. I existeixen moltes altres activitats com la utilització del Catàleg d’autoritats de noms i títols de Catalunya (CANTIC)vii i de les autoritats de la Biblioteca Nacional de España en Wikidata, la publicació del Tesauro de la UNESCO en SKOSviii, o el recent anunciix de la Subdirección General de los Archivos Estatales d’assignar identificadors permanents als registres d’autoritat del Censo Guía de Archivos de España e Iberoaméricax, com a pas previ a la seva transformació en Linked Open Data.

Per tot plegat seria convenient que poguéssim dedicar entre tots un petit esforç a elaborar, i publicar, un estat de la qüestió de Linked Open Data als arxius, biblioteques i museus espanyols.


i https://journals.ala.org/ltr

ii Es pot veure la distinció entre Open Data, Linked Data i Linked Open Data a Baker, Thomas [et al.]. Library Linked Data Incubator Group Final Report. W3C Incubator Group Report 25 October 2011. https://www.w3.org/2005/Incubator/lld/XGR-lld-20111025/. La traducció al castellà realitzada per Xavier Agenjo i Francisca Hernández està disponible a http://www.larramendi.es/LAM/Incubator/lld/XGR-lld-20111025.html

iii http://www.ifla.org/node/10280

iv Sulé, Andreu; Centelles, Miquel; Franganillo, Jorge; Gascón, Jesús (2016). “Aplicación del modelo de datos RDF en las colecciones digitales de bibliotecas, archivos y museos de España”. Revista española de documentación científica. Vol. 39, n.º 1, e121. ISSN-L:0210-0614. doi: http://dx.doi.org/10.3989/redc.2016.1.1268.

v http://id.sgcb.mcu.es/

vi http://tesauros.mecd.es/tesauros

vii http://cantic.bnc.cat/

viii http://skos.um.es/unescothes/?l=es

ix Nova versió del Portal de Archivos Españoles. PARES 2.0. http://www.mecd.gob.es/cultura-mecd/areas-cultura/archivos/novedades/jor...

x http://censoarchivos.mcu.es/CensoGuia/completo.htm