El estado de los datos vinculados en bibliotecas en 2015

Versión para impresiónVersión para impresión

Xavier Agenjo Bullón
Director de Proyectos de la Fundación Ignacio Larramendi

Francisca Hernández
Consultora. DIGIBÍS


Mitchell, Erik T (2016). “Library Linked Data: Early Activity and Development”. Library Technology Reports, Vol. 52, No. 1 (January). American Library Association. Disponible en: https://journals.ala.org/ltr/issue/view/534 [Consulta: 23/05/2016].


Los cuatro capítulos que componen este informe tienen como finalidad actualizar el anterior análisis de Mitchell sobre Linked Data, publicado también en Library Technology Reportsi (LTR) en 2013. Las revisiones sobre el estado de la cuestión ofrecen una oportunidad de reflexionar sobre el camino andado, sobre las tendencias que van perfilándose y sobre los interrogantes que surgen de la aplicación de Library Linked Data. Este es el ejercicio que realiza Erik Mitchell en esta primera entrega del año 2016 de Library Technology Reports y, en nuestra opinión, su aportación más importante.

En el capítulo 1. The Current State of Linked Data in Libraries, Archives, and Museums, revisa el estado de la adopción de Linked Data en bibliotecas, archivos y museos, y en los objetivos y finalidades que estas instituciones aducen para implantar esta tecnología. En el capítulo 2. Projects, Programs, and Research Initiatives, Mitchell reúne los proyectos, programas e iniciativas de investigación que considera más significativos por su tamaño, sin pretensiones de ser exhaustivo, centrándose más en los aspectos de su definición general y en las características de su adopción que en los aspectos de diseño técnico o de modelo de datos. En el capítulo 3. Applied Systems, Vocabularies, and Standards, combina el análisis del uso de los lenguajes de representación de modelos de datos, mayoritariamente RDF y RDFS, y los lenguajes de serialización de datos, en los que destaca la creciente extensión de JSON-LD. Por último, en el capítulo 4. The Evolving Direction of LD Research and Practice, se refiere a las tendencias en investigación y prácticas de Linked Data, que constituye la parte más interesante del informe. En general, el informe de LTR es una condensación de los proyectos, tendencias e interrogantes planteados tras la aplicación de Linked Dataii en bibliotecas, y aunque hay menciones a archivos y museos éstas resultan escasas. Mitchell se centra, salvo la ineludible mención a Europeana, en el entorno estadounidense, de lo que se deriva, quizá, la ausencia de cuestiones fundamentales como el multilingüismo.

Principales conclusiones y tendencias

En todos los análisis que realiza Mitchell se puede apreciar que se refiere a una tecnología en gran medida ya consolidada. En diferentes ocasiones, señala que las distintas configuraciones de la aplicación de Linked Data tienen que ver, sobre todo, con el grado de evolución en la aplicación de la tecnología, más que con el grado de evolución de la tecnología misma. Es en los modos de aplicación de Linked Data de donde extraen las principales conclusiones y tendencias.

Así, constata la variedad de modelos de datos utilizados: BIBFRAME, Schema.org, Europeana Data Model, DPLA Metadata Application Profile (basado en EDM), FRBR Library Reference Modeliii y muchas otras combinaciones de vocabularios, que hace surgir la pregunta de qué organismo va a encargarse de la normalización de los metadatos para archivos, bibliotecas y museos, y si esta normalización debe afrontarse de forma comprehensiva o mediante la reutilización de diferentes ontologías ya existentes, aunque procedan, incluso, de sectores externos a los archivos, bibliotecas y museos.

En cuanto a los modos de adopción de Linked Data en cualquier archivo, biblioteca o museo, y no solo en las grandes instituciones, o en los grandes proyectos financiados a nivel nacional o internacional, señala la 'falta de sistemas de soporte' y la dificultad de encontrar programas que incluyan 'todo en uno': mecanismos de almacenamiento de tripletas, puntos de servicio SPARQL, indexación, e interfaces de consulta y catalogación. En este último sentido, se refiere Mitchell a la necesidad de no duplicar la inversión en sistemas tradicionales y sistemas Linked Data, al menos en el periodo siguiente a la fase de investigación o exploración de la viabilidad de su aplicación. Desde luego, no parece que pueda esperarse que la Web Semántica se base únicamente en los datos de aquellas instituciones capaces de desarrollar proyectos de investigación o de mantener una duplicación de los canales de producción de datos; esto solo puede hacerse integrando Linked Open Data en el proceso de los programas de gestión de archivos, bibliotecas y museosiv.

Otro interrogante que caracterizará la evolución de Linked Data es el papel de los catalogadores y la necesaria redefinición de las tareas de catalogación. Mitchell menciona cómo MARC21 se ha ido adaptando para permitir la inclusión de URI en los registros MARC, y expone explícitamente la duda de que los registros bibliográficos al uso sirvan de algo en Linked Data, sin que hayan sido previamente vinculados, enriquecidos o reconciliados con diferentes fuentes LOD.

Muchas instituciones están asumiendo Linked Data con un objetivo global de visibilidad, reutilización de datos y preservación. Sin embargo, Mitchell expresa el temor de la falta de concreción y de impacto general de estos objetivos aunque, paralelamente, constata ejemplos avanzados del uso de datos bibliográficos en servicios de visualización para móviles, o de utilización en Google Knowledge Graph, especialmente a partir de los grandes proyectos como Europeana o la DPLA.

La última pregunta que se hace Mitchell es cuál será el efecto de todo esto en la investigación y la educación, especialmente en cuanto al propio uso de la tecnología Linked Data, lo cual afecta sobremanera a los programas de formación en biblioteconomía, archivística, museología, documentación, habilidades informativas o como quiera que se dé en llamar. Por nuestra parte, nos gustaría resaltar el esfuerzo que aún debemos hacer para que los grandes sistemas de información creados en los últimos diez años tengan una verdadera utilidad en la educación, para que los profesores conozcan estas herramientas, para que las utilicen en la enseñanza y para que nos reclamen lo que necesitan y que aún no les proporcionamos. No le hagamos perder el tiempo a los usuarios.

En resumen, se trata de un informe interesantísimo, con gran cantidad de información, referencias y bibliografía, que refleja el avance y solidez de Linked Open Data, que expone la forma en que se está adoptando esta tecnología y las nuevas posibilidades e interrogantes que abre. Para no perdérselo.

El estado de la cuestión en los archivos, bibliotecas y museos españoles

A medida que se avanza en la lectura de este informe de LTR acuden a la memoria diferentes proyectos españoles, realmente Linked Open Data. Entre ellos hay que mencionar datos.bne.es de la Biblioteca Nacional de España, pero también otros proyectos como la Lista de Encabezamientos para Bibliotecas Públicas en SKOSv, de la Subdirección General de Coordinación Bibliotecaria, que ya está vinculada, además de con LCSH, RAMEAU y GND, con listas de encabezamientos en todos los idiomas oficiales de España. También la Subdirección General de los Museos Estatales ha publicado recientemente los Tesauros del Patrimonio Cultural de España en Linked Open Datavi. Y hay muchas otras actividades como la utilización del Catàleg d’autoritats de noms i títols de Catalunya (CANTIC)vii y de las autoridades de la Biblioteca Nacional de España en Wikidata, la publicación del Tesauro de la UNESCO en SKOSviii, o el reciente anuncioix de la Subdirección General de los Archivos Estatales de asignar identificadores permanentes a los registros de autoridad del Censo Guía de Archivos de España e Iberoaméricax, como paso previo a su transformación en Linked Open Data.

Por todo ello no estaría de más que pudiéramos dedicar entre todos un pequeño esfuerzo a elaborar, y publicar, un estado de la cuestión de Linked Open Data en los archivos, bibliotecas y museos españoles.


i https://journals.ala.org/ltr

ii Puede verse la distinción entre Open Data, Linked Data y Linked Open Data en Baker, Thomas [et al.]. Library Linked Data Incubator Group Final Report. W3C Incubator Group Report 25 October 2011. https://www.w3.org/2005/Incubator/lld/XGR-lld-20111025/. La traducción al español realizada por Xavier Agenjo y Francisca Hernández está disponible en http://www.larramendi.es/LAM/Incubator/lld/XGR-lld-20111025.html

iii http://www.ifla.org/node/10280

iv Sulé, Andreu; Centelles, Miquel; Franganillo, Jorge; Gascón, Jesús (2016). “Aplicación del modelo de datos RDF en las colecciones digitales de bibliotecas, archivos y museos de España”. Revista española de documentación científica. Vol. 39, n.º 1, e121. ISSN-L:0210-0614. doi: http://dx.doi.org/10.3989/redc.2016.1.1268.

v http://id.sgcb.mcu.es/

vi http://tesauros.mecd.es/tesauros

vii http://cantic.bnc.cat/

viii http://skos.um.es/unescothes/?l=es

ix Nueva versión del Portal de Archivos Españoles. PARES 2.0. http://www.mecd.gob.es/cultura-mecd/areas-cultura/archivos/novedades/jor...

x http://censoarchivos.mcu.es/CensoGuia/completo.htm