Añadir nuevo comentario

De espectadores a actores

Versión para impresiónVersión para impresión
Xavier  Agenjo Bullón
Director de Proyectos de la Fundación Ignacio Larramendi

 

Carol Jean Godby and Ray Denenberg (2015). Common Ground: Exploring Compatibilities Between the Linked Data Models of the Library of Congress and OCLC. Disponible en http://www.oclc.org/research/publications/2015/oclcresearch-loc-linked-data-2015.html 


Con la publicación en 2011 del Informe Final del W3C Library Linked Data Incubator Group (disponible en Traducción al español de Documentos del W3C Library Linked Data Incubator Group)[1] se dio un paso muy importante a la hora de concretar los principios de Linked Open Data al entorno de las bibliotecas, y los archivos, y los museos y los centros de documentación. Tres años más tarde la OCLC ha publicado[2] un estudio sobre el uso de los vocabularios de valores, así como de las razones por las cuáles estos se utilizan en un conjunto de 123 instituciones a lo largo del mundo, aunque predominantemente de ámbito anglosajón. Este estudio se denomina OCLC Research International Linked Data Survey for Implementers. La única institución española reflejada en este estudio es la Fundación Ignacio Larramendi. Los resultados se han estructurado en 6 entradas del blog Hangingtogether[3]. Está ya aceptada una comunicación al próximo congreso de FESABID de Hernández y Agenjo en la que se analiza el paso del tiempo entre el Informe Final y la encuesta de la OCLC, así como todo lo que ello ha conllevado. La comunicación se titula Cómo y qué consumir en el mundo Linked Open Data; cómo y qué producir en Linked Open Data.

Uno de los aspectos más interesantes de esa encuesta es el que se refiere a cómo se publica la información Linked Open Data en la Web. Evidentemente, no se trata sólo de consumir, sino de publicar información conforme a los principios de Linked Open Data, si bien es de temer que las instituciones españolas -siempre esclavas de sus sistemas informáticos- se limiten en el mejor de los casos a consumir información. El ejemplo del ya vetusto Z39.50 es una prueba clara de ello y en el que se puede ver aquella diferencia que Vázquez Montalbán estableció entre globalizadores y globalizados, lo cual aplicado a este caso sería entre quienes consumen información Linked Open Data y quienes están en condición de producirla. 

A partir de estos postulados, dos importantísimos productores de información, -ambos figuran en los primeros puestos en la repetidamente citada encuesta de la OCLC- han emprendido caminos diferentes en la producción de sus datos conforme al paradigma de Linked Open Data. La OCLC, más pragmática, ha optado por una solución basada en schema.org, mientras que la Library of Congress, más ambiciosa, pretende crear un modelo Linked Open Data para la descripción bibliográfica y para los registros de autoridad. Conscientes de esta situación y de esa divergencia, los expertos de la OCLC y de la Library of Congress se han reunido para producir un informe, que es el que nos ocupa ahora. Los editores del estudio son Carol Jean Godby, de OCLC Research, y Ray Denenberg de la Library of Congress. El estudio está publicado conjuntamente por ambas instituciones y puede seguirse la discusión en el hashtag de Twitter  #ldmodels que, muy acertadamente, se ha creado al efecto.

El estudio se inicia mediante una introducción en la que se detallan los esfuerzos tanto de la OCLC como de la Library of Congress en este entorno, esfuerzo que se inició en 2011. Entre 2011 y 2013 se desarrollaron importantes actividades con tres ideas fundamentales: proporcionar a los buscadores descripciones de recursos bibliotecarios de una forma que pueda ser utilizados por ellos; segundo, promover la aplicación de los conceptos definidos en los modelos FRBR y RDA y, tercero, ofrecer una solución que pudiera extenderse a la descripción de recursos para la comunidad del patrimonio cultural, entendida en un sentido amplio.

Fruto de estos trabajos, se publicó en 2013 un informe, del cual fue autora la misma Carol J. Godby, titulado The Relationships between BIBFRAME and OCLC’s Linked-Data Model of bibliographic description: a Working Paper[4] que en mi opinión es magnífico y sumamente útil. Los trabajos han continuado y ya desde 2013 se ha publicado un número verdaderamente considerable de registros bibliográficos de la OCLC y al mismo tiempo BIBFRAME[5] ha continuado con su desarrollo (Xavier Agenjo ¿Se inicia la transición?: Adiós a Marbi, bienvenido MAC)[6]. Todo el desarrollo del proyecto BIBFRAME se está siguiendo por un amplio número de especialistas de todo el mundo a través de la lista BIBFRAME que es de carácter público. La Library of Congress tiene previsto publicar, más adelante en este mismo año, un vocabulario revisado, así como lanzar un proyecto piloto para analizar si BIBFRAME soporta la catalogación original de los bibliotecarios, tanto de los registros bibliográficos como de autoridades. También las universidades de Stanford y de Cornell tienen previsto lanzar proyectos análogos. 

Puestas así las cosas y dado que desde 2013 y como se ha dicho la OCLC inició un proyecto, importantísimo por su volumen, para editar en Linked Open Data mediante schema.org casi 200 millones de registros de obras, en la denominación del modelo FRBR, utilizando Linked Data conforme a schema.org y URIs persistentes (todas las URIs deberían serlo). También la OCLC dentro de este proyecto está utilizando la tecnología que proporciona bibliograph.net[7] que es una colección de esquemas que se utilizan como extensión de schema.org, lo que por cierto es muy útil y sencillo y todos los bibliotecarios interesados en estas materias deberían, al menos, echarle un vistazo.

En 2013 la relación de los modelos de BIBFRAME y schema.org se visualizaba en este diagrama que reproduzco a partir de la imagen creada por Godby para OCLC Research


 
Como claramente muestra la imagen, el modelo Linked Data de la OCLC es similar al de BIBFRAME especialmente en lo que se refiere a la definición de entidades como obra, instancia, organización y persona, pero existen diferencias que se basan en cual es el objetivo de cada uno de los modelos. Mientras que el de BIBFRAME es, hablando claro, sustituir al formato MARC para que pueda utilizarse para las descripciones bibliográficas y de autoridades, el modelo Linked Data desarrollado por la OCLC pretende optimizar las descripciones de los recursos bibliotecarios para servicios de localización en la Web (discovery) más allá de las propias bibliotecas, de tal modo que pueda ser utilizado por los buscadores de propósito general. De hecho si los objetivos de schema.org se cumplen se habrá mejorado enormemente la visibilidad de las bibliotecas en la Web. 

A la vista de estos hechos es necesario, pues, hacer confluir, en la medida de lo posible, los dos enfoques de tal modo que puedan evitarse los solapamientos. Como ya he mencionado antes, está previsto que en 2015 se publique un análisis técnico comparado de ambos modelos, pero mientras tanto se ha publicado el documento que ahora reseño, que pretende dar una primera visión y acercamiento a ese futuro estudio. 

Quizá convenga destacar que tanto BIBFRAME[8] como OCLC[9] utilizan el modelo de FRBR de una forma simplificada, definiendo clases RDF para las distintas entidades que sin ser idénticas pueden ser compatibles. Sin embargo, hay tres grandes diferencias que recalcar. La primera es que el modelo de BIBFRAME, que a mi personalmente me gusta muchísimo, define clases RDF tanto para la obra como para la instancia, mientras que la OCLC solo lo hace para la obra. En opinión de Godby y de Denenberg esta diferencia no supone una incompatibilidad, aunque en mi opinión personal sí es un problema considerable que habrá de ser resuelto. La segunda diferencia, que es importantísima, define a la entidad autoridad como una clase RDF, pero eso no ocurre así en los modelos Linked Data de la OCLC. En el modelo de la OCLC la autoridad es informal, lo que obviamente desnaturaliza la función misma de registro de autoridad y como bien señalan Godby y Denenber tendrá que analizarse muy en detalle en los próximos informes técnicos. En tercer lugar, BIBFRAME define como clase RDF, como anotación, todo aquello que en el modelo de la OCLC se puede describir como revisiones, sumarios, cubiertas y ejemplares, todo lo cual tiene alternativas dentro del modelo OCLC/schema.org mediante formulaciones que el texto en inglés califica como parsimonious, lo que es tan divertido que no lo traduzco, pero que sí menciono para todos aquellos que creen que los aspectos técnicos de la catalogación son aburridos. Otra diferencia importante es el uso del vocabulario que utilizan tanto BIBFRAME como schema.org; en el caso de BIBFRAME se ha creado, o por mejor decir, se está creando un vocabulario específico del cual schema.org carece.

En resumen, el análisis comparado del modelo de BIBFRAME y del modelo OCLC/schema.org presenta considerables diferencias en la granularidad, esa gran aportación del formato MARC. El documento objeto de esta reseña muestra los admirables esfuerzos de la iniciativa BIBFRAME promovida por la Library of Congress y un amplio conjunto de instituciones de primera fila de todo el mundo; y por otro lado, de la OCLC y su mucho más pragmática iniciativa de aplicar schema.org a los registros bibliográficos, no olvidemos casi 200 millones que ya se están publicando en la Web[10]. Esta envidiable, sobre todo desde estos pagos, necesidad de coordinar los esfuerzos de instituciones de primer orden conducirá, sin duda alguna, a un modelo de datos que se ajuste a los principios Linked Open Data y sea respaldado por instituciones de primer nivel. 

Esta reseña del documento que han producido OCLC y la LC tiene como objeto difundir entre los especialistas de habla española y catalana esa magnífica iniciativa que, naturalmente, hay que calificar de biblioteconómica y animar a los bibliotecarios españoles e hispanoamericanos a no ser meramente espectadores de ese proceso sino actores del mismo, ajustando sus técnicas catalográficas y sus programas de gestión de bibliotecas a estos principios con el objetivo de poder consumir recursos Linked Open Data y además de ser capaces de producirlos.


[1] http://www.larramendi.es/i18n/cms/elemento.cmd?grupo=estaticos/paginas&e...
[2] http://www.larramendi.es/i18n/cms/elemento.cmd?id=novedades/noticias/La_...
[3] http://hangingtogether.org/?p=4137 
[4] http://www.oclc.org/content/dam/research/publications/library/2013/2013-...
[5] http://www.loc.gov/bibframe/
[6] http://www.thinkepi.net/%C2%BFse-inicia-la-transicion-adios-a-marbi-bien...
[7] http://bibliograph.net/
[8] http://bibframe.org/vocab/Work.html 
[9] http://schema.org/CreativeWork 
[10] http://www.oclc.org/developer/develop/linked-data/worldcat-entities/worl...