Preservación de datos de investigación: estrategias prácticas

Versión para impresiónVersión para impresión

Antonia Ferrer Sapena, Universidad Politécnica de Valencia
Enrique A. Sánchez Pérez, Universidad Politécnica de Valencia
Fernanda Peset, Universidad Politécnica de Valencia


Johnston, Lisa R. (ed.) Curating research data. Chicago: Association of College and Research Libraries, 2017- . «Volume one: practical strategies for your digital repository». 285 p. Disponible en:  http://www.ala.org/acrl/sites/ala.org.acrl/files/content/publications/bo.... [Consulta: 03/07/17].


Este primer volumen de una obra mayor trata distintos aspectos que van unidos a la conservación de datos de investigación.

La introducción de Lisa R. Johnston resume de manera clara cada uno de los principales apartados del libro. Johnston ha sido bibliotecaria de los servicios de investigación y codirectora del repositorio institucional de la University of Minnesota, capacitación que le permite señalar los desafíos a los que se enfrentan los profesionales encargados del tratamiento de los datos. Los considera los primeros usuarios, por lo que son quienes desde el primer momento deben identificar los problemas que puede tener su reutilización. En esta introducción, además, se define la terminología que se utiliza así como los motivos por los cuales se desarrollan los servicios de conservación, los requisitos que deben tener y las políticas para su intercambio.

Este primer volumen, dividido en tres partes, explora las razones por las cuales existen los servicios de preservación de los datos. La primera parte aborda los temas relacionados con la preservación, las políticas existentes para el intercambio de datos y señala algunos de los trabajos de colaboración puestos en marcha. Incide en cuestiones ya conocidas. Por ejemplo, la influencia de los incentivos –positivos o negativos– académicos y de los organismos de financiación para abrir datos ha contribuido a que se extienda la colaboración en áreas en las que hasta el momento era escasa. En esta primera parte destaca la recopilación de políticas de fomento para compartir datos tanto a nivel nacional como internacional en distintos países. Junto a los mandatos de los países, también se aborda la política que están siguiendo las revistas para el depósito de datos, señalando las distintas publicaciones y estudios que se han hecho hasta la fecha sobre ello. Indudablemente, toma como referencia los estudios de Heather A. Piwowar. Políticas que, tal y como se señala, no sólo se han extendido, sino que ha aparecido un nuevo formato de revistas, las revistas de datos. Esta primera parte del libro se cierra con estudios de casos de éxito, normas para la reutilización y la trayectoria histórica de los científicos a la hora de compartir datos.

La segunda parte aborda aspectos clave para el mantenimiento de los servicios sobre datos de investigación. Algunos de los factores clave que identifica son los costos, las estrategias de marketing y dónde deben focalizar el esfuerzo los profesionales que se enfrentan al reto de poner en marcha un nuevo repositorio de datos. Jon Wheeler muestra cómo las bibliotecas académicas han ido tomando un papel cada vez más significativo en la prestación de servicios tanto básicos como avanzados. Plantea, por ejemplo, cómo ofrecer plataformas para la publicación de datos junto con el repositorio. Establece, además, de que manera estos repositorios pueden ser complementarios a los repositorios temáticos, lo que ilustra con distintos ejemplos, presentando además modelos de financiación que pueden hacerlos sostenibles a largo plazo.
En el capítulo 9, Katherine J. Gerwig, de la Metropolitan State University, muestra los métodos de marketing y difusión empleados por más de una docena de instituciones académicas. Ello puede ser útil para generar nuevas ideas a quienes comiencen con políticas de difusión en los repositorios de datos.

La tercera parte aborda el ciclo de vida de los datos. Trata cuestiones prácticas y éticas que los profesionales deben tener en cuenta cuando se preparan los datos para la preservación. En este contexto, señala algunos aspectos de interés. El primero de ellos se cifra en que si estos datos se conservan para su posterior reutilización, el usuario final debe tener disponibles todos los metadatos: cómo se diseñaron y construyeron; cuándo, dónde y cómo se recopilaron; y una minuciosa descripción de su procesamiento. Documentar todos estos detalles no suele ser del agrado del científico que lo considera una tarea meramente técnica y no ligada a sus intereses investigadores. De forma adicional, en ocasiones tampoco son partidarios de una transparencia extrema de los datos, ya que esto los hace más vulnerables a los ataques y a la apropiación de trabajos. Ante estos problemas, se plantea que el curador de los datos puede adoptar un rol que contribuya a eliminar estas suspicacias, promoviendo la reutilización ética y adecuada de los mismos.

Un punto poco tratado es el que se aborda en el capítulo 12 y que es crucial para la preservación: ¿qué ocurre cuando los datos ya son obsoletos? También se presentan problemas a la hora de recuperar datos de servicios que ya han desaparecido, u otros ligados a los datos huérfanos. En estos casos, se les atribuye a los curadores la labor de aplicar los metadatos (en algunos casos) para que puedan ser reutilizados.

Finaliza este volumen con una reflexión sobre dos aspectos. Un primer aspecto que trata sobre si estas colecciones digitales de datos son catalizadores del progreso y contribuyen a la democratización de la educación y la ciencia. Un segundo aspecto que aborda es si el abrir y compartir los datos contribuirá a mejorar el desarrollo económico y social y si, finalmente, estos podrán llegar a ser económicamente rentables.