Los retos de la gestión de datos de investigación

Versión para impresiónVersión para impresión
Ángel Borrego
Facultat de Biblioteconomia i Documentació
Universitat de Barcelona
 
 

van der Graaf M, Waaijers L (2011). A surfboard for riding the web: towards a four country action programme on research data. Disponible a:
http://www.knowledge-exchange.info/Admin/Public/DWSDownload.aspx?File=%2fFiles%2fFiler%2fdownloads%2fPrimary+Research+Data%2fSurfboard+for+Riding+the+Wave%2fKE_Surfboard_Riding_the_Wave_Screen.pdf
 
Kotarski R, Reilly S, Schrimpf S, Smit E, Walshe K (2012). Report on best practices for citability of data and on evolving roles in scholarly communication. Disponible a:
http://www.alliancepermanentaccess.org/wp-content/uploads/downloads/2012/08/ODE-ExecutiveSummary-
ReportBestPracticesCitabilityDataEvolvingRolesScholarlyCommunication.pdf
 
Dallmeier-Tiessen S, Darby R, Gitmans K, Lambert S, Suhonen J, Wilson M (2012). Compilation of results on drivers and barriers and new opportunities. Disponible a:
http://www.alliancepermanentaccess.org/wp-content/uploads/downloads/2012/08/ODE-CompilationResultsDriversBarriersNewOpportunities1.pdf
 

Jahnke L, Asher A, Keralis S. (2012). The problem of data. Disponible a: http://www.clir.org/pubs/reports/pub154/pub154.pdf
 

Rufino LasaosaLa gestión de datos primarios de investigación es uno de los temas de actualidad en nuestro ámbito profesional como se pone de manifiesto en la proliferación de informes que sobre esta cuestión se han publicado durante los últimos meses.

En noviembre de 2010 se reseñaban en este mismo Blok (1) las conclusiones de un estudio encargado por la Comisión Europea sobre los costes y beneficios de la puesta en marcha de una infraestructura de datos científicos a nivel europeo. En ese informe los autores proponían diversas acciones para hacer realidad esta infraestructura el año 2030. No ha habido que esperar tanto para ver los primeros resultados y, en noviembre de 2011, ya se publicó un primer trabajo (2) que presentaba la situación de la gestión de datos de investigación en Alemania, Dinamarca, Países Bajos y Reino Unido con vistas a iniciar acciones conjuntas en este ámbito. El informe comenzaba analizando los incentivos que pueden motivar a los investigadores a compartir datos de investigación: la obtención de un reconocimiento similar al que reciben por sus publicaciones, la adopción de esta actitud como parte de la cultura científica, o la obediencia a los mandatos de las agencias de financiación y de las revistas científicas. Un segundo aspecto analizado eran las iniciativas de formación de los profesionales –tanto científicos como bibliotecarios– que deberán gestionar estos datos. Por último, el informe abordaba las características que deberá tener la futura infraestructura de almacenamiento de los datos científicos a partir del análisis de los repositorios nacionales ya disponibles en los cuatro países considerados y sus necesidades de financiación.

Una opción para compartir datos de investigación es hacerlo como material suplementario a los artículos de revista. Sobre esta cuestión ya reseñamos en el Blok (3) un primer informe de resultados del proyecto europeo ODE (Opportunities for Data Exchange, 4). Durante este verano, el equipo del proyecto ha publicado dos nuevos informes. El primero (5) analiza el problema de la citación de los datos como elemento clave para otorgar crédito a los autores de los datasets, conservar un registro de la evidencia empírica de investigaciones previas y facilitar a los investigadores la localización y reutilización de los datos. A partir del centenar de respuestas a una encuesta distribuida por LIBER (6) entre bibliotecarios intentan sentar las bases para unas convenciones sobre qué metadatos incluir en la citación de datos, cómo citar las diversas contribuciones en la elaboración de un dataset o cómo citar datasets en continua actualización. El informe también aborda la necesidad de utilizar URLs permanentes y utilizar formatos que permitan desarrollar métricas de uso de los datasets. La encuesta también recoge las opiniones de los bibliotecarios sobre las demandas de sus usuarios en este campo, el tipo de apoyo que actualmente ofrecen y sus necesidades de formación en este ámbito. Los resultados ponen de manifiesto la importancia que las bibliotecas otorgan a esta función en su futuro inmediato pese a que las peticiones de apoyo por parte de los investigadores son aún escasas.

El segundo informe (7) derivado del proyecto ODE se centra en la identificación de los incentivos y las barreras con las que se encuentran los actores implicados en la utilización compartida de datos de investigación. En el curso de las entrevistas realizadas con expertos, los autores identificaron una decena de temas relevantes que analizan en el informe: el papel de los editores como agentes en el proceso de comunicación científica que tendrán un papel relevante en este ámbito dada la relación existente entre los datos científicos y las publicaciones que se derivan, la financiación de las estructuras que almacenarán los datos, la formación de los investigadores y bibliotecarios que trabajarán en este ámbito, la necesidad de estándares en el formato y la descripción de los datos, los formatos de citación para su posterior localización; la visibilidad pública de los datos en áreas sensibles como el cambio climático o la salud; el establecimiento de una cultura científica de compartir datos, las políticas y marcos legales nacionales, los incentivos, los investigadores para compartir, o los controles de calidad de los datos.

Finalmente, el último mes de agosto, el Council of Library and Information Resources (CLIR, 8) publicaba el trabajo "The Problem of Data" (9) que agrupa dos informes sobre la cuestión. El primero presenta los resultados de un estudio cualitativo entre una veintena de investigadores de ciencias sociales de cinco universidades estadounidenses para conocer sus prácticas de gestión de datos. Los resultados muestran que los investigadores no reciben formación en este ámbito, que casi no prestan atención a la preservación a largo plazo de los datos de investigación (empeñados como están en la necesidad de publicar) y que desconocen los servicios que las bibliotecas pueden prestar en este terreno ya que las ven más como dispensadoras de bienes (libros y artículos) que como prestatarias de servicios. De acuerdo con los resultados del estudio, una de las principales dificultades en la gestión de datos radica en su complejo ciclo de vida a lo largo de un proyecto: varios investigadoras pueden participar en su recogida, frecuentemente proceden de diversas fuentes y a menudo se encuentran en diversos formatos. Una vez finalizado un proyecto de investigación, pocos investigadores disponen del tiempo necesario para añadir metadatos, especialmente dada la poca recompensa que obtendrán en comparación con la publicación de los resultados. Llama la atención el escaso valor que algunos investigadores asignan a los datos sobre la base de sus escasas opciones de reutilización posterior.

La formación es el tema que aborda el segundo informe incluido en la publicación del CLIR. Se trata de un breve trabajo que analiza la oferta formativa en el ámbito de la gestión de datos de investigación en las escuelas norteamericanas de biblioteconomía y documentación, así como las características de otras ofertas formativas en este terreno. En la actualidad son cinco las escuelas que ofrecen algún certificado formativo en este ámbito dentro del marco de algún máster y, de manera adicional, están apareciendo programas que forman investigadores postdoctorales en la gestión de datos de investigación.

En definitiva, este abanico de publicaciones pone de relieve el creciente interés por un ámbito que se convertirá en un nicho de mercado para las bibliotecas universitarias y de investigación en los próximos años. El volumen de producción bibliográfica sobre la temática, su diversidad y los mismos contenidos de los informes ponen de manifiesto, sin embargo, el elevado número de interrogantes aún sin respuesta. La necesidad de incentivar a los investigadores a compartir los datos –cuando todavía no está consolidado el acceso abierto a sus publicaciones– y la necesidad de formación en un terreno especialmente complejo, que requerirá del trabajo conjunto de investigadores y bibliotecarios, son temas recurrentes en un ámbito lleno de retos.


(1) http://www.ub.edu/blokdebid/ca/content/una-plenamar-de-dades

(2) van der Graaf M, Waaijers L (2011). A surfboard for riding the web: towards a four country action programme on research data. http://www.knowledge-exchange.info/Admin/Public/DWSDownload.aspx?File=%2...

(3) http://www.ub.edu/blokdebid/ca/content/enriquir-les-publicacions-amb-dad...

(4) http://www.alliancepermanentaccess.org/index.php/community/current-proje...

(5) Kotarski R, Reilly S, Schrimpf S, Smit E, Walshe K (2012). Report on best practices for citability of data and on evolving roles in scholarly communication. http://www.alliancepermanentaccess.org/wp-content/plugins/download-monit...

(6) http://www.libereurope.eu

(7) Dallmeier-Tiessen S, Darby R, Gitmans K, Lambert S, Suhonen J, Wilson M (2012). Compilation of results on drivers and barriers and new opportunities.
http://www.alliancepermanentaccess.org/wp-content/plugins/download-monitor/download.php?id=Compilation+of+Results+on+Drivers+and+Barriers+and+New+Opportunities

(8) http://www.clir.org
(9) Jahnke L, Asher A, Keralis S. (2012). The problem of data. http://www.clir.org/pubs/reports/pub154/pub154.pdf