Explorando el paisaje europeo de datos de investigación: el proyecto European Research Data Landscape

Versión para impresiónVersión para impresión

Sabina Batlle Baró
Estudiante de doctorado
Facultat d’Informació i Mitjans Audiovisuals
Universitat de Barcelona (UB)


European research data landscape: final report (2022). Prepared by: Visionary Analytics, DANS, DCC, EFIS. Brussels: European Commission, Directorate-General for Research and Innovation. 44 p. Disponible en: <https://op.europa.eu/en/publication-detail/-/publication/03b5562d-6a35-11ed-b14f-01aa75ed71a1/language-en>. [Consulta: 14/02/2023].


El pasado mes de noviembre de 2022, la Dirección General para la Investigación y la Innovación de la Comisión Europea publicó el informe European research data landscape. Se trata del informe final del estudio que lleva el mismo nombre, realizado durante los años 2021 y 2022 por diversas organizaciones y empresas de toda Europa expertas en la gestión de datos de investigación: DANS, DCC, EFIS y Visionary Analytics.

El objetivo del estudio era ofrecer una caracterización detallada del ecosistema de la investigación en el contexto europeo (los países miembros de la UE, el Reino Unido y los países asociados al programa Horizon 2020), recogiendo y analizando datos sobre la producción, el consumo y las prácticas de depósito de datos entre los investigadores. Además, se buscaba obtener datos sobre el nivel de conocimiento y aplicación de los principios FAIR entre los investigadores, y evaluar el grado de preparación de los repositorios de investigación para implementar estos principios. Con todo ello se pretendía obtener una instantánea de la situación actual para poder elaborar recomendaciones y establecer acciones específicas de futuro; unas propuestas que pretenden servir de base a la Comisión Europea, al EOSC Partnership y a los estados miembros a la hora de crear futuras políticas que conduzcan a una mejora de la gestión de datos de investigación y a una mayor implementación de los principios FAIR. 

El foco del estudio está puesto en dos grandes grupos: los investigadores y los repositorios de datos de investigación. En cada caso, se han utilizado métodos diferentes para recoger los datos, lo que hace que se trate de un estudio complejo pero completo.

Por una parte, se hizo llegar una encuesta a 840.182 investigadores. Las preguntas cubrían temas diversos que van de las prácticas de gestión de datos de investigación (formatos y tipos de datos, volúmenes, etc.) a la familiaridad y el uso de los principios FAIR, pasando brevemente por los hábitos y perspectivas sobre la compartición de datos, el uso de estándares, las opiniones sobre las políticas de datos abiertos y la necesidad de formación en este aspecto. La encuesta obtuvo respuesta de 15.066 investigadores de todas las disciplinas. De estos, 719 eran investigadores españoles, lo que sitúa a España como cuarto país más representado dentro de la muestra (después de Italia, Alemania y Francia).

Por otra parte, se encuestó a los repositorios de datos de investigación: en este caso, las 2.272 invitaciones recibieron 316 respuestas. Paralelamente, se analizó una muestra de 31 repositorios del registro re3data.org entre los que hay que destacar el Repositorio institucional del Consejo Superior de Investigaciones Científicas (DIGITAL.CSIC) y el Repositori institucional de la Universitat Rovira i Virgili (URV). Esta muestra se analizó con la herramienta F-UJI para evaluar el cumplimento de los principios FAIR de los datos que se almacenan en ellos. Para complementar esta investigación, se escogieron seis de los repositorios para llevar a cabo estudios de caso, con los que se analizó con más detalle la implementación de los principios FAIR.

Uno de los valores de este estudio es el tamaño de la muestra estudiada, muy superior a la mediana de los estudios hechos hasta ahora sobre gestión de datos de investigación; no obstante, más allá del volumen de datos recogidos, los resultados apuntan en la misma dirección que el resto de estudios. De entre estos, es interesante resaltar el todavía bajo porcentaje de investigadores que almacenan los datos de investigación en repositorios: un 40 % de los encuestados respondieron que lo habían hecho alguna vez y solo un 20 % lo había hecho durante su última investigación o su investigación actual, muy por debajo, todavía, del objetivo del 50 % de la EOSC para el 2025.

Los resultados ponen de relieve la importancia de las instituciones de investigación a la hora de apoyar y guiar a los investigadores en la gestión y compartición de datos; en este sentido, un 60 % de los encuestados seleccionaron los «servicios de apoyo institucionales» como lugar donde se dirigen en caso de necesitar ayuda para gestionar, compartir o hacer sus datos FAIR. La mayoría de los investigadores consideren que también es la institución de investigación quien debería encargarse de ofrecer formación, guía y apoyo para hacer los datos FAIR.

De la misma manera, los resultados permiten afirmar que es más probable que los investigadores cumplan los mandatos en gestión de datos si las políticas son fáciles de entender y si se les ofrece acompañamiento y apoyo en el proceso. También se pone de relieve la necesidad de formación en gestión de datos y datos FAIR, un problema ya identificado en otros estudios similares.

En todos los dos casos, pudiera parecer que las bibliotecas y los profesionales de la información pueden jugar un papel importante, como comunicadores y formadores de los mandatos de las políticas de investigación abierta y como punto de apoyo para el cumplimento de estos, y los datos recogidos recalcan la importancia de su rol dentro de las instituciones de investigación como puntos de referencia en temas de gestión de datos y datos FAIR.

Es también en esta dirección hacia donde apuntan las recomendaciones presentadas en el informe, y que constituyen su principal interés. Los resultados de las encuestas a investigadores y repositorios y de los casos de estudio sirven de base para la identificación de las cuatro necesidades principales para mejorar la situación actual de la gestión de datos de investigación:

  • Es crucial ofrecer apoyo para la gestión de datos de investigación a nivel local.
     
  • Es necesario el apoyo en todos los pasos del ciclo de vida de los datos para planificar y hacer una correcta gestión de datos.
     
  • Hay que facilitar la evaluación del grado de FAIRificación de los datos de investigación y hacer un seguimiento de la progresión hacia a un mayor apoyo y servicios que faciliten la implementación de los principios FAIR.
     
  • Sigue siendo necesario concienciar sobre beneficios de la implementación de los principios FAIR para la ciencia y la sociedad.

Estos cuatro ejes se materializan en recomendaciones generales y acciones concretas, como por ejemplo fomentar la colaboración entre repositorios, o desarrollar herramientas que permitan monitorizar la implementación de los principios FAIR en los datos depositados. Y es aquí donde se pone de manifiesto la importancia de los profesionales de la información con la reivindicación de la figura del gestor de datos (data steward) y su papel esencial en la gestión de los datos dentro de los repositorios y de las instituciones de investigación: como puntos de referencia, como expertos que ofrezcan acompañamiento en la preparación de los datos para el depósito, como polos de conocimiento y coordinación de una futura red de apoyo a la gestión de datos... en definitiva, como engranaje imprescindible para el correcto funcionamiento del modelo de datos FAIR y para su promoción. 

La principal limitación del informe es la compresión, dado que sintetiza en 448 páginas un estudio de gran magnitud y fruto de investigaciones diversas. Esto hace que el análisis de los resultados sea poco detallado o excesivamente generalista, y que se eche de menos más gráficos que permitan explorar y entender en profundidad los datos recogidos y la información generada –por ejemplo, en pocos casos los resultados están desglosados por países o por campos de la ciencia. Aun así, en caso de tener interés sobre el tema, el lector puede acceder al proyecto de Zenodo, donde se han depositado los datos crudos recogidos con las encuestas y análisis, y otros materiales adicionales como las infografías y los informes completos y detallados con los resultados de cada una de las investigaciones llevadas a cabo.

 

© Imagen inicial de Josué Miguel Escudero en Pixabay