Explorant el paisatge europeu de dades de recerca: el projecte European Research Data Landscape

Versió per a imprimirVersió per a imprimir

Sabina Batlle Baró
Estudiant de doctorat
Facultat d’Informació i Mitjans Audiovisuals
Universitat de Barcelona (UB)


European research data landscape: final report (2022). Prepared by: Visionary Analytics, DANS, DCC, EFIS. Brussels: European Commission, Directorate-General for Research and Innovation. 44 p. Disponible a: <https://op.europa.eu/en/publication-detail/-/publication/03b5562d-6a35-11ed-b14f-01aa75ed71a1/language-en>. [Consulta: 14/02/2023]. 


El passat mes de novembre de 2022, la Direcció General per a la Recerca i la Innovació de la Comissió Europea va publicar l’informe European research data landscape. Es tracta de l’informe final de l’estudi que porta el mateix nom, fet durant els anys 2021 i 2022 per un seguit d’organitzacions i empreses d’arreu d’Europa expertes en la gestió de dades de recerca: DANS, DCC, EFIS i Visionary Analytics.

L’objectiu de l'estudi era oferir una caracterització detallada de l’ecosistema de la recerca en el context europeu (els països membres de la UE, el Regne Unit i els països associats al programa Horizon 2020), recollint i analitzant dades sobre la producció, el consum i les pràctiques de dipòsit de dades entre els investigadors. A més a més, es buscava obtenir dades sobre el nivell de coneixement i aplicació dels principis FAIR entre els investigadors, i avaluar el grau de preparació dels repositoris de recerca per implementar aquests principis. Amb tot això es pretenia obtenir una instantània de la situació actual per poder elaborar recomanacions i establir accions específiques de futur; unes propostes que volen servir de base a la Comissió Europea, a l’EOSC Partnership i als estats membres a l’hora de crear futures polítiques que portin a una millora de la gestió de dades de recerca i a una major implementació dels principis FAIR. 

El focus de l’estudi està posat en dos grans grups: els investigadors i els repositoris de dades de recerca. En cada cas, s’han utilitzat mètodes diferents per recollir les dades, cosa que fa que es tracti d’un estudi complex però complet.

Per una banda, es va fer arribar una enquesta a 840.182 investigadors. Les preguntes cobrien temes diversos que van de les pràctiques de gestió de dades de recerca (formats i tipus de dades, volums, etc.) a la familiaritat i l’ús dels principis FAIR, passant breument pels hàbits i perspectives sobre la compartició de dades, l’ús d’estàndards, les opinions sobre les polítiques de dades obertes i la necessitat de formació en aquest aspecte. L’enquesta va obtenir resposta de 15.066 investigadors de totes les disciplines. D’aquests, 719 eren investigadors espanyols, cosa que situa Espanya com a quart país més representat dins la mostra (després d’Itàlia, Alemanya i França).

Per altra banda, es va enquestar els repositoris de dades de recerca: en aquest cas, les 2.272 invitacions van rebre 316 respostes. Paral·lelament, es va analitzar una mostra de 31 repositoris del registre re3data.org entre els quals cal destacar el Repositorio institucional del Consejo Superior de Investigaciones Científicas (DIGITAL.CSIC) i el Repositori institucional de la Universitat Rovira i Virgili (URV). Aquesta mostra va ser analitzada amb l’eina F-UJI per avaluar el compliment dels principis FAIR de les dades que s’hi emmagatzemen. Per complementar aquesta recerca, es van escollir sis dels repositoris per dur a terme estudis de cas, amb els quals es va analitzar amb més detall la implementació dels principis FAIR.

Un dels valors d’aquest estudi és la mida de la mostra estudiada, molt superior a la mitjana dels estudis fets fins ara sobre gestió de dades de recerca; això no obstant, més enllà del volum de dades recollides, els resultats apunten en la mateixa direcció que la resta d’estudis. D’entre aquests, és interessant ressaltar l’encara baix percentatge d’investigadors que emmagatzemen les dades de recerca en repositoris: un 40 % dels enquestats van respondre que ho havien fet alguna vegada i només un 20 % ho havia fet durant la seva darrera recerca o la seva recerca actual, molt per sota, encara, de l’objectiu del 50 % de l’EOSC per al 2025.

Els resultats posen en relleu la importància de les institucions de recerca a l’hora de donar suport i guiatge als investigadors en la gestió i compartició de dades; en aquest sentit, un 60 % dels enquestats van seleccionar els «serveis de suport institucionals» com a lloc on es dirigeixen en cas de necessitar ajuda per gestionar, compartir o fer les seves dades FAIR. La majoria dels investigadors consideren que també és la institució de recerca qui s’hauria d’encarregar d’oferir formació, guiatge i suport per fer les dades FAIR.

De la mateixa manera, els resultats permeten afirmar que és més probable que els investigadors compleixin els mandats en gestió de dades si les polítiques són fàcils d’entendre i si se’ls ofereix acompanyament i suport en el procés. També es posa en relleu la necessitat de formació en gestió de dades i dades FAIR, un problema ja identificat en altres estudis similars.
En tots dos casos, semblaria que les biblioteques i els professionals de la informació poden jugar un paper important, com a comunicadors i formadors dels mandats de les polítiques de recerca oberta i com a punt de suport per al compliment d’aquests, i les dades recollides recalquen la importància del seu rol dins les institucions de recerca com a punts de referència en temes de gestió de dades i dades FAIR.

És també en aquesta direcció cap on apunten les recomanacions presentades a l’informe, i que constitueixen el seu principal interès. Els resultats de les enquestes a investigadors i repositoris i dels casos d’estudi serveixen de base per a la identificació de les quatre necessitats principals per millorar la situació actual de la gestió de dades de recerca:

  • És crucial oferir suport per a la gestió de dades de recerca en l’àmbit local.
     
  • Cal suport en tots els passos del cicle de vida de les dades per planificar i fer una correcta gestió de dades.
     
  • Cal facilitar l’avaluació del grau de FAIRificació de les dades de recerca i fer un seguiment de la progressió cap a un major suport i serveis que facilitin la implementació dels principis FAIR.
     
  • Segueix essent necessari conscienciar dels beneficis de la implementació dels principis FAIR per a la ciència i la societat.

Aquests quatre eixos es materialitzen en recomanacions generals i accions concretes, com per exemple fomentar la col·laboració entre repositoris, o desenvolupar eines que permetin monitoritzar la implementació dels principis FAIR en les dades dipositades. I és aquí on queda palesa la importància dels professionals de la informació amb la reivindicació de la figura del gestor de dades (data steward) i el seu paper cabdal en la gestió de les dades dins dels repositoris i de les institucions de recerca: com a punts de referència, com a experts que ofereixin acompanyament en la preparació de les dades per al dipòsit, com a pols de coneixement i coordinació d’una futura xarxa de suport a la gestió de dades... en definitiva, com a engranatge imprescindible per al correcte funcionament del model de dades FAIR i per a la seva promoció. 

La principal limitació de l’informe és la compressió, ja que sintetitza en 44 pàgines un estudi de gran magnitud i fruit de recerques diverses. Això fa que l’anàlisi dels resultats sigui poc detallada o excessivament generalista, i que es trobin a faltar més gràfics que permetin explorar i entendre en profunditat les dades recollides i la informació generada –per exemple, en pocs casos els resultats estan desglossats per països o per camps de la ciència. Tot i això, en cas de tenir interès sobre el tema, el lector pot accedir al projecte de Zenodo, on s’han dipositat les dades crues recollides amb les enquestes i anàlisis, i altres materials addicionals com les infografies i els informes complerts i detallats amb els resultats de cada una de les recerques dutes a terme.

 

© Imatge inicial de Josué Miguel Escudero a Pixabay