Afegeix un nou comentari

Els reptes de la gestió de dades de recerca

Versió per a imprimirVersió per a imprimir
Ángel Borrego
Facultat de Biblioteconomia i Documentació
Universitat de Barcelona
 

van der Graaf M, Waaijers L (2011). A surfboard for riding the web: towards a four country action programme on research data. Disponible a:
http://www.knowledge-exchange.info/Admin/Public/DWSDownload.aspx?File=%2fFiles%2fFiler%2fdownloads%2fPrimary+Research+Data%2fSurfboard+for+Riding+the+Wave%2fKE_Surfboard_Riding_the_Wave_Screen.pdf
 
Kotarski R, Reilly S, Schrimpf S, Smit E, Walshe K (2012). Report on best practices for citability of data and on evolving roles in scholarly communication. Disponible a:
http://www.alliancepermanentaccess.org/wp-content/uploads/downloads/2012/08/ODE-ExecutiveSummary-ReportBestPracticesCitabilityDataEvolvingRolesScholarlyCommunication.pdf

Dallmeier-Tiessen S, Darby R, Gitmans K, Lambert S, Suhonen J, Wilson M (2012). Compilation of results on drivers and barriers and new opportunities. Disponible a:
http://www.alliancepermanentaccess.org/wp-content/uploads/downloads/2012/08/ODE-CompilationResultsDriversBarriersNewOpportunities1.pdf
 

Jahnke L, Asher A, Keralis S. (2012). The problem of data. Disponible a: http://www.clir.org/pubs/reports/pub154/pub154.pdf
 

La gestió de dades primàries de recerca és un dels temes d'actualitat en el nostre àmbit professional com es fa palès en la proliferació d'informes que sobre aquesta qüestió s'han publicat durant els darrers mesos.

El novembre de 2010 es ressenyaven en aquest mateix Blok (1) les conclusions d'un estudi encarregat per la Comissió Europea sobre els costos i beneficis de la posada en marxa d'una infraestructura de dades científiques a nivell europeu. En aquell informe els autors proposaven diverses accions per fer realitat aquesta infraestructura l'any 2030. No ha calgut esperar tant per veure els primers resultats i, el novembre de 2011, ja es va publicar un primer treball (2) que presentava la situació de la gestió de dades de recerca a Alemanya, Dinamarca, Països Baixos i Regne Unit amb vistes a encetar iniciatives conjuntes en aquest àmbit. L'informe començava analitzant els incentius que poden motivar els investigadors a compartir dades de recerca: l'obtenció d'un reconeixement similar al que reben per les seves publicacions, l'adopció d'aquesta actitud com a part de la cultura científica, o l'obediència als mandats de les agències de finançament i de les revistes científiques. Un segon aspecte analitzat eren les iniciatives de formació dels professionals –tant científics com bibliotecaris– que hauran de gestionar aquestes dades. Per últim, l'informe abordava les característiques que haurà de tenir la futura infraestructura d'emmagatzematge de les dades científiques a partir de l'anàlisi dels repositoris nacionals ja disponibles als quatre països considerats i les seves necessitats de finançament.
 

Una opció per compartir dades de recerca és fer-ho com a material suplementari als articles de revista. Sobre aquesta qüestió ja vam ressenyar al Blok (3) un primer informe de resultats del projecte europeu ODE (Opportunities for Data Exchange, 4). Durant aquest estiu, l'equip del projecte ha publicat dos nous informes. El primer (5) analitza el problema de la citació de les dades com a element clau per atorgar crèdit als autors dels datasets, conservar un registre de l'evidència empírica d'investigacions prèvies i facilitar als investigadors la localització i reutilització de les dades. A partir del centenar de respostes a una enquesta distribuïda per LIBER (6) entre bibliotecaris s'intenten establir les bases per a unes convencions sobre quines metadades cal incloure en la citació de dades, com citar les diverses contribucions en l'elaboració d'un dataset o com citar datasets en continua actualització. L'informe també aborda la necessitat de fer servir URLs permanents i utilitzar formats que permetin desenvolupar mètriques d'ús dels datasets. L'enquesta també recull les opinions dels bibliotecaris sobre les demandes dels seus usuaris en aquest camp, el tipus de suport que actualment ofereixen i les seves necessitats de formació en aquest àmbit. Els resultats posen de manifest la importància que les biblioteques atorguen a aquesta funció en el seu futur immediat malgrat que les peticions de suport per part dels investigadors són encara escasses.

El segon informe (7) derivat del projecte ODE se centra en la identificació dels incentius i les barreres amb les quals es troben els actors implicats en la utilització compartida de dades de recerca. En el curs de les entrevistes realitzades amb experts, els autors van identificar una desena de temes rellevants que analitzen a l'informe: el paper dels editors com a agents en el procés de comunicació científica que tindran un paper rellevant en aquest àmbit donada la relació existent entre les dades científiques i les publicacions que se'n deriven; el finançament de les estructures que emmagatzemaran les dades; la formació dels investigadors i bibliotecaris que treballaran en aquest àmbit; la necessitat d'estàndards en el format i la descripció de les dades; els formats de citació per a la seva posterior localització; la visibilitat pública de les dades en àrees sensibles com el canvi climàtic o la salut; l'establiment d'una cultura científica de compartir dades; les polítiques i marcs legals nacionals; els incentius als investigadors per compartir; o els controls de qualitat de les dades.

Finalment, el darrer mes d'agost, el Council of Library and Information Resources (CLIR, 8) publicava el treball "The Problem of Data" (9) que agrupa dos informes sobre la qüestió. El primer presenta els resultats d'un estudi qualitatiu entre una vintena d'investigadors de ciències socials de cinc universitats nord-americanes per conèixer les seves pràctiques de gestió de dades. Els resultats mostren que els investigadors no reben formació en aquest àmbit, que gairebé no presten atenció a la preservació a llarg termini de les dades de recerca (capficats com estan en la necessitat de publicar) i que desconeixen els serveis que les biblioteques poden prestar en aquest terreny ja que les veuen més com a dispensadores de bens (llibres i articles) que no pas com a prestatàries de serveis. D'acord amb els resultats de l'estudi, una de les principals dificultats en la gestió de dades rau en el seu complex cicle de vida al llarg d'un projecte: diversos investigadores poden participar en la seva recollida, freqüentment procedeixen de diverses fonts i sovint es troben en diversos formats. Un cop finalitzat un projecte de recerca pocs investigadors disposen del temps necessari per afegir-hi metadades, especialment donada la poca recompensa que obtindran en comparació amb la publicació dels resultats. Crida l'atenció l'escàs valor que alguns investigadors assignen a les dades sobre la base de les seves escasses opcions de reutilització posterior.

La formació és el tema que aborda el segon informe inclòs a la publicació del CLIR. Es tracta d'un breu treball que analitza l'oferta formativa en l'àmbit de la gestió de dades de recerca a les escoles nord-americanes de biblioteconomia i documentació, així com les característiques d'altres ofertes formatives en aquest terreny. En l'actualitat són cinc les escoles que ofereixen algun certificat formatiu en aquest àmbit dins del marc d'algun màster i, de manera addicional, estan apareixent programes que formen investigadors postdoctorals en la gestió de dades de recerca.

En definitiva, aquest ventall de publicacions posa de relleu el creixent interès per un àmbit que esdevindrà un nínxol de mercat per a les biblioteques universitàries i de recerca en el propers anys. El volum de producció bibliogràfica sobre la temàtica, la seva diversitat i els mateixos continguts dels informes fan palès, però, l'elevat nombre d'interrogants encara sense resposta. La necessitat d'incentivar els investigadors a compartir les dades –quan encara no està consolidat l'accés obert a les seves publicacions– i la necessitat de formació en un terreny especialment complex, que requerirà del treball conjunt d'investigadors i bibliotecaris, són temes recurrents en un àmbit ple de reptes.
 


(1) http://www.ub.edu/blokdebid/ca/content/una-plenamar-de-dades

(2) van der Graaf M, Waaijers L (2011). A surfboard for riding the web: towards a four country action programme on research data. http://www.knowledge-exchange.info/Admin/Public/DWSDownload.aspx?File=%2...

(3) http://www.ub.edu/blokdebid/ca/content/enriquir-les-publicacions-amb-dad...

(4) http://www.alliancepermanentaccess.org/index.php/community/current-proje...

(5) Kotarski R, Reilly S, Schrimpf S, Smit E, Walshe K (2012). Report on best practices for citability of data and on evolving roles in scholarly communication. http://www.alliancepermanentaccess.org/wp-content/plugins/download-monit...

(6) http://www.libereurope.eu

(7) Dallmeier-Tiessen S, Darby R, Gitmans K, Lambert S, Suhonen J, Wilson M (2012). Compilation of results on drivers and barriers and new opportunities.
http://www.alliancepermanentaccess.org/wp-content/plugins/download-monitor/download.php?id=Compilation+of+Results+on+Drivers+and+Barriers+and+New+Opportunities

(8) http://www.clir.org
(9) Jahnke L, Asher A, Keralis S. (2012). The problem of data. http://www.clir.org/pubs/reports/pub154/pub154.pdf