La preservació de les dades de recerca i les agències de finançament de la R+D

Versió per a imprimirVersió per a imprimir
Alice Keefer
Facultat de Biblioteconomia i Documentació
Universitat de Barcelona
 

Maron, Nancy L.; Loy, Matthew (2011). Funding for sustainability: how funders' practices influence the future of digital resources. (http://www.ithaka.org/ithaka-s-r/research/funding-for-sustainability/FundingForSustainability.pdf)

Aquest informe, encarregat pel JISC i la Strategic Content Alliance i preparat per Ithaka S&R, analitza què fan i què poden fer les agències de finançament de la recerca per tractar que els materials digitals recollits o generats durant els projectes d'investigació –sobretot les dades científiques i altres recursos complexos– siguin accessibles i utilitzables en el futur.

Els últims anys han vist créixer el nombre d'iniciatives a escala internacional dedicades a la gestió a llarg termini de la "informació científica". Aquest concepte, tot i tenir un abast molt ampli ara se centra principalment en les dades científiques generades o recollides durant els projectes d'investigació i no tant les publicacions que resulten de la investigació. Una consulta recent de la Comissió Europea sobre la informació científica a l'època digital defineix les dades d'investigació de la següent manera:

"‘Research data' … may be numerical/quantitative, descriptive/qualitative or visual, raw or analysed, experimental or observational. Examples are digitised primary research data, photographs and images, films, etc."

El terme que se sol fer servir actualment per a la gestió activa i prolongada de les dades científiques és "digital curation" o "data curation", definit pel Digital Curation Centre com "gestionar, preservar i afegir valor a les dades d'investigació al llarg del seu cicle vital." (www.dcc.ac.uk/digital-curation/what-digital-curation)

A diferència dels documents que es publiquen per difondre els resultats de la recerca –e-prints, articles, comunicacions a congressos, etc.– les dades d'investigació digitals tradicionalment no arribaven més enllà de l'equip responsable de la seva creació i generalment només durant el període vigent de la recerca. Actualment la sostenibilitat d'aquestes dades interessa a les universitats, les agències de finançament de la investigació, els governs i, fins i tot, la Comissió Europea. La raó es basa en la importància reconeguda de les dades per al foment de la innovació científica i tecnològica, per una banda, i per l'altra, en l'estalvi que representaria poder aprofitar les dades ja existents en projectes de recerca en el futur: és a dir, es podran "re-utilitzar" (reuse). Però, tal i com afirma la coordinadora de la coalició holandesa de preservació digital, es tracta del "tipus d'informació digital més complicat de gestionar (curate), ja que tant els productors que generen les dades, com els tipus de dades, són molt variats i s'inclouen objectes molt complexos...". 1

Els autors de l'informe van realitzar enquestes a 25 agències de finançament públiques o sense ànim de lucre a Europa i Nord-Amèrica per conèixer, entre altres factors, les estratègies emprades per obligar o incentivar els investigadors a mantenir accessibles després del projecte les dades digitals creades amb el seu finançament. Es posen com exemples els següents tipus de recursos: bases de dades grans amb contingut aportat pels usuaris; iniciatives de xarxes socials que depenen del creixement i manteniment del contingut afegit pels participants, i recursos educatius en línia que es basen en la generació continuada de materials d'aprenentatge pels professors i per altres.

Tot i tenir els autors la seva pròpia definició de la "sostenibilitat" (...la capacitat de generar o obtenir els recursos necessaris –financers, etc.— per protegir i augmentar el valor del contingut o servei digital per als seus usuaris) van detectar entre les agències analitzades la falta de normalització i de coherència en la manera en què s'explica aquest concepte i com es comprova el seu compliment.

Malgrat aquestes mancances, existeix una uniformitat en el reconeixement dels requeriments tècnics com el primer element relacionat amb la sostenibilitat dels productes digitals. Per tant, els formularis de sol·licitud de finançament sovint tenen incrustats (built-in) els factors relacionats amb la sostenibilitat tècnica, com ara el format de les dades, el servidor es mantindran, la possibilitat de migració del material a plataformes i formats futurs i les necessitats d'actualitzacions de programari i maquinari per adequar-se a nous requeriments al llarg del projecte i fins i tot després de la seva finalització.

Per ajudar tant a les agències com als sol·licitants de finançament a calcular els recursos econòmics i institucionals necessaris per a garantir el compliment dels objectius de sostenibilitat dels recursos digitals després de la finalització dels projectes, l'informe ofereix el següent quadre:


Framework for Post-Grant Sustainability Planning for Digital Resources

Les conclusions d'aquest informe són molt generals i no ofereixen pautes concretes. Però altres iniciatives recents ofereixen consells pertinents i pràctics sobre els requeriments tècnics i, per tant, poden servir per facilitar la sostenibilitat dels recursos digitals complexos creats amb diners dedicats al benefici comú. Per exemple, a partir de gener del 2011 la National Science Foundation, una de les principals agències de finançament de la investigació nord-americana, obliga a la inclusió d'un "pla de gestió de dades" juntament amb les sol·licituds. De fet moltes biblioteques universitàries ja ofereixen el servei d'ajudar a l'investigador a omplir aquest nou formulari. (http://dataconservancy.org/)

L'informe no dóna resposta a la qüestió de qui haurà d'assumir la responsabilitat de la preservació de les dades científiques a llarg termini, però és evident que si les agències que financen la recerca es posessin d'acord en la definició de la sostenibilitat i comencessin a obligar la planificació de la gestió de les dades des de l'aprovació dels projectes, donarien un pas important per a la preservació d'aquestes dades per a futures generacions d'investigadors.

Referències
S'inclouen a continuació una selecció d'entitats i iniciatives relacionades amb la gestió i preservació de les dades científiques per als interessats en seguir l'evolució d'aquest tema:

- Alliance for Permanent Access (http://www.alliancepermanentaccess.org/).

- Beagrie, Neil; Lavoie, Brian; Wollard, Matthew (2010). Keeping research data safe-2: final report. (http://www.jisc.ac.uk/media/documents/publications/reports/2010/keepingresearchdatasafe2.pdf).

- Case studies in sustainability (2011). (http://www.ithaka.org/ithaka-s-r/research/case-studies-in-sustainability-2011/case-studies-in-sustainability-2011/).

- Consultation of scientific information in the digital age (2011). (http://ec.europa.eu/research/consultations/scientific_information/questionnaire.pdf).

- Data centres: their use, value and impact (2011).
(http://www.rin.ac.uk/our-work/data-management-and-curation/benefits-research-data-centres).

- Data Seal of Approval (http://www.datasealofapproval.org/).

- Digital Curation Centre. (http://www.dcc.ac.uk/).

- Insight into issues of permanent access to the records of science in Europe (2010). (http://www.parse-insight.eu/downloads/PARSE-Insight_D3-6_InsightReport.pdf).

- Managing and sharing data: best practice for researchers (2011).
(http://www.data-archive.ac.uk/media/2894/managingsharing.pdf).

- Research Data: Unseen Opportunities (2010). (http://www.carl-abrc.ca/about/working_groups/pdf/data_mgt_toolkit.pdf).

 

Nota

1. Angevaare, Inge (2009). "Taking care of digital collections and data: ‘Curation' and organisational choices for research libraries", Liber Quarterly, v.19, no 1, p. 6-7.