Tres en un, tres informes sobre la gestió de les dades de recerca

Versión para impresiónVersión para impresión
Alicia García-García
Universidad Católica de Valencia
 
Fernanda Peset
Universitat Politècnica de València

Grupo de Trabajo de "Depósito y Gestión de datos en Acceso Abierto" del proyecto
RECOLECTA (2012). La conservación y reutilización de los datos científicos en España. Informe del
grupo de trabajo de buenas prácticas
. Madrid: Fundación Española para la Ciencia y
la Tecnología, FECYT. <http://www.recolecta.net/buscador/documentos/informe_datos_cientificos_en_esp.pdf>. [Consulta: 4 agost 2013].
 
The Royal Society (2012). Science as an open enterprise: open data for open science. London: The Royal Society. <http://royalsociety.org/uploadedFiles/Royal_Society_Content/policy/projects/sape/2012-06-20-SAOE.pdf>. [Consulta: 4 agost 2013].
 
Tenopir, Carol; Birch, Ben; Allard, Suzie (2012). Academic Libraries and Research Data Services: Current Practices and Plans for the Future. Chicago: Association of College and Research Libraries. <http://www.ala.org/acrl/sites/ala.org.acrl/files/content/publications/whitepapers/Tenopir_Birch_Allard.pdf>. [Consulta: 4 agost 2013].

El fil conductor d'aquests informes és la gestió de les dades derivades de la recerca. Tres treballs recopilatoris, fets des de tres escenaris diferents. Com començava un clàssic acudit, "Va un anglès, un espanyol i un nord-americà...", que abordant un mateix objecte d'estudi, les dades de recerca, són en essència diferents entre si.

Els tres s'aproximen al tema des d'una perspectiva d'escala nacional. Però les dades de recerca, igual que molts altres aspectes de la comunicació científica, tenen una dimensió internacional ineludible. Per aquesta raó, s'observen punts comuns en els tres documents. Com a exemple, veiem que la definició de dades de recerca utilitzada en l'espanyol prové de la Universitat de Melbourne:

Les dades de la investigació són fets, observacions o experiències en què es basa l'argument, la teoria o la prova. Les dades poden ser numèriques, descriptives o visuals. Les dades poden ser en estat brut o analitzat, poden ser experimentals o observacionals. Les dades inclouen: quaderns de laboratori, quaderns de camp, dades de recerca primària (incloses les dades en paper o en suport informàtic), qüestionaris, cintes d'àudio, vídeos, desenvolupament de models, fotografies, pel·lícules, i les comprovacions i les respostes de la prova. Les col·leccions dades per a la investigació poden incloure diapositives; dissenys i mostres. En la informació sobre la procedència de les dades també es podria incloure: el com, quan, on es va recollir i amb què (per exemple, instruments). El codi de programari utilitzat per generar, comentar o analitzar les dades també poden ser considerats dades.

 

Tots comparteixen la consciència que la gestió de dades de recerca, i encara més la seva disposició en obert, és força complexa a diferència de la gestió de les publicacions científiques. Posen de manifest els reptes de la preservació de les dades d'investigació a llarg termini, la descripció coherent i les restriccions d'intercanvi i reutilització.

Però hi ha grans diferències entre els tres. Pel context en que sorgeixen, els objectius que es proposen, l'estructura o els resultats apreciem la naturalesa polièdrica del problema que aborden. Són aquestes diferències les que donen compte de la complexitat del problema de la gestió de dades científiques, que reuneix al seu voltant molt diversos actors de l'escenari de la ciència amb connotacions de tota índole: socials, polítiques o tècniques.

Com un comparador de productes -com els telèfons mòbils- aquesta ressenya descriu cadascun dels informes caracteritzant-lo segons la seva justificació i situació de partida, els seus objectius, la seva metodologia, estructura i resultats.

L'informe publicat per FECYT declara ser un primer pas, un informe preliminar que aporta un estat de la qüestió de les dades a escala internacional i a nivell nacional. Té per objectiu detallar la situació per tal de preparar-se des d'un punt de vista tècnic per als reptes derivats de la implantació de la Llei de la ciència de 2011. Parteix del grup de Depósito y gestión de datos en abierto de Recolecta al 2012, des de la Jornada tècnica GrandIR del maig de 2012, "Avances en la gestión de datos de investigación en España", i inclou també a altres experts. Així, és un informe els promotors del qual són gestors dels resultats científics, és a dir els mediadors entre la producció i l'usuari, preocupats per l'estandardització i per la preservació a llarg termini. Podríem dir que té un tall bibliotecari i promou la via basada en els dipòsits d'accés obert.

L'informe de la Royal Society té una orientació més filosòfica, a més de que és un treball molt ambiciós que va començar el 2011. Ja en el seu mateix subtítol, open data for open science, posa les bases per a la nova cultura científica basada en les evidències que aporten les dades. El seu objectiu és analitzar l'impacte de les tecnologies en la comunicació científica i produir recomanacions per respondre èticament davant la societat, la que en definitiva finança els recursos necessaris per investigar. En aquest cas, el punt de partida és una societat científica, un centre en concret -The Royal Society Science Policy Centre-, de manera que les seves opinions parteixen dels mateixos acadèmics, que produeixen les dades, dirigeixen societats científiques i editen les revistes acadèmiques.

El tercer informe, Academic Libraries and Research Data Services Current Practices and Plans for the Future, té com a objectiu analitzar la situació actual a la qual científics i institucions s'enfronten, doncs detecta la necessitat i oportunitat de gestionar les dades, buit encara no cobert en les biblioteques. Està avalat des de 2011 per l'Association of College and Research Libraries, pertanyent a l'ALA, com a part del finançament de la National Science Foundation al projecte DataOne. No obstant això, té un biaix acadèmic ja que la seva primera signant, Carol Tenopir, procedeix del món universitari i és ben coneguda per les seves publicacions de recerca sobre gestió de dades. Tot i això, pel mètode emprat -enquesta a biblioteques- ofereix uns resultats molt propers al sector de la gestió de la informació.

Quant a la metodologia els tres són bastant semblants. L'informe espanyol efectua un repàs bibliogràfic, així com una exhaustiva instantània de les iniciatives de l'estat espanyol (articles, comunicacions, cursos, projectes...) i inclou l'estudi d'un cas. El britànic té la mateixa metodologia al llarg del text. Però també recull en els seus apèndixs altres aspectes derivats de la investigació, ja siguin casos d'estudi o resultats d'enquestes. El tercer informe de l'ACRL, després de la revisió bibliogràfica, basa els seus resultats en una enquesta a una mostra representativa de membres de les biblioteques acadèmiques de l'Associació.

L'informe del grup Recolecta s'estructura en dos grans apartats, el primer de revisió general i el segon l'estat de la qüestió a Espanya incloent un estudi de cas, ODiSEA. Es culmina amb bones pràctiques en general, així com dels casos d'estudi espanyols. L'informe britànic s'estructura en cinc grans capítols i quatre apèndixs, que formen aproximadament la quarta part de l'informe. El primer descriu els casos d'estudi que han estat abreujats durant el text principal, el segon detalla aspectes tècnics, i el tercer ofereix els resultats d'una enquesta de 2012 sobre costos i capacitats d'alguns dipòsits. El tercer informe, de l'ACRL, ofereix l'estat de la qüestió, metodologia emprada i principals resultats per poder redactar el capítol de recomanacions i conclusions. El seu únic apèndix recull els ítems de l'enquesta.

Pel que fa als resultats principals que ofereixen, l'informe de Recolecta estableix els aspectes més importants per implementar una política de gestió de dades i resumeix les recomanacions clau per a un pla genèric. Per la seva banda el de la Royal Society es retrotreu als inicis de la comunicació científica, amb l'aparició de les primeres revistes per projectar-se cap al futur indicant les tendències en gairebé tots els aspectes relacionats amb la comunicació de la ciència. Entre elles indica l'interès en els resultats científics de sectors socials aliens a la investigació, o també apunta al quart paradigma en la ciència, que no consisteix a seguir fent ciència de forma tradicional, sinó fer-la per canviar cada disciplina. Cal esmentar que estableix recomanacions en funció dels interessos dels agents involucrats i efectua una classificació de les iniciatives actuals tal com mostra el gràfic en funció del seu valor i freqüència (recursos internacionals, centres nacionals de dades, repositoris institucionals, col·leccions individuals):

Finalment l'informe de l'ACRL ha produït una imatge de la situació en que es troben les biblioteques acadèmiques nord-americanes. La seva principal aportació és el detall de les accions que poden emprendre els directors de les biblioteques de cara a la gestió de les dades. Les dues taules següents resumeixen els resultats pel que fa als serveis d'assessoria i el suport tècnic de les biblioteques, dividides per grandària de població estudiantil:

Pel que fa a les conclusions, un cop vistes les diferències entre un i altre, haurem de convenir que són similars en el fons. Però la seva utilitat variarà per a cada lector segons quin sigui el paper que assumeix respecte a les dades. Atès que la comunitat d'interès en les ressenyes de Blok de BiD solen ser gestors d'informació, ens centrarem en detallar les conclusions que siguin d'interès per a aquesta comunitat.

En primer terme, pel que fa a la pròpia gestió de dades, l'informe de Recolecta indica que han d'existir polítiques explícites, recursos materials i humans i, especialment, ha de produir-se un canvi cultural. Les sol·licituds de finançament haurien d'incloure un pla de gestió de dades que contempli l'organització, la preservació i el marc legal de les dades en el moment de produir-les, cosa que es demanda fa ja temps en el cas nord-americà. D'aquesta manera es facilitaria la tasca posterior dels gestors d'informació.

Entre les conclusions de l'informe de la Royal Society destaquem només la dirigida als organismes d'investigació, la resta s'orienta als mateixos científics, les agències de finançament, editors, societats i acadèmies científiques i governs. En primer lloc aconsellen que es reconegui en la carrera professional el treball d'alliberar les dades, i en segon lloc que es desenvolupin estratègies sobre la conservació del seu propi coneixement en el cas que tingui valor realitzar alguna inversió sobre ell. Detalla algunes accions que poden ser assumides per les biblioteques. A saber, "Provide education and training in the principles and practice of the management of scientific datasets [...] Develop and publish a register of data assets that specifies the estimated timetable for data release for funded but as yet unfinished projects", per exemple.

Finalment, les conclusions de l'informe de ACRL destaquen la manca de processos formals i normalitzats per a la gestió i l'intercanvi de les dades, la manca de capacitació dels professionals per adoptar un paper formador i d'assessorament cap als investigadors, i les insuficients o inexistents eines per a la preservació de les dades, el que es deriva principalment d'una falta de finançament. Destaca la idoneïtat de les biblioteques acadèmiques per proporcionar RDS (Serveis de Dades d'Investigació), ja que gestionen el cicle de vida complet de les dades i desenvolupen polítiques i infraestructures per preservar les dades. Encara que en aquests moments poques biblioteques ofereixen aquests serveis, la majoria tenen previst començar a dos anys, generalment reassignant aquestes tasques a personal existent o fins i tot aconseguint personal argumentant la implantació d'aquests nous serveis. Actualment la formació l'obtenen en reunions, però és desitjable major suport institucional per exemple mitjançant estades en altres centres i també recolzant-se en projectes com Dataone de la NSF que proporciona eines i capacitació.

En termes generals tots coincideixen que "Les dades de recerca estan començant a reconèixer-se com una font de coneixement pròpia i independent de les publicacions que poden emprar-se en la validació dels resultats de recerca publicats en articles, per generar nou coneixement i ser explotats de manera interdisciplinària." L'informe de la Royal Society ressenya que "it is timely to accelerate and coordinate change, but in ways that are adapted to the diversity of the scientific enterprise and the interests of: scientists, their institutions, those that fund, publish and use their work and the public." Finalment, l'informe de l'ACRL adverteix que si la biblioteca no s'involucra activament en la prestació d'aquests serveis, és molt probable que sigui un altre departament el que els proporcioni, apartant a la biblioteca de la seva tasca en el procés d'investigació, i per tant perdrien una oportunitat per donar servei a un rang més ampli d'agents socials interessats en la gestió de les dades.