Dades de recerca obertes: visió global dels científics i casos a considerar

Versió per a imprimirVersió per a imprimir

Alexandre López i Borrull
Estudis de Ciències de la Informació i de la Comunicació. Director del Grau d'Informació i Documentació. Universitat Oberta de Catalunya (UOC).


The state of open data: a selection of analyses and articles about open data, curated by Figshare (2016). London: Digital Science. 48 p. Disponible a: https://figshare.com/articles/The_State_of_Open_Data_Report/4036398. [Consulta: 03/03/2017].


L’octubre de 2016, Figshare, el conegut repositori de dades, juntament amb Digital Science, una empresa tecnològica, publicaven un dossier monogràfic sobre dades obertes, The state of open data. Com un dels actors principals en el sector de les plataformes multidisciplinàries per dipositar dades en obert, aquest dossier esdevé una bona forma de promoció de les dades obertes, per les reflexions i els punts de vista que hi apareixen però, sobretot, per la presentació de l’enquesta que hi podem trobar. Certament, Figshare no és un grup d’interès neutre, i com més dades en obert millor per a l’empresa, però això no treu el valor del contingut que ofereix en aquest dossier. Anem a veure, doncs, quines parts conté i algunes de les principals reflexions. Avancem també que un dels col·lectius que més es posen en valor és el dels bibliotecaris en particular i els professionals de la informació en general.

Com a pròleg, Nigel Shadbolt apunta amb encert la necessitat de moure’ns entre els incentius i els mandats en aquesta qüestió, cosa que ens porta reminiscències sobre el debat al voltant de l’accés obert a les publicacions científiques i una certa sensació de déjà vu. Per part dels promotors del dossier, Figshare i Digital Science, els seus CEO esmenten en un article plegats la paradoxa que fins i tot els defensors d’obrir i compartir les dades perceben que els qui decideixin no compartir les dades i tenir al seu abast les dels competidors tindran un avantatge (“you will be standing on the shoulders of more giants”, diuen). Així, la ciència continua basculant en un terme mig entre col·laboració i competició. A més a més, per veure els punts crítics per la compartició, valoren que encara ara la publicació en determinades revistes et pot aportar finançament i llocs de treball, mentre que encara ara no es pot esdevenir catedràtic per compartir dades. És interessant, i per això ho recalquem, el fet que tot i ser defensors d’obrir dades valorin les visions crítiques, perquè és així, posteriorment en el seu article, que poden desenvolupar les propostes que ells creuen que permetrien canviar els neguits i pors a compartir les dades. Així, parlen dels aspectes estructurals i culturals que cal tenir en compte per tal de poder canviar les infraestructures. Per exemple, l’evolució de les revistes des d’una visió estàtica, de foto fixa, d’un determinat moment de la recerca, a una visió de la ciència com una narrativa contínua on les dades i anàlisis són afegides creant un corpus de treball amb múltiples contribucions. Finalment, també esmenten tres dels punts crítics on els professionals de la informació tenen més possibilitats de poder aportar: les metadades, la cura de continguts i l’avaluació d’experts.

D’altra banda i en un altre article dins el dossier, Sabina Leonelli fa una reflexió interessant no sobre els motius per a compartir dades i els guanys, que els dóna per sabuts, sinó perquè en fa una lectura de quins són els motius de la promoció de la compartició de les dades, i perquè és rellevant en aquest moment? Així, afirma que hi ha quatre factors d’aquest fet que anirien més enllà de ser una conseqüència lògica de l’avenç tecnològic, atès que té implicacions que sobrepassen la ciència. Aquests factors es poden resumir de la següent forma:

  1. Les dades obertes ofereixen una plataforma comuna per a científics, institucions i finançadors per discutir les dificultats tècniques per a la compartició i reutilització de les dades.
  2. Les dades obertes apunten i generen el debat relatiu a la transparència, legitimitat i retorn de la inversió del finançament de la ciència.
  3. Les dades obertes també formen part dels reptes de la globalització de la ciència i la pèrdua de centralitat tradicional del poder d’Europa i els Estats Units.
  4. Les dades obertes exemplifiquen la inserció de la recerca científica en la lògica i el context del mercat. En definitiva, una visió interessant i més geopolítica sobre les dades obertes.

El gruix del dossier esdevé una enquesta duta a terme el juny del 2016 per Figshare, Digital Science i Springer Nature al voltant de les dades obertes. Més de 2.000 respostes permeten veure una bona aproximació d’usos i motius per compartir o no les dades de recerca. Com a bona mostra i exemple, les dades de la recerca, anonimitzades, es poden trobar en el següent enllaç.

 

 

 

 

 

 

 

 

 

 

 

Les principals conclusions que els autors de l’enquesta presenten són:

  • Per la majoria de respostes, les dades obertes ja són una realitat.
  • Els científics admeten incerteses i desconeixements; necessiten saber més.
  • En el futur, les dades seran més obertes.

Resulta molt interessant repassar les diverses dades i preguntes, sobretot des del punt de vista dels professionals de la informació que han de gestionar aquest àmbit, o bé oferir respostes a les múltiples preguntes que sorgeixen en el procés d’obrir les dades, atès que presenta les principals visions sobre obrir i compartir les dades.

La resta del dossier es completa amb petites peces d’opinió sobre open data en diferents àmbits i entorns geogràfics. Així, Till Bruckner presenta la campanya AllTrials, encarada a assolir que els assajos clínics, tan rellevants en els àmbits biomèdics, siguin el més oberts possible per la rapidesa en l’avenç científic i també per l’afirmació, imbatible, que les dades obertes en la recerca mèdica pot salvar vides. Un altre actor rellevant actualment, el Center for Open Science, promotor de la plataforma Open Science Framework, descriu les cinc passes per promoure i incrementar que més dades de recerca siguin obertes i reproduïbles: estar informat, planificar la gestió de dades, dur a terme bones pràctiques a l’hora de compilar i analitzar dades, compartir i arxivar dades i materials i, finalment, cercar els experts que et poden ajudar. Aquí, novament, el paper de les biblioteques esdevé clau.

Finalment, altres articles descriuen les polítiques de dades de recerca obertes als Estats Units on la majoria de les agències demanen ja plans i polítiques concretes; la situació de les dades obertes a Burkina Faso, on s’expliquen les iniciatives dutes a terme tot i ser un dels països més pobres del món; les polítiques de dades de recerca a Austràlia i el Japó i la necessitat de nous incentius. El dossier, abans de l’apèndix es clou amb una peça de reflexió des de les Humanitats i el context de la recollida de dades en aquest àmbit temàtic.

Com a conclusió, podem dir que es tracta d’un dossier molt sòlid i útil per a:

  • Científics en general amb requeriments i responsabilitats referents als plans de gestions de dades dels seus projectes, atès que hi trobaran base de coneixements, però també documents i actors implicats a qui poden prendre de referència.
  • Biblioteques universitàries i de centres de recerca que necessiten context i arguments per a dos principals aspectes: convèncer els científics de les necessitats de compartir dades i saber com opinen els investigadors al respecte.
  • Professionals de la informació implicats en revistes, repositoris i centres que necessiten dotar-se de polítiques de dades obertes.
  • Professionals de la informació relacionats amb àmbits d’open data en l’àmbit de l’administració pública i la transparència, atès que cal recordar que les dades de recerca són sovint finançats per recursos públics.