Què és això de l'e-ciència? Què podem [o hem] d'aportar els professionals de la informació i les biblioteques?

Versió per a imprimirVersió per a imprimir
Jordi Serrano
Universitat Politècnica de Catalunya
Servei de Biblioteques i Documentació
 
L'e [nhanced]-Ciència, segons el "Llibre blanc e-CIÈNCIA a Espanya 2004" [1], s'entén com el conjunt d'activitats científiques desenvolupades mitjançant l'ús de recursos distribuïts accessibles a través d'Internet, com càlcul, emmagatzematge i informació entre d'altres, i en paral·lel a l'evolució de les xarxes de comunicacions dedicades a la investigació, així com d'aplicacions de treball col·laboratiu.

L'associació que agrupa les biblioteques de recerca d'EUA i Canadà (ARL: Association of Research Libraries) va publicar el passat mes d'agost, els resultats d'una enquesta i un estudi [2] entre els seus membres on recullen de quina manera les biblioteques contribueixen (o van contribuir) en els processos de l'e-ciència.

A banda dels resultats, consultables en el document i en el seu resum executiu, cal destacar que no existeix un model únic de com gestionar l'e-ciència a les universitats i/o centres de recerca i respecte el rol de les biblioteques en la seva contribució a l'e-ciència tampoc és homogeni: en alguns casos es disposa de personal altament especialitzat, en altres, es creen unitats específicament per al suport a l'e-ciència i en un percentatge elevat, bàsicament tasques referència.

El que es dedueix de l'estudi, és que gràcies a la tecnologia i naturalment a la inversió, ens trobem davant d'un increment de l'activitat científica que augmenta exponencialment, el que implica una major complexitat en l'anàlisi, la interpretació i la gestió de les dades que genera aquesta activitat.

Al mateix temps, gràcies a Internet i a les xarxes acadèmiques, la col·laboració en l'àmbit nacional i internacional entre centres de recerca i/o universitats és una realitat i per extensió es generen un ingent volum de recursos i d'informació distribuïts i compartits entre els diferents grups de recerca que requereixen una gestió, un tractament, facilitat de recuperació i naturalment la seva preservació.

També s'evidencia una gran transversalitat: ja no estem en un model de recerca personal/departamental on amb un equipament específic, suport tecnològic, suport bibliogràfic i poc més, ja s'avançava en la investigació. El model d'e-ciència transforma completament aquesta dinàmica de treball. El nombre d'actors cada vegada és més complex: els propis investigadors, la seva xarxa de col·laboració, gestors, vicerectorats de recerca, estadístics, empresa privada, centres de transferència de tecnologia, sistemes d'informació (informàtics), etc... i naturalment, les biblioteques i centres de documentació.

Tradicionalment, l'activitat dels professionals de la informació respecte al suport a la recerca, ha girat bàsicament en el subministrament d'informació bibliogràfica, legislació, convocatòries,... i al que Ricard de la Vega del CESCA anomena la gestió i preservació de les "dades processades i publicades": el que entenem com articles, preprints, tesis, etc... Més recentment, també ens hem implicat en la difusió i visibilitat d'aquests "dades processades" i en els temes d'accés obert a aquesta informació. I davant aquest nou model de recerca, haurem de complementar aquestes tasques tradicionals amb noves funcions com:

● Integració de manera activa en aquestes estructures interdisciplinàries i que en molts casos van més enllà de la nostra pròpia organització.
● Una major especialització en les àrees de recerca.
● Tractament d'aquesta nova informació que apareix fragmentada i "no processada".

Respecte d'aquesta informació "no processada", no enfrontem al repte d'una informació que prolifera i s'expandeix de manera aceleradada i descontrolada. Amb unes dades canviants, agregades, interrelacionades, complexes,... A més, disponibles en formats possiblement "estranys" o no habituals per a nosaltres: conjunts de dades (datasets), simulacions, aplicacions, etc... que també requereixen un procés d'identificació (metadades, descripcions,...), emmagatzematge, difusió i preservació.

 
D'una manera interdisciplinar, hauríem contribuir a desenvolupar estratègies per superar la fragmentació d'aquesta informació i facilitar a aquestes comunitats investigadores una millor gestió, aplicació, compartició i preservació de les dades i tal com va comentar Alicia López de la UNED que siguin fàcilment accessibles per mitjà de plataformes de coneixements compartides a través de les xarxes i de fàcil utilització.
 
A nivell de l'Estat espanyol, disposem de la "Xarxa Nacional d'e-Ciència" (http://www.e-ciencia.es/) l'objectiu és "coordinar i impulsar el desenvolupament de l'activitat científica a Espanya mitjançant l'ús col·laboratiu de recursos geogràficament distribuïts i interconnectats mitjançant Internet" i "crear una Iniciativa de Grid Nacional [computació distribuïda, sense control centralitzat], impulsar l'adopció de la Supercomputació i el Grid en la comunitat investigadora espanyola, amb l'objectiu de millorar la seva productivitat científica, i gestionar el coneixement per fomentar les sinergies i evitar duplicitats".
 
En l'àmbit de les biblioteques, des de REBIUN, la Xarxa de Biblioteques Universitàries Espanyoles, dins de la línia 2 del seu Pla Estratègic (àmbit de la recerca), va presentar una proposta a la xarxa espanyola de "e-ciència" per a la creació de un projecte pilot d'infraestructura de dipòsits digitals per donar suport als processos de la ciència en xarxa.
 
Aquest acord es va formalitzar en el segon semestre del 2009, amb la incorporació d'un membre d'aquesta línia estratègica en el grup de treball de "Repositoris de dades a la Xarxa Espanyola d'e-Ciència" que recomana la creació d'una cinquena àrea de treball en el marc de la Xarxa Espanyola d'e-Ciència que inclogui a més a desenvolupadors i gestors dels dipòsits com a eines necessàries per a l'e-ciència. L'objectiu d'aquesta àrea seria connectar les dades i els processos, atendre les prioritats dels grups espanyols, generar accions col·laboratives i tenir en compte la interoperabilitat i genericitat de les solucions i la internacionalitat de les actuacions entre altres accions.
 
Mentre el grup de treball va desenvolupant les seves propostes, per part de les biblioteques espanyoles ja existeixen algunes iniciatives. Un exemple i una línia a seguir tal com m'indica Pau de Castro (UC3M), es pot comprovar a Digital CSIC: on el Grup de recerca "Erosió i avaluació de sòl i aigua", http://www.eead.csic.es/index.php?id=113, publica els seus datasets, els autors participen en la descripció d'aquests continguts i on disposen de plena col·laboració per part de l'equip gestor del dipòsit http://digital.csic.es/handle/10261/23139.
 
En qualsevol cas, se'ns obre un nou front que hem d'afrontar i al qual hem d'adaptar-nos. Serà necessari integrar-nos en aquestes infraestructures de suport als processos científics de l'e-ciència i continuar sent els gestors de la informació a les nostres organitzacions. Òbviament, això exigeix nous plantejaments en les nostres organitzacions, en la tecnologia, en els continguts i en els serveis, entre altres aspectes. Lamentablement, no realitzar aquesta transformació suposaria que siguin altres els que assumeixin funcions que tradicionalment ens han correspost als professionals de la informació.
 
Naturalment, per veure per on van els "trets", recomanable la lectura d'aquest informe de la ARL: Association of Research Libraries respecte a l'e-ciència, especialment els sis estudis de cas.
 
[1] Grupo de Trabajo e-Ciencia. Libro blanco e-CIENCIA en España 2004. Madrid: FECYT, 2005
http://www.ratri.es/Subidas/DescargasPublicas/e-Ciencia%20en%20Espana%20... [Consulta 05/10/2010]

[2]  Soehner, Catherine; Steeves, Catherine; Ward, Jennifer. E-Science and Data Support Services. A Study of ARL Member Institutions. August 2010. Washington : ARL: 2010  http://www.arl.org/bm~doc/escience_report2010.pdf [Consulta 05/10/2010]

Comentaris

A propòsit d’aquest tema, el passat agost Christine Borgman va publicar un article que ajuda a completar la lectura del informe de l’ARL. Borgman distingeix 4 tipus de dades: observacions (dades meteorològiques o respostes a qüestionaris), dades computacionals (resultats d’executar un model o simulació informàtica), experimentals (resultats de treballs de laboratori) i registres (el que habitualment anomenem documents d’arxiu).

Borgman incideix en les dificultats que experimenten les biblioteques i centres de documentació per a la gestió d’aquest tipus de dades en comparació amb els materials bibliogràfics tradicionals. També analitza els diversos propòsits i mètodes de la recerca basada en dades recollides prèviament per altres investigadors i els arguments per incentivar els científics a compartir les seves dades amb la resta de la comunitat investigadora (arguments polítics basats en compartir els resultats de la recerca finançada amb fons púbics, permetre a altres investigadors realitzar noves anàlisis, facilitar la reproducibilitat dels estudis, etc.).

En definitiva, totes aquestes distincions porten a l’autora a concloure que no hi pot haver una única aproximació a la gestió d’aquest tipus de dades. El text complet de l’article està disponible a http://works.bepress.com/borgman/238/

A propòsit d’aquest tema, el passat agost Christine Borgman va publicar un article que ajuda a completar la lectura del informe de l’ARL. Borgman distingeix 4 tipus de dades: observacions (dades meteorològiques o respostes a qüestionaris), dades computacionals (resultats d’executar un model o simulació informàtica), experimentals (resultats de treballs de laboratori) i registres (el que habitualment anomenem documents d’arxiu).

Borgman incideix en les dificultats que experimenten les biblioteques i centres de documentació per a la gestió d’aquest tipus de dades en comparació amb els materials bibliogràfics tradicionals. També analitza els diversos propòsits i mètodes de la recerca basada en dades recollides prèviament per altres investigadors i els arguments per incentivar els científics a compartir les seves dades amb la resta de la comunitat investigadora (arguments polítics basats en compartir els resultats de la recerca finançada amb fons púbics, permetre a altres investigadors realitzar noves anàlisis, facilitar la reproducibilitat dels estudis, etc.).

En definitiva, totes aquestes distincions porten a l’autora a concloure que no hi pot haver una única aproximació a la gestió d’aquest tipus de dades. El text complet de l’article està disponible a http://works.bepress.com/borgman/238/