dades científiques

Tres eren tres les filles del rei: plantejament, desenvolupament i explotació en dades científiques

Inma Aleixos. Universitat Politècnica de València
Ricardo Albiñana. Universitat Oberta de Catalunya
José Morales.  Universitat Ramon Llull
Fernanda Peset. Universitat Politècnica de València
 

- Erway, Ricky. 2013. Starting the Conversation: University-wide Research Data Management Policy. Dublin, Ohio: OCLC Research. http://www.oclc.org/content/dam/research/publications/library/2013/2013-08.pdf
- LERU Research data Working group / LERU Roadmap for research data // LERU, 2013. Advice paper; 14.
http://www.uzh.ch/research/LERU_Roadmap_for_Research_data.pdf
- Sergey Filippov / Mapping Text and Data Mining In academic and Research Communities in Europe // Lisbon Council 2014; special briefing issue 16. http://www.lisboncouncil.net/publication/publication/109-mapping-text-and-data-mining-in-academic-and-research-communities-in-europe.html

Sembla que seguim amb la tradició de ressenyar en una sola nota tres informes de temàtica comuna (Peset, 2013; Fenoll 2014). Anem doncs per la tercera vegada, completant el 3 amb 3. Tractant de buscar un fil conductor entre els informes d'aquesta nota, podríem llegir-los de la següent manera: començaríem per Erway, seguiríem amb LERU i acabaríem a Filippov. I passarem a exposar perquè ho hem deduït després de la seva lectura: el primer identifica els stakeholders en l'escenari de les dades de recerca i planteja el paper líder que pot assumir la biblioteca; el segon informa exhaustivament sobre què s'ha de gestionar; i finalment, Filippov és una mostra de com l'anàlisi de les dades amb tècniques de mineria posa en valor els datasets, única justificació de l'estesa frase "les dades són el nou petroli de l'economia".

Tres en un, tres informes sobre la gestió de les dades de recerca

Alicia García-García
Universidad Católica de Valencia
 
Fernanda Peset
Universitat Politècnica de València

Grupo de Trabajo de "Depósito y Gestión de datos en Acceso Abierto" del proyecto
RECOLECTA (2012). La conservación y reutilización de los datos científicos en España. Informe del
grupo de trabajo de buenas prácticas
. Madrid: Fundación Española para la Ciencia y
la Tecnología, FECYT. <http://www.recolecta.net/buscador/documentos/informe_datos_cientificos_en_esp.pdf>. [Consulta: 4 agost 2013].
 
The Royal Society (2012). Science as an open enterprise: open data for open science. London: The Royal Society. <http://royalsociety.org/uploadedFiles/Royal_Society_Content/policy/projects/sape/2012-06-20-SAOE.pdf>. [Consulta: 4 agost 2013].
 
Tenopir, Carol; Birch, Ben; Allard, Suzie (2012). Academic Libraries and Research Data Services: Current Practices and Plans for the Future. Chicago: Association of College and Research Libraries. <http://www.ala.org/acrl/sites/ala.org.acrl/files/content/publications/whitepapers/Tenopir_Birch_Allard.pdf>. [Consulta: 4 agost 2013].

El fil conductor d'aquests informes és la gestió de les dades derivades de la recerca. Tres treballs recopilatoris, fets des de tres escenaris diferents. Com començava un clàssic acudit, "Va un anglès, un espanyol i un nord-americà...", que abordant un mateix objecte d'estudi, les dades de recerca, són en essència diferents entre si.

Els tres s'aproximen al tema des d'una perspectiva d'escala nacional. Però les dades de recerca, igual que molts altres aspectes de la comunicació científica, tenen una dimensió internacional ineludible. Per aquesta raó, s'observen punts comuns en els tres documents. Com a exemple, veiem que la definició de dades de recerca utilitzada en l'espanyol prové de la Universitat de Melbourne:

Les dades de la investigació són fets, observacions o experiències en què es basa l'argument, la teoria o la prova. Les dades poden ser numèriques, descriptives o visuals. Les dades poden ser en estat brut o analitzat, poden ser experimentals o observacionals. Les dades inclouen: quaderns de laboratori, quaderns de camp, dades de recerca primària (incloses les dades en paper o en suport informàtic), qüestionaris, cintes d'àudio, vídeos, desenvolupament de models, fotografies, pel·lícules, i les comprovacions i les respostes de la prova. Les col·leccions dades per a la investigació poden incloure diapositives; dissenys i mostres. En la informació sobre la procedència de les dades també es podria incloure: el com, quan, on es va recollir i amb què (per exemple, instruments). El codi de programari utilitzat per generar, comentar o analitzar les dades també poden ser considerats dades.

Una plenamar de dades

Remedios Melero
Científica titular del CSIC
Membre del grup Accés Obert a la Ciència (www.accesoabierto.net)
 

 Riding the wave: how Europe can gain from the rising tide of scientific data. Final report of the High Level Expert Group on Scientific Data: a submission to the European Commission. October 2010. (http://ec.europa.eu/information_society/newsroom/cf/itemlongdetail.cfm?item_id=6204).

El títol d'aquest informe ja és per si mateix suggerent "Pujar a la carena de la onada: com Europa pot beneficiar-se de la creixent marea de dades científiques". El document és el resultat de les reunions i de les conclusions a què van arribar un grup d'experts procendents de diverses universitats i institucions de recerca als quals la Comissió Europea els va encarregar un informe sobre la visió futura dels beneficis i del cost de la posada en marxa d'una e-infraestructura global de dades. Aquesta hauria de permetre als investigadors de diferents àrees de coneixement i llocs, compartir dades i treballar amb elles. L'aproximació permetria generar noves correlacions, idees i informació a un nivell que encara estem lluny d'albirar.


Davant el repte posat al grup de treball de donar respostes mirant cap al futur, més concretament a l'any 2030, el primer que van fer els seus membres va ser plantejar-se algunes preguntes per poder perfilar les accions a prendre:

Subscriure a RSS - dades científiques