El paper de les dades de recerca en les Arts i les Humanitats

Versió per a imprimirVersió per a imprimir

Mireia Alcalá
Tècnica de Recursos d'Informació
Àrea de Biblioteques, Informació i Documentació - CBUC
Consorci de Serveis Universitaris de Catalunya (CSUC)


Buddenbohm, Stefan; Cretin, Nathanael; Dijk, Elly; Gaiffe, Bertrand; Jong, Maaike de; Le Tellier-Becquart, Nathalie; Minel, Jean-Luc (2016). State of the art report on open access publishing of research data in the humanities. [S.l.]: DARIAH. <halshs-01357208v2>. [Consulta: 14/10/16]


En els últims anys, la publicació en obert de les dades de recerca ha anat en augment a la vegada que els organismes de finançament anaven requerint les dades resultants de la recerca, no només les publicacions. Aquest era, doncs, un dels objectius d’Horitzó 2020 de la Comissió Europea i, particularment, de l’Open Research Data Pilot (ORD Pilot). Algunes àrees de coneixement ja gaudien d’una llarga experiència en l’intercanvi i la reutilització de dades però en d’altres disciplines, com és el cas de les arts i les humanitats, això no era així.

El projecte Humanities at Scale (HaS), finançat per Horitzó 2020, forma part de Digital Research Infraestructure for the Arts and Humanities (DARIAH) i té com objectiu desenvolupar una plataforma de dades obertes en el camp de les humanitats. Recentment, HaS ha publicat en un dels seus lliurables un informe sobre els diferents aspectes relacionats amb la publicació en accés obert de les dades de recerca en el camp de les humanitats anomenat State of the art report on open access publishing of research data in the humanities.

L’informe es divideix en nou apartats i s’inicia amb una introducció als diferents conceptes com dades de recerca o dades obertes en el capítol 1. En el segon, es descriu el cicle de vida de les dades destacant-ne la importància de millorar-ne l’accés en cadascuna de les fases d’aquest cicle. És en aquest moment on el Pla de Gestió de Dades (Data Management Plan) juga un paper essencial; ja que descriu, des de l’inici del projecte, tota la informació referent a les dades i les seves metadades (creació, compartició, emmagatzematge o preservació, entre d’altres).

El tercer punt desenvolupa els diferents agents interessats. Principalment, són els mateixos investigadors i els centres de recerca els majors productors i consumidors de dades. També les institucions de la memòria (arxius, museus i biblioteques) amb competències de conservació, preservació i difusió del patrimoni. Els repositoris que proporcionen identificadors persistents i metadades descriptives que faran aquestes dades més localitzables i utilitzables a llarg termini. D’altres beneficiaris són els organismes de finançament que veuen com es promou i es difon la seva inversió. També sobresurten els editors, ja que gran part d’aquestes dades es vinculen a treballs publicats. I, finalment, el públic en general, no només com a consumidor sinó, cada vegada més, com a productor a través de la participació en la ciència ciutadana (citizen science).

Els avantatges de l’intercanvi de dades són clars i es descriuen en el capítol 4: permet la reutilització de les dades, comparant o validant els resultats d’investigacions anteriors; promou la cooperació entre projectes tant en l’àmbit nacional, com internacional; augmenta el rendiment de les inversions i fomenta la integritat acadèmica ja que els resultats poden ser verificats. Per contra, d’entre els molts inconvenients, sobresurt: una gran manca de voluntat dels investigadors per compartir les seves dades, la falta de fons tant per l’intercanvi de dades com per la seva preservació a llarg termini o que no es rep suficient finançament o d’altres recompenses per produir i compartir dades de recerca.

El capítol 5 mostra una panoràmica de la infraestructura per a les dades de recerca des dels inicis dels repositoris de dades en ciències socials a la dècada dels anys seixanta del segle XX fins a l’explosió de multitud de repositoris de dades multidisciplinars (Zenodo, Figshare, Mendeley Data, Dryad, Dataverse o EUDAT) en la darrera dècada. Respecte dels repositoris multidisciplinars, es proporciona una taula comparativa a l’annex 1 que en permet veure les principals diferències entre ells. L’informe afirma que algunes universitats han començat a implementar aquest tipus de repositoris, relacionant-los amb el que ja tenien de publicacions, fet que es corrobora amb els resultats publicats pel LIBER1 on només un 39 % de les universitats europees proporcionen emmagatzematge.

En relació amb la infraestructura, el capítol 6 tracta les normes de certificació dels repositoris digitals, ja que les diferents certificacions existents (Data Seal of Aproval, Nestor Seal i ISO 16363) proporcionen un aspecte clau entre els dipòsits i els seus grups d’interès: la confiança.

El capítol 7 se centra en la publicació en obert de les dades de recerca, incloent la citació de les dades i la relació amb les dades primàries. Es destaquen diferents iniciatives que permeten identificar unívocament les dades de recerca a diferents repositoris multidisciplinars i localitzar, identificar i citar les dades (Datacite).

El punt 8 repassa les diferents possibilitats de metadades. DARIAH distingeix entre: metadades d’arxiu (ISAD-G), de codificació (amb TEI) i bibliogràfiques (Dublin Core i l’FRBR) però existeixen d’altres iniciatives com: CIDOC, FOAF, SKOS o OAI-ORE. L’informe no es posiciona sobre quin serà el futur estàndard per a les dades de recerca.

Finalment, el darrer capítol repassa les diferents infraestructures franceses explicant les diferents eines creades pel projecte HaS DARIAH: Nakala (facilita l’accés i comparteix dades i metadades amb tecnologies interoperables), Cocoon (especialitzat en corpus orals) i Isidore (eina que enriqueix les dades amb tesaurus i facetes per facilitar la visibilitat de les dades). Aquesta informació s’amplia a l’annex 2.

Com a conclusió, cal afirmar que aquest informe fa una exhaustiva panoràmica dels diferents elements que tenen relació amb les dades de recerca (beneficis i inconvenients, agents implicats, emmagatzematge, metadades…) en l’àmbit europeu. Tot i així, seria interessant que aquestes informacions s’ampliessin amb d’altres bones pràctiques dutes a terme no només a l’Estat francès sinó a la resta d’Europa.


1 http://libereurope.eu/blog/2016/10/13/research-data-services-europes-aca...