- acceso abierto [3]
- datos de investigación [4]
Mireia Alcalá
Técnica de Recursos de Información
Àrea de Biblioteques, Informació i Documentació - CBUC
Consorci de Serveis Universitaris de Catalunya (CSUC)
Buddenbohm, Stefan; Cretin, Nathanael; Dijk, Elly; Gaiffe, Bertrand; Jong, Maaike de; Le Tellier-Becquart, Nathalie; Minel, Jean-Luc (2016). State of the art report on open access publishing of research data in the humanities. [S.l.]: DARIAH. <halshs-01357208v2>. [Consulta: 14/10/16]
En los últimos años, la publicación en abierto de los datos de investigación ha ido en aumento a la vez que los organismos de financiación iban requiriendo los datos resultantes de la investigación, no sólo las publicaciones. Este era, pues, uno de los objetivos de Horizonte 2020 [5] de la Comisión Europea y, particularmente, del Open Research Data Pilot [6] (ORD Pilot). Algunas áreas de conocimiento ya gozaban de una larga experiencia en el intercambio y la reutilización de datos pero en otras disciplinas, como es el caso de las artes i las humanidades, eso no era así.
El proyecto Humanities at Scale (HaS) [7], financiado por Horizonte 2020, forma parte de Digital Research Infraestructure for the Arts and Humanities (DARIAH) y tiene por objetivo desarrollar una plataforma de datos abiertos en el campo de las humanidades. Recientemente, HaS ha publicado en uno de sus entregables un informe sobre los diferentes aspectos relacionados con la publicación en acceso abierto de los datos de investigación en el campo de las humanidades llamado State of the art report on open access publishing of research data in the humanities [8].
El informe se divide en nueve apartados y se inicia con una introducción a los diferentes conceptos como datos de investigación o datos abiertos en el capítulo 1. En el segundo, se describe el ciclo de vida de los datos destacando la importancia de mejorar su acceso en cada una de las fases de este ciclo. Es en este momento donde el Plan de Gestión de Datos (Data Management Plan) juega un papel esencial; dado que describe, desde el inicio del proyecto, toda la información referente a los datos y sus metadatos (creación, compartición, almacenamiento o preservación, entre otros).
El tercer punto desarrolla los diferentes agentes interesados. Principalmente, son los propios investigadores y los centros de investigación los mayores productores y consumidores de datos. También las instituciones de la memoria (archivos, museos y bibliotecas) con competencias de conservación, preservación y difusión del patrimonio. Los repositorios que proporcionan identificadores persistentes y metadatos descriptivos que harán estos datos más localizables y utilizables a largo plazo. Otros beneficiarios son los organismos de financiación que ven cómo se promueve y se difunde su inversión. También destacan los editores, ya que gran parte de estos datos se vinculan a trabajos publicados. Y, finalmente, el público en general, no sólo como consumidor sino, cada vez más, como productor a través de la participación en la ciencia ciudadana (citizen science).
Las ventajas del intercambio de datos son claras y se describen en el capítulo 4: permite la reutilización de los datos, comparando o validando los resultados de investigaciones anteriores; promueve la cooperación entre proyectos tanto a nivel nacional, como internacional; aumenta el rendimiento de las inversiones y fomenta la integridad académica ya que los resultados pueden ser verificados. Por contra, de entre los muchos inconvenientes, sobresale: una gran falta de voluntad de los investigadores para compartir sus datos, la falta de fondos tanto por el intercambio de datos como por su preservación a largo plazo o que no se recibe suficiente financiación u otras recompensas para producir y compartir datos de investigación.
El capítulo 5 muestra una panorámica de la infraestructura para los datos de investigación desde los inicios de los repositorios de datos en ciencias sociales en la década de los años sesenta del siglo XX hasta la explosión de multitud de repositorios de datos multidisciplinares (Zenodo [9], Figshare [10], Mendeley Data [11], Dryad [12], Dataverse [13]o EUDAT [14]) en la última década. Respecto a los repositorios multidisciplinares, se proporciona una tabla comparativa en el anexo 1 [15] que permite ver las principales diferencias entre ellos. El informe afirma que algunas universidades han empezado a implementar este tipo de repositorios, relacionándolos con el que ya tenían de publicaciones, hecho que se corrobora con los resultados publicados por el LIBER1 donde sólo un 39 % de las universidades europeas proporcionan almacenamiento.
En relación con la infraestructura, el capítulo 6 trata las normas de certificación de los repositorios digitales, dado que las diferentes certificaciones existentes (Data Seal of Aproval [16], Nestor Seal [17] y ISO 16363 [18]) proporcionan un aspecto clave entre los depósitos y sus grupos de interés: la confianza.
El capítulo 7 se centra en la publicación en abierto de los datos de investigación, incluyendo la citación de los datos y la relación con los datos primarios. Se destacan diferentes iniciativas que permiten identificar unívocamente los datos de investigación en diferentes repositorios multidisciplinares y localizar, identificar y citar los datos (Datacite [19]).
El punto 8 repasa las diferentes posibilidades de metadatos. DARIAH distingue entre: metadatos de archivo (ISAD-G [20]), de codificación (con TEI [21]) y bibliográficos (Dublin Core [22] y el FRBR [23]) pero existen otras iniciativas como: CIDOC [24], FOAF [25], SKOS [26]u OAI-ORE [27]. El informe no se posiciona sobre cuál será el futuro estándar para los datos de investigación.
Finalmente, el último capítulo repasa las diferentes infraestructuras francesas explicando las diferentes herramientas creadas por el proyecto HaS DARIAH: Nakala [28](facilita el acceso y comparte datos y metadatos con tecnologías interoperables), Cocoon [29](especializado en corpus orales) e Isidore [30](herramienta que enriquece los datos con tesauros y facetas para facilitar la visibilidad de los datos). Esta información se amplía en el anexo 2 [31].
En conclusión, es preciso afirmar que este informe hace una exhaustiva panorámica de los diferentes elementos que tienen relación con los datos de investigación (beneficios e inconvenientes, agentes implicados, almacenaje, metadatos…) a nivel europeo. Aun así, sería interesante que estas informaciones se ampliaran con otras buenas prácticas llevadas a cabo no sólo en el Estado francés sino en el resto de Europa.
1 http://libereurope.eu/blog/2016/10/13/research-data-services-europes-aca... [32]