Fernanda Peset

Recogiendo la realidad de los principios FAIR en las instituciones británicas

Fernanda Peset
Instituto Universitario de Matemática Pura y Aplicada, Universitat Politècnica de València
 
Christian Vidal Cabo
Colaborador de la Cátedra de Transparencia y Gestión de Datos, Universitat Politècnica de València
 
Fernanda Garzón-Farinós
Directora Máster Universitario en Cuidados de Enfermería en Diálisis y Trasplante Renal, Universidad Católica de Valencia «San Vicente Mártir»
 
Pablo Lara Navarra
Profesor Agregado de los Estudios de Información y Comunicación, Universitat Oberta de Catalunya
 
Antonia Ferrer-Sapena
Instituto Universitario de Matemática Pura y Aplicada, Universitat Politècnica de València


Allen, Robert; Hartland, David (2018). FAIR in practice: Jisc report on the Findable Accessible Interoperable and Reuseable Data Principles. Bristol: Jisc. 79 p. Disponible en: <https://zenodo.org/record/1245568#.XIo7daBCfcs>. [Consulta: 13/03/2019].


Empecemos por el principio. Se ha hablado mucho últimamente de los principios FAIR (findable, accessible, interoperable and reusable). Desde que F1000 los lanzó formalmente en 2016 se quieren impulsar como una capa que atraviese a cualquier tipo de datos. Se supone que pueden ser aplicados a todos, pero especialmente a los de investigación, donde la heterogeneidad impone una necesaria estandarización. Pero los principios FAIR no indicaban exactamente cómo implantarlos. Y como se suele decir, el papel lo aguanta todo, pero ¿qué ocurre en la práctica, en la realidad de las instituciones? En este informe veremos qué ha averiguado el JISC (Joint Information Systems Committee) al respecto: cómo se han implantado estos principios en el ambiente académico del Reino Unido. 

Con una metodología muy variada que incluye entrevistas, grupos de trabajo y revisión de web, se busca conocer cuánto se entienden estos principios, su presencia en las políticas y recursos de apoyo institucionales, las barreras y beneficios de la implementación de los principios FAIR, recopilar ejemplos y cuáles son las diferencias entre disciplinas. 

Los autores estructuran sus resultados a través de los aspectos recogidos según el método PEST, esto es, los factores políticos, económicos, sociales y técnicos que afectan al ecosistema de datos. Lo cierto es que no es trivial conseguir organizar el conocimiento que obtienen de diferentes actores (gestores, investigadores, financiadores y editores científicos) y de diferentes disciplinas (ciencias biológicas, humanidades digitales, química y ciencias sociales). Como puede imaginar cualquiera que haya tenido contacto con la gestión de datos de investigación, ordenar el caos es una tarea hercúlea, que solventan gracias a este tipo de metodología y a los ricos apéndices que también incluye el informe. 

El informe reconoce la limitación que supone la circunscripción a las instituciones del Reino Unido, además de ser una muestra cualitativa pequeña, con unos entrevistados que, al ser escogidos por los grupos de expertos, están bastante alertados de lo que suponen los principios FAIR. Aun así, supone una primera toma de contacto para seguir reflexionando sobre su utilidad. 

Lo primero que hacen constar en los aspectos de política es si se entienden estos principios, cuya intención inicial era convertirse en un marco que pudiera ser utilizado en un escenario tan variado como la investigación. Se evidencia que los principios FAIR funcionan muy bien como marca, como declaración, por lo que han tenido repercusión en los niveles políticos, pero no acaban de estar suficientemente definidos para los investigadores. Para concretar cómo se han implementado en los grupos de investigación y en las instituciones toman como base la definición del programa H2020. Los autores comprueban que ya se estaban cumpliendo sus presupuestos dependiendo de las disciplinas, aunque en función de la cultura de trabajo continúan las reticencias a compartir datos. En suma, detectan la necesidad de contar con prácticas coherentes y métricas para medirlas, como por ejemplo los sellos que promueve DANS (Data Archiving and Networked Services).

Entre los aspectos económicos se confirma que la gestión de los datos se percibe como una carga adicional, que no cuenta en la promoción profesional. Esta falta de incentivos quizá contribuye a la reticencia en todas las disciplinas para seguir los principios FAIR. Así que son los mandatos de los financiadores (Economic and Social Research Council-ESRC y Wellcome Trust) y de las revistas las que impulsan la implantación de los principios FAIR. 

Respecto a los aspectos sociales, el informe resalta que solo se preocupan por reflejar la propiedad de los datos en las licencias quienes tienen responsabilidades de dirección del grupo o están cercanos a departamentos de contratación, difusión, etc. 

Por último, aborda aspectos técnicos, que no tecnológicos, como el uso de estándares o tipos de datos. De nuevo, la variabilidad es preocupante para alcanzar la implementación de los principios FAIR. Sucede especialmente en el aspecto menos seguido en las prácticas investigadoras, la «I» de interoperabilidad y legibilidad por máquina. Por extensión, ello repercute en la «R», concretamente en la reutilización automática. 

Para finalizar, el estudio ofrece una serie de conclusiones y recomendaciones. 
La primera conclusión es que los principios FAIR son aún muy incipientes, que podrían ser introducidos en el sector de la investigación a través de los jóvenes investigadores, mucho más permeables a nuevas tareas y oportunidades. Uno de los desafíos es atraer a los investigadores, para lo que estamos coleccionando casos de estudio desde el RDA Researcher Engagement Project, coordinado por Marta Teperek. 

  • Recomendación 1. Este informe puede ser utilizado por las instituciones para mejorar la gestión del riesgo y completar la ayuda que ofrecen, pues se aprecia una falta de soporte concreto para cumplir con los principios FAIR, algo que ya exigen algunos financiadores.
     
  • Recomendación 2. Revisar las herramientas que existen desde la perspectiva FAIR de forma que cumplan los principios en todo el ciclo de vida de los datos y capturen los metadatos desde el origen.
     
  • Recomendación 3. Insistir en la importancia de la propiedad de los datos y el papel que las licencias juegan para preservar los derechos de investigadores, financiadores e instituciones.
     
  • Recomendación 4. Identificar y adaptar los casos de estudio existentes para demostrar la validez de los principios FAIR en la práctica.
     
  • Recomendación 5. El informe se refiere solo al Reino Unido y la estructura de su sistema científico; valora la posición del JISC para promocionar los principios FAIR en sus instituciones.
     
  • Recomendación 6. Insiste en la necesidad de contar con métricas claras. No obstante, FAIR son principios, así que se prefiere promocionarlos mediante casos de éxito antes que mediante el cumplimiento estricto de una métrica.
     
  • Recomendación 7. Crear una hoja de ruta que documente los pasos necesarios para incorporar las métricas de los principios FAIR en una institución.

En definitiva, se trata de un informe que pone las bases para avanzar en la implementación de los principios FAIR. Recoger conocimiento sobre su desarrollo práctico con el objetivo de ayudar a la toma de decisiones. Evidencia, una vez más, la falta de incentivos o la cantidad de datos crudos que no se están gestionando, así como la visión de esta gestión como una carga más que como una oportunidad. Para finalizar, no podemos dejar de destacar que gracias a su metodología sistemática y su síntesis impecable puede ser de utilidad a otros países más allá de la Gran Bretaña (y así lo deseamos para guiar los Compromisos de las universidades ante la Open Science (2019). CRUE. 13 p.) 

En la diferencia está la riqueza. Cuatro informes relatan cuatro casos de gestión de datos de investigación

Fernanda Peset, Instituto Universitario de Matemática Pura y Aplicada-Universitat Politècnica de València
Tomás Saorín, Universidad de Murcia
José Morales Aznar, Universitat Ramon Lull


Bryant, Rebecca; Lavoie, Brian; Malpas, Constance (2017). The realities of research data management. Part one: A tour of the research data management (RDM) service space. Dublin, Ohio: OCLC Research. 17 p. (OCLC Research report). Disponible en: doi:10.25333/C3PG8J. [Consulta: 18/12/2017].

Bryant, Rebecca; Lavoie, Brian; Malpas, Constance (2017). The realities of research data management. Part two: Scoping the University RDM service bundle. Dublin, Ohio: OCLC Research. 35 p. (OCLC Research report). Disponible en: doi:10.25333/C3Z039. [Consulta: 18/12/2017].


Seguiremos con el leitmotiv que parece guiar gran parte de las reseñas para Blok de BiD, la magia de los números. Si hasta ahora la cifra clave era el tres, este año le sumamos uno y resulta un cuatro.

En 2017 han aparecido los dos primeros informes1 sobre gestión de datos de investigación de OCLC Research, de un total de cuatro programados. Y su número de volúmenes coincide con el número de contextos nacionales distintos que analiza, cuatro: Reino Unido, Estados Unidos, Australia y Países Bajos. ¿Corresponderán a los cuatro órdenes tradicionales de tierra, agua, aire y fuego? En fin, no vamos a poder saberlo, pero justamente las diferencias de modelo que se apreciarán en cada uno de los casos son las que otorgan riqueza al análisis. De hecho, una de sus aportaciones es la identificación de un marco de trabajo EEC (Educación, Expertos, Conservación) que permite comprender, comparar y perfilar los contornos del espacio en la gestión de los datos de investigación (en adelante, RDM):

Preservación de datos de investigación: estrategias prácticas

Antonia Ferrer Sapena, Universidad Politécnica de Valencia
Enrique A. Sánchez Pérez, Universidad Politécnica de Valencia
Fernanda Peset, Universidad Politécnica de Valencia


Johnston, Lisa R. (ed.) Curating research data. Chicago: Association of College and Research Libraries, 2017- . «Volume one: practical strategies for your digital repository». 285 p. Disponible en:  http://www.ala.org/acrl/sites/ala.org.acrl/files/content/publications/bo.... [Consulta: 03/07/17].


Este primer volumen de una obra mayor trata distintos aspectos que van unidos a la conservación de datos de investigación.

La introducción de Lisa R. Johnston resume de manera clara cada uno de los principales apartados del libro. Johnston ha sido bibliotecaria de los servicios de investigación y codirectora del repositorio institucional de la University of Minnesota, capacitación que le permite señalar los desafíos a los que se enfrentan los profesionales encargados del tratamiento de los datos. Los considera los primeros usuarios, por lo que son quienes desde el primer momento deben identificar los problemas que puede tener su reutilización. En esta introducción, además, se define la terminología que se utiliza así como los motivos por los cuales se desarrollan los servicios de conservación, los requisitos que deben tener y las políticas para su intercambio.

Triple salto mortal de los datos de investigación: sinergias del LEARN toolkit of best practice for research data management

Fernanda Peset, Universitat Politècnica de València
Ana Doñate-Cifuentes, Universidad CEU Cardenal Herrera
Antonia Ferrer-Sapena, Universitat Politècnica de València


LEARN toolkit of best practice for research data management (2017). [S.l.]: UCL [et al.]. Disponible en: http://learn-rdm.eu/wp-content/uploads/RDMToolkit_rev06-17.pdf


“El todo es más que la suma de sus partes” Aristóteles, Metafísica.

Una vez más el número tres protagoniza nuestras reseñas. Número asociado a la creatividad, a la sociabilidad, a la comunicación científica… por no hablar de su relación con la naturaleza, la religión o las artes. No queremos parecer supersticiosos, pero es que de nuevo este informe refleja ese tres: se estructura en tres grandes partes y, como anotamos en título y cita, su suma produce sinergias que van más allá que la pura suma de las partes.
Pasemos ahora a revisarlo desde presupuestos objetivos. Este informe del proyecto LEARN supone un paso más en los temas sobre la gestión de datos de investigación (RDM) que la LERU identificó en su Hoja de ruta para los datos de investigación (2013; Aleixos et al., 2015). Cubre gran parte de las intenciones que LEARN propuso suministrar:

Tres eran tres las hijas del rey: planteamiento, desarrollo y explotación en datos científicos

Inma Aleixos. Universitat Politècnica de València
Ricardo Albiñana. Universitat Oberta de Catalunya
José Morales.  Universitat Ramon Llull
Fernanda Peset. Universitat Politècnica de València
 

- Erway, Ricky. 2013. Starting the Conversation: University-wide Research Data Management Policy. Dublin, Ohio: OCLC Research. http://www.oclc.org/content/dam/research/publications/library/2013/2013-08.pdf
- LERU Research data Working group / LERU Roadmap for research data // LERU, 2013. Advice paper; 14. http://www.uzh.ch/research/LERU_Roadmap_for_Research_data.pdf
- Sergey Filippov / Mapping Text and Data Mining In academic and Research Communities in Europe // Lisbon Council 2014; special briefing issue 16. http://www.lisboncouncil.net/publication/publication/109-mapping-text-and-data-mining-in-academic-and-research-communities-in-europe.html

Parece que seguimos con la tradición de reseñar en una sola nota tres informes de temática común (Peset, 2013; Fenoll 2014). Vayamos pues a la tercera vez, completando el 3 con 3. Tratando de buscar un hilo conductor entre los informes de esta nota, podríamos leerlos de la siguiente manera: comenzaríamos por Erway, seguiríamos con LERU y terminaríamos en Filippov. Y pasaremos a exponer por qué lo hemos deducido tras su lectura: el primero identifica los stakeholders en el escenario de los datos de investigación y plantea el rol líder que puede asumir la biblioteca; el segundo informa exhaustivamente sobre qué debe acometerse; y por último, Filippov es una muestra de cómo el análisis de los datos con técnicas de minería pone en valor los datasets, única justificación de la extendida frase "los datos son el nuevo petróleo de la economía".

Páginas

Suscribirse a RSS - Fernanda Peset