Datos de investigación abiertos: visión global de los científicos y casos a considerar

Versión para impresiónVersión para impresión

Alexandre López i Borrull
Estudis de Ciències de la Informació i de la Comunicació. Director del Grau d'Informació i Documentació. Universitat Oberta de Catalunya (UOC)


The state of open data: a selection of analyses and articles about open data, curated by Figshare (2016). London: Digital Science. 48 p. Disponible en: https://figshare.com/articles/The_State_of_Open_Data_Report/4036398. [Consulta: 03/03/2017].


En octubre de 2016, Figshare, el conocido repositorio de datos, juntamente con Digital Science, una empresa tecnológica, publicaban un dossier monográfico sobre datos abiertos, The state of open data. Como uno de los actores principales en el sector de las plataformas multidisciplinarias para depositar datos en abierto, este dossier resulta una buena forma de promoción de los datos abiertos, por las reflexiones y los puntos de vista que aparecen pero, sobre todo, por la presentación de la encuesta que podemos encontrar. Ciertamente, Figshare no es un grupo de interés neutro, y como más datos en abierto mejor para la empresa, pero ello no quita el valor del contenido que ofrece en este dossier. Vamos a ver, pues, qué partes contiene y algunas de las principales reflexiones. Avanzamos también que uno de los colectivos que más se ponen en valor es el de los bibliotecarios en particular y los profesionales de la información en general.

Como prólogo, Nigel Shadbolt apunta con acierto la necesidad de movernos entre los incentivos y los mandatos en esta cuestión, lo que nos trae reminiscencias sobre el debate acerca del acceso abierto en las publicaciones científicas y una cierta sensación de déjà vu. Por parte de los promotores del dossier, Figshare y Digital Science, sus CEO mencionan en un artículo juntos la paradoja que incluso los defensores de abrir y compartir los datos perciben que los que deciden no compartir los datos y tener a su alcance los de los competidores tendrán una ventaja (“you will be standing on the shoulders of more giants”, dicen). Así, la ciencia continúa basculando en un término medio entre colaboración y competición. Además, para ver los puntos críticos por la compartición, valoran que todavía la publicación en determinadas revistas puede aportarte financiación y puestos de trabajo, mientras que todavía no se puede llegar a ser catedrático por compartir datos. Es interesante, y por eso lo recalcamos, el hecho que aun siendo defensores de abrir datos valoren las visiones críticas, porque es así, posteriormente en su artículo, que pueden desarrollar las propuestas que ellos creen que permitirían cambiar las inquietudes y miedos a compartir los datos. Así, hablan de los aspectos estructurales y culturales que hay que tener en cuenta para poder cambiar las infraestructuras. Por ejemplo, la evolución de las revistas desde una visión estática, de foto fija, de un determinado momento de la investigación, a una visión de la ciencia como una narrativa continua donde los datos y análisis son añadidos creando un corpus de trabajo con múltiples contribuciones. Finalmente, también mencionan tres de los puntos críticos donde los profesionales de la información tienen más posibilidades de poder aportar: los metadatos, la atención a los contenidos y la evaluación de expertos.

Por otra parte y en otro artículo dentro del dossier, Sabina Leonelli hace una reflexión interesante no sobre los motivos para compartir datos y los beneficios, que da por sabidos, sino porque hace una lectura de cuáles son los motivos de la promoción de la compartición de los datos, y ¿por qué es relevante en este momento? Así, afirma que hay cuatro factores de este hecho que irían más allá de ser una consecuencia lógica del avance tecnológico, dado que tiene implicaciones que sobrepasan la ciencia. Estos factores se pueden resumir de la siguiente forma:

  1. Los datos abiertos ofrecen una plataforma común para científicos, instituciones y financiadores para discutir las dificultades técnicas para la compartición y reutilización de los datos.
  2. Los datos abiertos apuntan y generan el debate relativo a la transparencia, legitimidad y retorno de la inversión de la financiación de la ciencia.
  3. Los datos abiertos también forman parte de los retos de la globalización de la ciencia y la pérdida de centralidad tradicional del poder de Europa y los Estados Unidos.
  4. Los datos abiertos ejemplifican la inserción de la investigación científica en la lógica y el contexto del mercado. En definitiva, una visión interesante y más geopolítica sobre los datos abiertos.

El grueso del dossier resulta en una encuesta llevada a cabo en junio de 2016 por Figshare, Digital Science y Springer Nature alrededor de los datos abiertos. Más de 2.000 respuestas permiten ver una buena aproximación de usos y motivos para compartir o no los datos de investigación. Como buena muestra y ejemplo, los datos de la investigación, anonimizadas, pueden encontrarse en el siguiente enlace.

 

 

 

 

 

 

 

 

 

 

 

Las principales conclusiones que los autores de la encuesta presentan son:

  • Para la mayoría de respuestas, los datos abiertos ya son una realidad.
  • Los científicos admiten incertidumbres y desconocimientos; necesitan saber más.
  • En el futuro, los datos serán más abiertos.

Resulta muy interesante repasar los diversos datos y preguntas, sobre todo desde el punto de vista de los profesionales de la información que deben gestionar este ámbito, o bien ofrecer respuestas a las múltiples preguntas que surgen en el proceso de abrir los datos, dado que presenta las principales visiones sobre abrir y compartir los datos.

El resto del dossier se completa con pequeñas piezas de opinión sobre open data en diferentes ámbitos y entornos geográficos. Así, Till Bruckner presenta la campaña AllTrials, encarada a conseguir que los ensayos clínicos, tan relevantes en los ámbitos biomédicos, sean lo más abiertos posible por la rapidez en el avance científico y también por la afirmación, imbatible, que los datos abiertos en la investigación médica puede salvar vidas. Otro actor relevante actualmente, el Center for Open Science, promotor de la plataforma Open Science Framework, describe los cinco pasos para promover e incrementar que más datos de investigación sean abiertos y reproducibles: estar informado, planificar la gestión de datos, llevar a cabo buenas prácticas a la hora de compilar y analizar datos, compartir y archivar datos y materiales y, finalmente, buscar los expertos que pueden ayudarte. Aquí, de nuevo, el papel de las bibliotecas resulta clave.

Finalmente, otros artículos describen las políticas de datos de investigación abiertos en los Estados Unidos donde la mayoría de las agencias piden ya planes y políticas concretas; la situación de los datos abiertos en Burkina Faso, donde se explican las iniciativas llevadas a cabo aun siendo uno de los países más pobres del mundo; las políticas de datos de investigación en Australia y Japón y la necesidad de nuevos incentivos. El dossier, antes del apéndice concluye con una pieza de reflexión desde las Humanidades y el contexto de la recogida de datos en este ámbito temático.

Como conclusión, podemos decir que se trata de un dossier muy sólido y útil para:

  • Científicos en general con requerimientos y responsabilidades referentes a los planes de gestiones de datos de sus proyectos, dado que encontrarán base de conocimientos, pero también documentos y actores implicados a quienes pueden tomar de referencia.
  • Bibliotecas universitarias y de centros de investigación que necesitan contexto y argumentos para dos principales aspectos: convencer a los científicos de las necesidades de compartir datos y saber cómo opinan los investigadores al respecto.
  • Profesionales de la información implicados en revistas, repositorios y centros que necesitan dotarse de políticas de datos abiertos.
  • Profesionales de la información relacionados con ámbitos de open data a nivel de la administración pública y la transparencia, dado que es preciso recordar que los datos de investigación están muchas veces financiados por recursos públicos.