Tres en uno, tres informes sobre la gestión de los datos de investigación

Versión para impresiónVersión para impresión
Alicia García-García
Universidad Católica de Valencia
 
Fernanda Peset
Universitat Politècnica de València

Grupo de Trabajo de "Depósito y Gestión de datos en Acceso Abierto" del proyecto
RECOLECTA (2012). La conservación y reutilización de los datos científicos en España. Informe del
grupo de trabajo de buenas prácticas
. Madrid: Fundación Española para la Ciencia y
la Tecnología, FECYT. <http://www.recolecta.net/buscador/documentos/informe_datos_cientificos_en_esp.pdf>. [Consulta: 4 agosto 2013].
 
The Royal Society (2012). Science as an open enterprise: open data for open science. London: The Royal Society. <http://royalsociety.org/uploadedFiles/Royal_Society_Content/policy/projects/sape/2012-06-20-SAOE.pdf>. [Consulta: 4 agosto 2013].
 
Tenopir, Carol; Birch, Ben; Allard, Suzie (2012). Academic Libraries and Research Data Services: Current Practices and Plans for the Future. Chicago: Association of College and Research Libraries. <http://www.ala.org/acrl/sites/ala.org.acrl/files/content/publications/whitepapers/Tenopir_Birch_Allard.pdf>. [Consulta: 4 agosto 2013].

El hilo conductor de estos informes es la gestión de los datos derivados de la investigación. Tres trabajos recopilatorios, acometidos desde tres escenarios diferentes. Como comenzaba un clásico chiste, "Va un inglés, un español y un norteamericano...", quienes abordando un mismo objeto de estudio, los datos de investigación, son en esencia diferentes entre sí.

Los tres se aproximan al tema desde una perspectiva de escala nacional. Pero los datos de investigación, al igual que otros muchos aspectos de la comunicación científica, tienen una dimensión internacional ineludible. Por esta razón, se observan puntos comunes en los tres documentos. Como ejemplo, vemos que la definición de datos de investigación utilizada en el español proviene de la Universidad de Melbourne:

Los datos de la investigación son hechos, observaciones o experiencias en que se basa el argumento, la teoría o la prueba. Los datos pueden ser numéricos, descriptivos o visuales. Los datos pueden ser en estado bruto o analizado, pueden ser experimentales u observacionales. Los datos incluyen: cuadernos de laboratorio, cuadernos de campo, datos de investigación primaria (incluidos los datos en papel o en soporte informático), cuestionarios, cintas de audio, videos, desarrollo de modelos, fotografías, películas, y las comprobaciones y las respuestas de la prueba. Las colecciones datos para la investigación pueden incluir diapositivas; diseños y muestras. En la información sobre la procedencia de los datos también se podría incluir: el cómo, cuándo, dónde se recogió y con qué (por ejemplo, instrumentos). El código de software utilizado para generar, comentar o analizar los datos también pueden ser considerados datos.

 

Todos comparten la conciencia de que la gestión de datos de investigación, y aún más su disposición en abierto, es harto compleja a diferencia de la gestión de las publicaciones científicas. Ponen de manifiesto los desafíos de la preservación de los datos de investigación a largo plazo, la descripción coherente y las restricciones de intercambio y reutilización.

Pero existen grandes diferencias entre los tres. Por el contexto en el que surgen, los objetivos que se proponen, su estructura o sus resultados apreciamos la naturaleza poliédrica del problema que abordan. Son estas diferencias las que dan cuenta de la complejidad del problema de la gestión de datos científicos, que reúne a su alrededor a muy diversos actores del escenario de la ciencia con connotaciones de toda índole: sociales, políticas o técnicas.

Cual comparador de productos -como los teléfonos móviles- esta reseña describe cada uno de los informes caracterizándolos según su justificación y situación de partida, sus objetivos, su metodología, estructura y resultados.

El informe publicado por FECYT declara ser un primer paso, un informe preliminar que aporta un estado de la cuestión de los datos a escala internacional y a nivel nacional. Tiene por objetivo detallar la situación con el fin de prepararse desde un punto de vista técnico para los retos derivados de la implantación de la Ley de la ciencia de 2011. Parte del grupo de Depósito y gestión de datos en abierto de Recolecta en 2012, desde la Jornada técnica GrandIR de mayo de 2012, "Avances en la gestión de datos de investigación en España", e incluye también a otros expertos. Así, es un informe cuyos promotores son gestores de los resultados científicos, es decir los mediadores entre la producción y el usuario, preocupados por la estandarización y por la preservación a largo plazo. Podríamos decir que tiene un corte bibliotecario y promueve la vía basada en los repositorios de acceso abierto.

El informe de la Royal Society tiene una orientación más filosófica, a la par que es un trabajo muy ambicioso que comenzó en 2011. Ya en su mismo subtítulo, open data for open science, sienta las bases para la nueva cultura científica basada en las evidencias que aportan los datos. Su objetivo es analizar el impacto de las tecnologías en la comunicación científica y producir recomendaciones para responder éticamente ante la sociedad, la que en definitiva financia los recursos necesarios para investigar. En este caso, el punto de partida es una sociedad científica, un centro en concreto -The Royal Society Science Policy Centre-, de forma que sus opiniones parten de los propios académicos, quienes producen los datos, dirigen sociedades científicas y editan las revistas académicas.

El tercer informe, Academic Libraries and Research Data Services Current Practices and Plans for the Future, tiene como objetivo analizar la situación actual a la que científicos e instituciones se enfrentan, pues detecta la necesidad y oportunidad de gestionar los datos, vacío aún no cubierto en las bibliotecas. Está avalado desde 2011 por la Association of College and Research Libraries, perteneciente a la ALA, como parte de la financiación de la National Science Foundation al proyecto DataOne. Sin embargo, tiene un sesgo académico ya que su primera firmante, Carol Tenopir, procede del mundo universitario y es bien conocida por sus publicaciones de investigación sobre gestión de datos. Aún así, por el método empleado -encuesta a bibliotecas- ofrece unos resultados muy cercanos al sector de la gestión de la información.

En cuanto a la metodología los tres son bastante parecidos. El informe español efectúa un repaso bibliográfico, así como una exhaustiva instantánea de las iniciativas del estado español (artículos, comunicaciones, cursos, proyectos…) e incluye el estudio de un caso. El británico tiene la misma metodología a lo largo del texto. Pero también recoge en sus apéndices otros aspectos derivados de la investigación, ya sean casos de estudio o resultados de encuestas. El tercer informe de la ACRL, tras la revisión bibliográfica, basa sus resultados en una encuesta a una muestra representativa de miembros de las bibliotecas académicas de la Asociación.

El informe del grupo Recolecta se estructura en dos grandes apartados, el primero de revisión general y el segundo el estado de la cuestión en España incluyendo un estudio de caso, ODiSEA. Se culmina con buenas prácticas en general, así como de los casos de estudio españoles. El informe británico se estructura en cinco grandes capítulos y cuatro apéndices, que forman aproximadamente la cuarta parte del informe. El primero describe los casos de estudio que han sido abreviados durante el texto principal; el segundo detalla aspectos técnicos; y el tercero ofrece los resultados de una encuesta de 2012 sobre costes y capacidades de algunos repositorios. El tercer informe, de la ACRL, ofrece el estado de la cuestión, metodología empleada y principales resultados para poder redactar el capítulo de recomendaciones y conclusiones. Su único apéndice recoge los ítems de la encuesta.

En cuanto a los resultados principales que ofrecen, el informe de Recolecta establece los aspectos más importantes para implementar una política de gestión de datos y resume las recomendaciones clave para un plan genérico. Por su parte el de la Royal Society se retrotrae a los inicios de la comunicación científica, con la aparición de las primeras revistas para proyectarse hacia el futuro indicando las tendencias en casi todos los aspectos relacionados con la comunicación de la ciencia. Entre ellas indica el interés en los resultados científicos de sectores sociales ajenos a la investigación; o también apunta al cuarto paradigma en la ciencia, que no consiste en seguir haciendo ciencia de forma tradicional, sino hacerla para cambiar cada disciplina. Cabe citar que establece recomendaciones en función de los intereses de los agentes involucrados y efectúa una clasificación de las iniciativas actuales tal y como muestra el gráfico en función de su valor y frecuencia (recursos internacionales, centros nacionales de datos, repositorios institucionales, colecciones individuales):

Por último el informe de la ACRL ha producido una imagen de la situación en que se encuentran las bibliotecas académicas norteamericanas. Su principal aportación es el detalle de las acciones que pueden emprender los directores de las bibliotecas de cara a la gestión de los datos. Las dos tablas siguientes resumen los resultados en cuanto a los servicios de asesoría y el apoyo técnico de las bibliotecas, divididas por tamaño de población estudiantil:

En cuanto a las conclusiones, una vez vistas las diferencias entre uno y otro, habremos de convenir que son similares en el fondo. Pero su utilidad variará para cada lector según cuál sea el papel que asume con respecto a los datos. Dado que la comunidad de interés en las reseñas de Blok de BiD suelen ser gestores de información, nos centraremos en detallar las conclusiones que sean de interés para esta comunidad.

En primer término, con respecto a la propia gestión de datos, el informe de Recolecta indica que deben existir políticas explícitas, recursos materiales y humanos y, especialmente, ha de producirse un cambio cultural. Las solicitudes de financiación deberían incluir un plan de gestión de datos que contemple la organización, la preservación y el marco legal de los datos en el momento de producirlos, algo que se demanda hace ya tiempo en el caso norteamericano. De esta manera se facilitaría la labor posterior de los gestores de información.

Entre las conclusiones del informe de la Royal Society destacamos sólo la dirigida a los organismos de investigación; el resto se orienta a los propios científicos, las agencias de financiación, editores, sociedades y academias científicas y gobiernos. En primer lugar aconsejan que se reconozca en la carrera profesional el trabajo de liberar los datos; y en segundo lugar que se desarrollen estrategias sobre la conservación de su propio conocimiento en el caso de que tenga valor realizar alguna inversión sobre él. Detalla algunas acciones que pueden ser asumidas por las bibliotecas. A saber, "Provide education and training in the principles and practice of the management of scientific datasets [...] Develop and publish a register of data assets that specifies the estimated timetable for data release for funded but as yet unfinished projects", por ejemplo.

Por último, las conclusiones del informe de ACRL destacan la falta de procesos formales y normalizados para la gestión y el intercambio de los datos; la falta de capacitación de los profesionales para adoptar un papel formador y de asesoramiento hacia los investigadores; y las insuficientes o inexistentes herramientas para la preservación de los datos, lo que se deriva principalmente de una falta de financiación. Destaca la idoneidad de las bibliotecas académicas para proporcionar RDS (Servicios de Datos de Investigación), ya que gestionan el ciclo de vida completo de los datos y desarrollan políticas e infraestructuras para preservar los datos. Aunque en estos momentos pocas bibliotecas ofrecen estos servicios, la mayoría tienen previsto comenzar en dos años, generalmente reasignando estas tareas a personal existente o incluso consiguiendo personal argumentando la implantación de estos nuevos servicios. Actualmente la formación la obtienen en reuniones, pero es deseable mayor apoyo institucional por ejemplo mediante estancias en otros centros y también apoyándose en proyectos como Dataone de la NSF que proporciona herramientas y capacitación.

En términos generales todos coinciden en que "Los datos de investigación están empezando a reconocerse como una fuente de conocimiento propia e independiente de las publicaciones que pueden emplearse en la validación de los resultados de investigación publicados en artículos, para generar nuevo conocimiento y ser explotados de manera interdisciplinar." El informe de la Royal Society reseña que "it is timely to accelerate and coordinate change, but in ways that are adapted to the diversity of the scientific enterprise and the interests of: scientists, their institutions, those that fund, publish and use their work and the public." Por último, el informe de la ACRL advierte que si la biblioteca no se involucra activamente en la prestación de estos servicios, es muy probable que sea otro departamento el que los proporcione, apartando a la biblioteca de su labor en el proceso de investigación; y por tanto perderían una oportunidad para dar servicio a un rango más amplio de agentes sociales interesados en la gestión de los datos.