El profesor Josep F. Abril participa en un estudio a gran escala de valoración del ʻsoftwareʼque analiza la expresión de los genes

Josep F. Abril, profesor del Departamento de Genética e investigador principal del Laboratorio de Genómica Computacional de la UB.
Josep F. Abril, profesor del Departamento de Genética e investigador principal del Laboratorio de Genómica Computacional de la UB.
Investigación
(07/11/2013)

Investigadores de la UB y el Centro de Regulación Genómica (CRG) forman parte de un consorcio internacional de expertos que ha publicado una valoración sistemática y a gran escala del software que se utiliza para analizar la expresión de los genes a partir de datos de la metodología de secuenciación del ARN. Los resultados, publicados ahora por la revista Nature Methods, podrían inspirar nuevas aproximaciones computacionales para gestionar las tecnologías actuales y futuras que permiten caracterizar la estructura de los genes y estudiar su expresión. Son integrantes del estudio los expertos Josep F. Abril, del Departamento de Genética de la UB, y Roderic Guigó, del CRG, que también fueron los únicos participantes de todo el Estado en el proyecto Genoma Humano, uno de los grandes hitos científicos en el ámbito de la genética humana.

Josep F. Abril, profesor del Departamento de Genética e investigador principal del Laboratorio de Genómica Computacional de la UB.
Josep F. Abril, profesor del Departamento de Genética e investigador principal del Laboratorio de Genómica Computacional de la UB.
Investigación
07/11/2013

Investigadores de la UB y el Centro de Regulación Genómica (CRG) forman parte de un consorcio internacional de expertos que ha publicado una valoración sistemática y a gran escala del software que se utiliza para analizar la expresión de los genes a partir de datos de la metodología de secuenciación del ARN. Los resultados, publicados ahora por la revista Nature Methods, podrían inspirar nuevas aproximaciones computacionales para gestionar las tecnologías actuales y futuras que permiten caracterizar la estructura de los genes y estudiar su expresión. Son integrantes del estudio los expertos Josep F. Abril, del Departamento de Genética de la UB, y Roderic Guigó, del CRG, que también fueron los únicos participantes de todo el Estado en el proyecto Genoma Humano, uno de los grandes hitos científicos en el ámbito de la genética humana.

 

Los científicos utilizan la metodología de secuenciación del ARN para ver cómo se expresan los genes a lo largo de todo el genoma. Sin embargo, ¿cómo pueden analizar esta información? ¿Es suficientemente bueno y preciso el software que usan para conseguirlo? En el estudio, el consorcio RNA-seq Genome Annotation Assessment (RGASP), una iniciativa asociada al proyecto ENCODE (Enciclopedia de los Elementos del ADN), ha evaluado el rendimiento de un amplio abanico de programas de ordenador capaces de procesar datos de secuenciación del ARN. Los expertos implicados fueron capaces de especificar qué métodos funcionan bien para algunas funciones y qué áreas deberían mejorarse.
 
Mejorando la predicción computacional de genes
 
Tal como explica el profesor Josep F. Abril, miembro del Instituto de Biomedicina de la Universidad de Barcelona (IBUB), adscrito al campus de excelencia internacional BKC, «el artículo es fruto de un proyecto para evaluar la fiabilidad de los programas de predicción de genes más modernos, en el contexto de las evidencias provenientes de datos de secuenciación del ARN (ultrasecuenciación de transcriptomas) y de cómo estos datos pueden mejorar la anotación de los genes y los modelos computacionales que los definen».
 
«Comparando de forma sistemática las herramientas computacionales existentes para la detección de genes sobre los genomas, intentamos determinar si los nuevos datos de secuenciación del ARN mejoran o no la fiabilidad de las estructuras génicas predichas», apunta el profesor Abril, investigador principal del Laboratorio de Genómica Computacional de la UB. «Además de obtener nuevas herramientas para la predicción —continúa el experto—, también hemos podido identificar las cuestiones que habrá que corregir en el futuro y conocer en qué puntos tenemos que seguir investigando para mejorar estas herramientas».
 
Según Roderic Guigó, coordinador del programa Bioinformática y Genómica del CRG, los investigadores han estado trabajando con objeto de encontrar alternativas nuevas y más sofisticadas a los métodos actuales para gestionar correctamente los datos de secuenciación. «Las conclusiones que presentamos —explica Guigó— contribuirán a obtener mejores métodos y a facilitar la aplicación de estos en varios campos, como por ejemplo la medicina y la biotecnología».
 
El RGASP: un consorcio para la investigación en genómica
 
Paul Bertone, experto del Instituto Europeo de Bioinformática (EMBL-EBI) y coordinador del estudio, afirma que se ha encontrado «un grado sorprendente de variabilidad en el modo en que estos programas gestionan los diferentes aspectos de los datos de secuenciación del ARN». Algunos métodos funcionan bien en general, mientras que otros tienen características de diseño inteligente que les permiten solucionar problemas específicos con más éxito. El consorcio también ha sido capaz de destacar las áreas de mejora de muchos de estos métodos computacionales: «Este tipo de trabajo —subraya Bertone— es un recurso muy importante para la comunidad científica que trabaja en genómica, y el modelo de consorcio colaborativo era la única plataforma que permitía llevar a cabo un experimento como este a gran escala y de forma sistemática».
 
En estos estudios han participado desarrolladores de programas de software líderes, que han evaluado los métodos computacionales para procesar e interpretar los datos de secuenciación del ARN. En el marco del Proyecto de Evaluación de Anotación del Genoma (EGASP) —basado en el ENCODE —, todos los grupos e investigadores aportaron sus resultados para la evaluación. Cada uno de los métodos comparados en el estudio permite la alineación de secuencias y la reconstrucción de transcriptos, elementos esenciales para el análisis de los experimentos de secuenciación del ARN.
 
Nuevas fronteras en la ultrasecuenciación de transcriptomas
 
La aproximación sistemática y meticulosa del consorcio para llevar a cabo esta valoración ha logrado unos descubrimientos que podrán utilizarse para mejorar y ampliar el alcance de las herramientas de análisis de la secuenciación del ARN disponibles actualmente. A la vez, se podrán utilizar para poner al día desarrollos que cubran las necesidades de las tecnologías emergentes de secuenciación.
 
«Un punto importante de este estudio -remarca Josep F. Abril— ha sido el gran volumen de datos con el que se ha trabajado; puesto que se han evaluado las anotaciones y las predicciones de genes sobre los genomas completos de los humanos, la mosca del vinagre (Drosophila melanogaster) y el gusano intestinal (Caenorhabditis elegans), a la vez que se integraban datos de secuenciación del ARN generados por el proyecto ENCODE». Según concluye Abril, otro aspecto destacable de la evaluación ha sido poder observar cómo los diferentes programas también eran capaces de cuantificar el nivel de expresión sobre las estructuras predichas a partir de los mismos datos de secuenciación de ARN.