VISUALIZACIÓN MOLECULAR POR ORDENADOR

 EN BIOQUÍMICA Y BIOLOGÍA MOLECULAR

 

PREÁMBULO

Las moléculas y especialmente las biomoléculas complejas como las proteínas o los ácidos nucleicos son estructuras tridimensionales muy grandes que resultan difíciles de imaginar en las representaciones estáticas de un dibujo en papel.

Para la comprensión y el estudio de las estructuras más simples como monoglícidos o aminoácidos se ha recurrido clásicamente al uso de modelos moleculares con bolas y varillas de diferentes colores que representan enlaces y átomos

   

Algunos de estos modelos han sido utilizados en las prácticas desarrolladas en el contexto de esta asignatura.

No obstante, cuando se trata de visualizar proteínas o ácidos nucleicos y especialmente, comprender la íntima relación entre sus propiedades estructurales y su función se requieren visualizaciones que este tipo de modelos no pueden ofrecer, entre otras cosas debido a su elevado coste y a su dificultad de fabricación.

LOS ORDENADORES Y LA VISUALIZACIÓN MOLECULAR

El advenimiento de la informática y de los ordenadores para uso mayoritario, hace unos 30 años permitió el desarrollo de programas informáticos capaces de ofrecer imágenes tridimensionales de las estructuras de las biomoléculas. En un principio se trataba de ordenadores muy potentes para la época y que sólo eran utilizados tipo “Workstation” y por investigadores especializados. Con el advenimiento de la microinformática, a principios de los años 80,  se vislumbró la posibilidad de desarrollar programas de visualización molecular para microordenadores aunque no fue hasta mediados de los años 90 cuando apareció el primer programa pionero de visualización molecular: RASMOL.

LAS COORDENADAS ATÓMICAS DE LAS MOLÉCULAS

Para poder realizar un dibujo, un modelo o una imagen tridimensional por ordenador de una molécula como una proteína, por ejemplo, es imprescindible conocer cuál es su estructura tridimensional, es decir cómo están colocados todos o parte de sus átomos en el espacio. Esto significa conocer cuáles son las coordenadas espaciales x,y,z de sus átomos, sus posiciones. Conociendo estas coordenadas resulta posible entonces que un ordenador, por ejemplo, usando un algoritmo matemático, nos ofrezca una imagen tridimensional de la misma.

¿Cómo se obtienen las coordenadas atómicas de una molécula?

Las dos técnicas más utilizadas para elucidar la conformación tridimensional de las moléculas son la difracción de rayos X y la Resonancia magnética nuclear (RMN).

La técnica de difracción de rayos X requiere que la molécula se halle perfectamente ordenada en un cristal mientras que la resonancia magnética nuclear permite determinar estructuras tridimensionales de moléculas en solución. Asimismo, la RMN permite determinar las posiciones de los átomos de hidrógeno, los cuales por ser muy pequeños escapan a la longitud de onda de los rayos X y por ello las coordenadas obtenidas por difracción de rayos X no contienen las posiciones de los átomos de hidrógeno.

(Primer modelo tridimensional de la mioglobina obtenido por Kendrew en 1959)

 

Archivos de coordenadas atómicas y bancos de datos

Como hemos dicho, cualquier programa de visualización molecular por ordenador necesita las coordenadas atómicas para poder representar la molécula. Las coordenadas están contenidas en archivos de texto que pueden llegar a ser muy grandes (pensemos en proteínas con 5.000 átomos o más) . Estos archivos contienen información sobre la molécula, nombres de los  investigadores que la cristalizaron, revista donde se publicó, método utilizado, fuente biológica,  y sobretodo las coordenadas de todos los átomos una a una:


Ejemplo de los dos primeros residuos de un archivo de la insulina

 

SIGNIFICADO DE LAS COLUMNAS

 

A: identifica de forma única a cada átomo en toda la molécula. Este número no se repite en toda la molécula salvo cuando contiene varios modelos (RMN)

B: Tipo de átomo

C: Tipo de residuo (aminoácido para proteínas, base para ácidos nucleicos)

D: Cadena en la que se encuentra el residuo. A veces no se especifica si hay una sola cadena

E: Número de orden del residuo. Por ejemplo, esta glicina de la cadena A, es el residuo 1 y todos los átomos de este residuo tienen el número 1

F,G y H: son las coordenadas atómicas

          A  B    C  D   E       F       G       H

ATOM      1  N   GLY A   1      -2.414   8.071   6.020  1.00  0.00      1HLS  78

ATOM      2  CA  GLY A   1      -2.818   6.735   6.545  1.00  0.00      1HLS  79

ATOM      3  C   GLY A   1      -1.591   5.828   6.634  1.00  0.00      1HLS  80

ATOM      4  O   GLY A   1      -0.762   5.969   7.512  1.00  0.00      1HLS  81

ATOM      5 1H   GLY A   1      -1.391   8.204   6.164  1.00  0.00      1HLS  82

ATOM      6 2H   GLY A   1      -2.631   8.126   5.006  1.00  0.00      1HLS  83

ATOM      7 3H   GLY A   1      -2.935   8.814   6.525  1.00  0.00      1HLS  84

ATOM      8 1HA  GLY A   1      -3.256   6.851   7.526  1.00  0.00      1HLS  85

ATOM      9 2HA  GLY A   1      -3.542   6.290   5.877  1.00  0.00      1HLS  86

ATOM     10  N   ILE A   2      -1.471   4.899   5.729  1.00  0.00      1HLS  87

ATOM     11  CA  ILE A   2      -0.304   3.975   5.746  1.00  0.00      1HLS  88

ATOM     12  C   ILE A   2       0.829   4.569   4.908  1.00  0.00      1HLS  89

ATOM     13  O   ILE A   2       1.809   3.913   4.616  1.00  0.00      1HLS  90

ATOM     14  CB  ILE A   2      -0.740   2.632   5.162  1.00  0.00      1HLS  91

ATOM     15  CG1 ILE A   2       0.276   1.546   5.518  1.00  0.00      1HLS  92

ATOM     16  CG2 ILE A   2      -0.856   2.738   3.640  1.00  0.00      1HLS  93

ATOM     17  CD1 ILE A   2      -0.254   0.185   5.059  1.00  0.00      1HLS  94

ATOM     18  H   ILE A   2      -2.155   4.807   5.032  1.00  0.00      1HLS  95

ATOM     19  HA  ILE A   2       0.033   3.834   6.764  1.00  0.00      1HLS  96

ATOM     20  HB  ILE A   2      -1.701   2.370   5.573  1.00  0.00      1HLS  97

ATOM     21 1HG1 ILE A   2       1.214   1.756   5.023  1.00  0.00      1HLS  98

ATOM     22 2HG1 ILE A   2       0.427   1.531   6.586  1.00  0.00      1HLS  99

ATOM     23 1HG2 ILE A   2      -0.988   3.773   3.358  1.00  0.00      1HLS 100

ATOM     24 2HG2 ILE A   2       0.044   2.353   3.182  1.00  0.00      1HLS 101

ATOM     25 3HG2 ILE A   2      -1.705   2.162   3.301  1.00  0.00      1HLS 102

ATOM     26 1HD1 ILE A   2      -0.790   0.301   4.125  1.00  0.00      1HLS 103

ATOM     27 2HD1 ILE A   2       0.573  -0.493   4.919  1.00  0.00      1HLS 104

ATOM     28 3HD1 ILE A   2      -0.924  -0.212   5.809  1.00  0.00      1HLS 105



Cuando se determina la estructura tridimensional de una molécula, de un complejo, de la interacción de un fármaco con una proteína, de la unión de una proteína al ADN, etc, deben depositarse las coordenadas atómicas en un banco internacional vía Internet al que se puede acceder desde diversos servidores. Este banco se conoce generalmente como Protein Data Bank (PDB), aunque hay otros. Estas coordenadas definen esta estructura con cuatro caracteres siempre. Por ejemplo, la molécula anterior es 1 HLS. Es importante recalcar que este banco es redundante en sus datos de forma que existen varios archivos para una misma molécula. Por ejemplo, si buscamos insulina nos podemos encontrar con decenas de archivos que contienen coordenadas de la insulina, dependiendo del grupo investigador que ha obtenido las coordenadas, la fuente biológica, la forma de obtener las coordenadas, si se trata de un mutante o una forma normal, etc. Por ejemplo, el segmento de coordenadas anterior corresponde  a la estructura tridimensional determinada por el grupo de kaarsholm  con insulina de páncreas humano y determinada por RMN.  Cuando se accede a estos bancos y recuperamos el archivo de coordenadas será del tipo xxxxx.pdb y contendrá toda la información completa que acabamos de comentar.

Bancos donde obtener coordenadas de moléculas:

Algunas de las direcciones más usadas para obtener coordenadas atómicas de macromoléculas son:

PDB lite: http://oca.ebi.ac.uk/oca-bin/pdblite

RCSB: http://www.rcsb.org/pdb/

NCBI: http://www.ncbi.nlm.nih.gov/entrez/query.fcgi?db=Structure&itool=toolbar

El problema de estos bancos de datos es que contienen miles de estructuras y a veces resulta difícil encontrar exactamente la estructura que buscamos. Por otra parte estos bancos de datos no contienen coordenadas atómicas de moléculas pequeñas como la glucosa, un ácido graso o un aminoácido. En consecuencia, es muy útil recurrir a direcciones web que nos facilitan selecciones de moléculas grandes y pequeñas que pueden ser de nuestro interés. Por ejemplo

Eric Martz mantiene un atlas de una selección de moléculas en:

http://molvis.sdsc.edu/atlas/atlas.htm

Y en el Indice mundial de visualización molecular:

http://molvis.sdsc.edu/visres/pdbs/titles.jsp

Encontramos una página dedicada a direcciones que contienen archivos de moléculas más o menos seleccionadas.

EL CD de recursos BIOROM 2006, desarrollado por profesores de bioquímica españoles:

http://www.biorom.uma.es/contenido/index.html

también contiene estructuras de moléculas seleccionadas aunque en forma de tutoriales. A los que se accede usando diversos tipos de programas de visualización molecular.

        PROGRAMAS DE VISUALIZACIÓN MOLECULAR

Son programas que permiten visualizar una estructura molecular si conocemos sus coordenadas atómicas. Existen dos tipos de programas de visualización molecular por ordenador, los que funcionan independientemente de la web y de las páginas web (“standalone programs” en inglés) y los que funcionan como “plugins” adaptados a las páginas web y que siempre requieren páginas web para funcionar. Esto no significa que requieran conexión a internet, puesto que las páginas web pueden estar ubicadas en nuestros discos locales y el programa funciona perfectamente sin conexión. Algunos programas, por ejemplo uno de los más recientes y que veremos, JMOL, se ha desarrollado en forma de dos versiones, una embebida en las páginas web, sean locales o en un servidor Internet y otra autónoma (“Standalone”) que funciona al margen de las páginas web y que permite cargar directamente los archivos pdb desde nuestro disco duro local.

Principales programas que veremos o comentamos:

RASMOL:

Rasmol fue el programa pionero de visualización molecular para microordenadores desarrollado en 1995 por Roger Sayle. Contiene dos pantallas, en la superior se visualiza la molécula y en la inferior se introducen las órdenes (COMANDS). El programa reconoce diversos formatos de archivo, aunque el más utilizado es el de la extensión pdb correspondiente Protein Data Bank.  La molécula de la pantalla puede verse como una red de todos los  enlaces (wrireframe, sticks),  los átomos como esferas de volumen (spacefill) , solamente el esqueleto (carbonos alfa,  backbone), como cintas y hélices  el esqueleto de los carbonos (ribbons), etc.  También permite la representación de puentes de hidrógeno intracatenarios, esferas de Van der Wals y puentes disulfuro. Como puede deducirse, el programa está en inglés y aunque existen algunas versiones traducidas, la única parte traducida es la correspondiente a los menús de la pantalla superior. El inconveniente de Rasmol es que cualquier visualización mínimamente compleja exige la entrada de comandos en la pantalla inferior con una sintaxis complicada que debe conocerse.

 

Instalación de Rasmol:

No recomendamos ni vamos a tratar sobre Rasmol. Para su instalación, simplemente descargar los archivos  del programa y de ayuda y colocarlos en una carpeta. El programa arranca directamente haciendo doble clic sobre el icono. Ojo con las dos ventanas porque si no se colocan adecuadamente pueden hacerse muy pocas cosas con el programa

 

CHIME:

Se trata en realidad de un “pluggin” desarrollado por la compañía MDL para página web  basado en el algoritmo matemático de Rasmol con algunas mejoras. Chime no funciona por sí mismo y siempre está inmerso en páginas web, más o menos sofisticadas. Los menús de las últimas versiones de Chime son más completos que Rasmol y permiten hacer algunos tipos de animaciones que no pueden conseguirse con Rasmol. Chime se ha utilizado de forma abundantísima para elaborar tutoriales sobre visualizaciones de diversas moléculas de interés biológico como veremos:

 

En la figura vemos un típico ejemplo de tutorial en forma de página web, colgada en un servidor y al que se accede vía Internet o bien se ha descargado como una copia local en nuestro ordenador. El marco de la izquierda muestra la molécula mientras el de la derecha contiene textos y botones que cuando son apretados producen visualizaciones automáticas. Por otra parte, con el botón de la derecha se pueden desplegar menús que permiten modificar de forma personal la visualización de la molécula. Para visualizar la molécula es necesario que esté instalado Chime en los buscadores web de nuestro ordenador.

Instalación de Chime:

Chime se instala automáticamente en Internet Explorer y en versiones antiguas de Netscape.

El programa es un pequeño ejecutable (archivo exe) que puede obtenerse gratuitamente desde la página web de MDL: http://www.mdli.com/products/framework/chime/index.jsp

MDL requiere un registro previo gratuito. También puede obtenerse la última versión de Chime desde las páginas de los dossieres electrónicos

Para instalarlo en Mozilla, Firefox y Netscape, versiones nuevas es necesario hacerlo de forma manual ( ver http://www2.uah.es/biomodel/comun/compatib/compatib.htm#chimeamano)

Ejemplo página Chime:

http://cbmc.umh.es/jmsanz/Est1/est2/est3/Scripts/dna/Index.htm

 

PROTEIN EXPLORER

Constituye una plataforma de páginas web con Chime y que constituye un programa completísimo de visualización molecular. Todas las opciones requieren Chime instalado correctamente y puede trabajar con conexión via Internet (cuando queremos acceder a servidores externos o buscamos una molécula vía Internet) o en modo local sin conexión, cuando disponemos de los archivos pdb en nuestro disco duro local.

 


El programa contiene muchas opciones con ventanas emergentes y muchísimos menus de ayuda. Las últimas versiones en Inglés de Protein Explorer pueden descargarse desde el servidor que mantiene su creador Eric Martz:

http://www.umass.edu/microbio/chime/pe/protexpl/frntdoor.htm

La versión más reciente del programa (2.7) es muy potente y es compatible con prácticamente todos los buscadores de páginas web.

Disponemos de una versión traducida al español de Protein Explorer (2.25) que funciona con Netscape e Internet Explorer y que utilizaremos en las prácticas. Esta versión está instalada en los ordenadores de las salas de informática y puede descargarse desde:

http://www2.uah.es/biomodel/pe/inicio.htm

JMOL:

Puesto que Chime es un programa comercial de MDL que no va a continuar siendo mejorado, un grupo de informáticos de universidades públicas del mundo ha desarrollado un nuevo programa gratuito y libre de visualización molecular llamado Jmol. Este programa utiliza el mismo lenguaje y órdenes que Chime pero con la ventaja de que se trata de un Applet de java. Por tanto, este programa podrá funcionar en cualquier plataforma informática independientemente del hardware o el software. Podrá funcionar en Mac y PC, en Linux y Windows y es compatible con cualquier buscador de páginas web: Netscape, Internet Explorer, Mozilla Firefox, etc.

Existen dos versiones de Jmol, una que funciona como applet embebido en páginas web para el uso en tutoriales y otro que funciona como programa autónomo “standalone

(Jmol como aplicación independiente de páginas web. Podemos observar los menús flotantes que se despliegan con el botón de la derecha del ratón)

(Jmol como applet embebido en páginas web. Permite realizar todo tipo de tutoriales como el que mostramos en la figura)

Ejemplo de tutorial en Jmol :

http://dossiers.ub.edu/docs/6243/jmol/Proteinas/page1.html

 

TUTORIALES DE VISUALIZACIÓN MOLECULAR

 

Existen infinitud de tutoriales de visualización molecular que tratan sobre moléculas de interés biológico. El problema reside en seleccionar los buenos de los menos buenos o de encontrar versiones españolas ya que la mayoría y lo mejor está en inglés.

Direcciones con buenas colecciones de tutoriales:

Molvis: es probablemente la más completa del mundo

http://molvis.sdsc.edu/visres/index.html

Es un listado de recursos con accesos a centenares de visualizaciones. No discrimina y por tanto hay de todo.

Lehninger:

http://www.worthpublishers.com/lehninger3d/index2.html


 Biorom 2006 (español)

http://www.biorom.uma.es/contenido/index.html