VISUALIZACIÓN
MOLECULAR POR ORDENADOR
EN BIOQUÍMICA Y BIOLOGÍA MOLECULAR
PREÁMBULO
Las moléculas y
especialmente las biomoléculas complejas como las
proteínas o los ácidos nucleicos son estructuras tridimensionales muy grandes
que resultan difíciles de imaginar en las representaciones estáticas de un
dibujo en papel.
Para la
comprensión y el estudio de las estructuras más simples como monoglícidos o aminoácidos se ha recurrido clásicamente al
uso de modelos moleculares con bolas y varillas de diferentes colores que
representan enlaces y átomos

Algunos de estos
modelos han sido utilizados en las prácticas desarrolladas en el contexto de
esta asignatura.
No obstante,
cuando se trata de visualizar proteínas o ácidos nucleicos y especialmente,
comprender la íntima relación entre sus propiedades estructurales y su función
se requieren visualizaciones que este tipo de modelos no pueden ofrecer, entre
otras cosas debido a su elevado coste y a su dificultad de fabricación.
LOS ORDENADORES Y LA VISUALIZACIÓN MOLECULAR
El advenimiento
de la informática y de los ordenadores para uso mayoritario, hace unos 30 años
permitió el desarrollo de programas informáticos capaces de ofrecer imágenes
tridimensionales de las estructuras de las biomoléculas.
En un principio se trataba de ordenadores muy potentes para la época y que sólo
eran utilizados tipo “Workstation” y por investigadores especializados. Con el
advenimiento de la microinformática, a principios de los años 80, se vislumbró la posibilidad de desarrollar
programas de visualización molecular para microordenadores aunque no fue hasta
mediados de los años 90 cuando apareció el primer programa pionero de
visualización molecular: RASMOL.
LAS COORDENADAS ATÓMICAS DE LAS MOLÉCULAS
Para poder realizar un dibujo, un modelo o una imagen tridimensional
por ordenador de una molécula como una proteína, por ejemplo, es imprescindible
conocer cuál es su estructura tridimensional, es decir cómo están colocados
todos o parte de sus átomos en el espacio. Esto significa conocer cuáles son
las coordenadas espaciales x,y,z
de sus átomos, sus posiciones. Conociendo estas coordenadas resulta posible
entonces que un ordenador, por ejemplo, usando un algoritmo matemático, nos
ofrezca una imagen tridimensional de la misma.
¿Cómo se obtienen las
coordenadas atómicas de una molécula?
Las dos técnicas más utilizadas para elucidar la conformación
tridimensional de las moléculas son la difracción de rayos X y la Resonancia
magnética nuclear (RMN).
La técnica de difracción de rayos X requiere que la molécula se halle perfectamente ordenada en un cristal mientras que la resonancia magnética nuclear permite determinar estructuras tridimensionales de moléculas en solución. Asimismo, la RMN permite determinar las posiciones de los átomos de hidrógeno, los cuales por ser muy pequeños escapan a la longitud de onda de los rayos X y por ello las coordenadas obtenidas por difracción de rayos X no contienen las posiciones de los átomos de hidrógeno.

(Primer modelo tridimensional de la mioglobina obtenido por Kendrew en 1959)
Archivos de
coordenadas atómicas y bancos de datos
Como hemos dicho, cualquier programa de visualización molecular por ordenador necesita las coordenadas atómicas para poder representar la molécula. Las coordenadas están contenidas en archivos de texto que pueden llegar a ser muy grandes (pensemos en proteínas con 5.000 átomos o más) . Estos archivos contienen información sobre la molécula, nombres de los investigadores que la cristalizaron, revista donde se publicó, método utilizado, fuente biológica, y sobretodo las coordenadas de todos los átomos una a una:
Ejemplo de los dos primeros residuos de un archivo de la
insulina
SIGNIFICADO DE LAS
COLUMNAS
A: identifica
de forma única a cada átomo en toda la molécula. Este número no se repite en
toda la molécula salvo cuando contiene varios modelos (RMN)
B: Tipo de átomo
C: Tipo de residuo (aminoácido para proteínas, base para ácidos nucleicos)
D: Cadena en la que se encuentra el residuo. A veces no se especifica si hay una sola cadena
E: Número de orden del residuo. Por ejemplo, esta glicina de la cadena A, es el residuo 1 y todos los átomos de este residuo tienen el número 1
F,G y H:
son las coordenadas atómicas
A
B C
D E F
G H
ATOM 1 N GLY
A 1
-2.414 8.071
6.020 1.00 0.00
1HLS 78
ATOM 2 CA
GLY A 1 -2.818
6.735 6.545 1.00
0.00 1HLS 79
ATOM 3 C
GLY A 1 -1.591
5.828 6.634 1.00
0.00 1HLS 80
ATOM 4
O GLY A 1
-0.762 5.969 7.512
1.00 0.00 1HLS
81
ATOM 5 1H
GLY A 1 -1.391
8.204 6.164 1.00
0.00 1HLS 82
ATOM 6 2H
GLY A 1 -2.631
8.126 5.006 1.00
0.00 1HLS 83
ATOM 7 3H
GLY A 1 -2.935
8.814 6.525 1.00
0.00 1HLS 84
ATOM 8 1HA GLY A
1 -3.256 6.851
7.526 1.00 0.00
1HLS 85
ATOM 9 2HA GLY A
1 -3.542 6.290
5.877 1.00 0.00
1HLS 86
ATOM 10
N ILE A 2
-1.471 4.899 5.729
1.00 0.00 1HLS
87
ATOM 11
CA ILE A 2
-0.304 3.975 5.746
1.00 0.00 1HLS
88
ATOM 12
C ILE A 2
0.829 4.569 4.908
1.00 0.00 1HLS
89
ATOM 13
O ILE A 2
1.809 3.913 4.616
1.00 0.00 1HLS
90
ATOM 14
CB ILE A 2
-0.740 2.632 5.162
1.00 0.00 1HLS
91
ATOM 15
CG1 ILE A 2 0.276
1.546 5.518 1.00
0.00 1HLS 92
ATOM 16
CG2 ILE A 2 -0.856
2.738 3.640 1.00
0.00 1HLS 93
ATOM 17
CD1 ILE A 2 -0.254
0.185 5.059 1.00
0.00 1HLS 94
ATOM 18
H ILE A 2
-2.155 4.807 5.032
1.00 0.00 1HLS
95
ATOM 19
HA ILE A 2
0.033 3.834 6.764
1.00 0.00 1HLS
96
ATOM 20 HB
ILE A 2 -1.701
2.370 5.573 1.00
0.00 1HLS 97
ATOM 21 1HG1 ILE A 2
1.214 1.756 5.023 1.00
0.00 1HLS 98
ATOM 22 2HG1 ILE A 2
0.427 1.531 6.586 1.00
0.00 1HLS 99
ATOM 23 1HG2 ILE A 2 -0.988
3.773 3.358 1.00
0.00 1HLS 100
ATOM 24 2HG2 ILE A 2
0.044 2.353 3.182 1.00
0.00 1HLS 101
ATOM 25 3HG2 ILE A 2
-1.705 2.162 3.301 1.00
0.00 1HLS 102
ATOM 26 1HD1 ILE A 2
-0.790 0.301 4.125 1.00
0.00 1HLS 103
ATOM 27 2HD1 ILE A 2
0.573 -0.493 4.919
1.00 0.00 1HLS 104
ATOM 28 3HD1 ILE A 2
-0.924 -0.212 5.809
1.00 0.00 1HLS 105
Cuando se determina la estructura tridimensional de una molécula, de un complejo, de la interacción de un fármaco con una proteína, de la unión de una proteína al ADN, etc, deben depositarse las coordenadas atómicas en un banco internacional vía Internet al que se puede acceder desde diversos servidores. Este banco se conoce generalmente como Protein Data Bank (PDB), aunque hay otros. Estas coordenadas definen esta estructura con cuatro caracteres siempre. Por ejemplo, la molécula anterior es 1 HLS. Es importante recalcar que este banco es redundante en sus datos de forma que existen varios archivos para una misma molécula. Por ejemplo, si buscamos insulina nos podemos encontrar con decenas de archivos que contienen coordenadas de la insulina, dependiendo del grupo investigador que ha obtenido las coordenadas, la fuente biológica, la forma de obtener las coordenadas, si se trata de un mutante o una forma normal, etc. Por ejemplo, el segmento de coordenadas anterior corresponde a la estructura tridimensional determinada por el grupo de kaarsholm con insulina de páncreas humano y determinada por RMN. Cuando se accede a estos bancos y recuperamos el archivo de coordenadas será del tipo xxxxx.pdb y contendrá toda la información completa que acabamos de comentar.
Bancos donde
obtener coordenadas de moléculas:
Algunas de las direcciones más usadas para obtener
coordenadas atómicas de macromoléculas son:
PDB lite: http://oca.ebi.ac.uk/oca-bin/pdblite
RCSB: http://www.rcsb.org/pdb/
NCBI: http://www.ncbi.nlm.nih.gov/entrez/query.fcgi?db=Structure&itool=toolbar
El problema de
estos bancos de datos es que contienen miles de estructuras y a veces resulta
difícil encontrar exactamente la estructura que buscamos. Por otra parte estos
bancos de datos no contienen coordenadas atómicas de moléculas pequeñas como la
glucosa, un ácido graso o un aminoácido. En consecuencia, es muy útil recurrir
a direcciones web que nos facilitan selecciones de
moléculas grandes y pequeñas que pueden ser de nuestro interés. Por ejemplo
Eric Martz mantiene un atlas de una selección de moléculas en:
http://molvis.sdsc.edu/atlas/atlas.htm
Y en el Indice mundial de visualización molecular:
http://molvis.sdsc.edu/visres/pdbs/titles.jsp
Encontramos una
página dedicada a direcciones que contienen archivos de moléculas más o menos
seleccionadas.
EL CD de recursos BIOROM 2006, desarrollado por profesores de bioquímica
españoles:
http://www.biorom.uma.es/contenido/index.html
también contiene estructuras de moléculas
seleccionadas aunque en forma de tutoriales. A los
que se accede usando diversos tipos de programas de visualización molecular.
PROGRAMAS DE VISUALIZACIÓN MOLECULAR
Son programas que permiten visualizar una estructura molecular si conocemos sus coordenadas atómicas. Existen dos tipos de programas de visualización molecular por ordenador, los que funcionan independientemente de la web y de las páginas web (“standalone programs” en inglés) y los que funcionan como “plugins” adaptados a las páginas web y que siempre requieren páginas web para funcionar. Esto no significa que requieran conexión a internet, puesto que las páginas web pueden estar ubicadas en nuestros discos locales y el programa funciona perfectamente sin conexión. Algunos programas, por ejemplo uno de los más recientes y que veremos, JMOL, se ha desarrollado en forma de dos versiones, una embebida en las páginas web, sean locales o en un servidor Internet y otra autónoma (“Standalone”) que funciona al margen de las páginas web y que permite cargar directamente los archivos pdb desde nuestro disco duro local.
Principales
programas que veremos o comentamos:
RASMOL:

Rasmol fue el programa pionero de visualización molecular para microordenadores desarrollado en 1995 por Roger Sayle. Contiene dos pantallas, en la superior se visualiza la molécula y en la inferior se introducen las órdenes (COMANDS). El programa reconoce diversos formatos de archivo, aunque el más utilizado es el de la extensión pdb correspondiente Protein Data Bank. La molécula de la pantalla puede verse como una red de todos los enlaces (wrireframe, sticks), los átomos como esferas de volumen (spacefill) , solamente el esqueleto (carbonos alfa, backbone), como cintas y hélices el esqueleto de los carbonos (ribbons), etc. También permite la representación de puentes de hidrógeno intracatenarios, esferas de Van der Wals y puentes disulfuro. Como puede deducirse, el programa está en inglés y aunque existen algunas versiones traducidas, la única parte traducida es la correspondiente a los menús de la pantalla superior. El inconveniente de Rasmol es que cualquier visualización mínimamente compleja exige la entrada de comandos en la pantalla inferior con una sintaxis complicada que debe conocerse.
Instalación de Rasmol:
No
recomendamos ni vamos a tratar sobre Rasmol. Para su
instalación, simplemente descargar los archivos
del programa y de ayuda y colocarlos en una carpeta. El programa arranca
directamente haciendo doble clic sobre el icono. Ojo con las dos ventanas
porque si no se colocan adecuadamente pueden hacerse muy pocas cosas con el
programa
CHIME:
Se trata en realidad de un “pluggin” desarrollado por la compañía MDL para página web basado en el algoritmo matemático de Rasmol con algunas mejoras. Chime no funciona por sí mismo y siempre está inmerso en páginas web, más o menos sofisticadas. Los menús de las últimas versiones de Chime son más completos que Rasmol y permiten hacer algunos tipos de animaciones que no pueden conseguirse con Rasmol. Chime se ha utilizado de forma abundantísima para elaborar tutoriales sobre visualizaciones de diversas moléculas de interés biológico como veremos:

En la figura vemos un típico ejemplo de tutorial en forma de página web, colgada en un servidor y al que se accede vía Internet o bien se ha descargado como una copia local en nuestro ordenador. El marco de la izquierda muestra la molécula mientras el de la derecha contiene textos y botones que cuando son apretados producen visualizaciones automáticas. Por otra parte, con el botón de la derecha se pueden desplegar menús que permiten modificar de forma personal la visualización de la molécula. Para visualizar la molécula es necesario que esté instalado Chime en los buscadores web de nuestro ordenador.
Instalación de Chime:
Chime se instala automáticamente en Internet Explorer y en versiones antiguas de Netscape.
El programa es un pequeño ejecutable (archivo exe) que puede obtenerse gratuitamente desde la página web de MDL: http://www.mdli.com/products/framework/chime/index.jsp
MDL requiere un
registro previo gratuito. También puede obtenerse la última versión de
Chime desde las páginas de los dossieres electrónicos
Para instalarlo en Mozilla, Firefox y Netscape, versiones nuevas es necesario hacerlo de forma manual ( ver http://www2.uah.es/biomodel/comun/compatib/compatib.htm#chimeamano)
Ejemplo página
Chime:
http://cbmc.umh.es/jmsanz/Est1/est2/est3/Scripts/dna/Index.htm
PROTEIN EXPLORER
Constituye una plataforma de páginas web con Chime y que constituye un programa completísimo de visualización molecular. Todas las opciones requieren Chime instalado correctamente y puede trabajar con conexión via Internet (cuando queremos acceder a servidores externos o buscamos una molécula vía Internet) o en modo local sin conexión, cuando disponemos de los archivos pdb en nuestro disco duro local.

El programa contiene muchas opciones con ventanas emergentes y muchísimos menus de ayuda. Las últimas versiones en Inglés de Protein Explorer pueden descargarse desde el servidor que
mantiene su creador Eric Martz:
http://www.umass.edu/microbio/chime/pe/protexpl/frntdoor.htm
La versión más reciente del programa (2.7) es muy potente y es compatible con prácticamente todos los buscadores de páginas web.
Disponemos de una versión traducida al español de Protein Explorer (2.25) que funciona con Netscape e Internet Explorer y que utilizaremos en las prácticas. Esta versión está instalada en los ordenadores de las salas de informática y puede descargarse desde:
http://www2.uah.es/biomodel/pe/inicio.htm
JMOL:
Puesto que Chime es un programa comercial de MDL que no va a continuar siendo mejorado, un grupo de informáticos de universidades públicas del mundo ha desarrollado un nuevo programa gratuito y libre de visualización molecular llamado Jmol. Este programa utiliza el mismo lenguaje y órdenes que Chime pero con la ventaja de que se trata de un Applet de java. Por tanto, este programa podrá funcionar en cualquier plataforma informática independientemente del hardware o el software. Podrá funcionar en Mac y PC, en Linux y Windows y es compatible con cualquier buscador de páginas web: Netscape, Internet Explorer, Mozilla Firefox, etc.
Existen dos versiones de Jmol,
una que funciona como applet embebido en páginas web para el uso en tutoriales y
otro que funciona como programa autónomo “standalone”

(Jmol como aplicación
independiente de páginas web. Podemos observar los
menús flotantes que se despliegan con el botón de la derecha del ratón)

(Jmol como applet embebido en páginas web. Permite realizar todo tipo de tutoriales como el que mostramos en la figura)
Ejemplo de tutorial en Jmol :
http://dossiers.ub.edu/docs/6243/jmol/Proteinas/page1.html
TUTORIALES DE
VISUALIZACIÓN MOLECULAR
Existen infinitud de tutoriales de visualización molecular que tratan sobre moléculas de interés biológico. El problema reside en seleccionar los buenos de los menos buenos o de encontrar versiones españolas ya que la mayoría y lo mejor está en inglés.
Direcciones con buenas colecciones de tutoriales:
Molvis: es probablemente la más completa del mundo
http://molvis.sdsc.edu/visres/index.html
Es un listado de recursos con accesos a centenares de visualizaciones. No discrimina y por tanto hay de todo.
Lehninger:
http://www.worthpublishers.com/lehninger3d/index2.html
Biorom 2006 (español)
http://www.biorom.uma.es/contenido/index.html