Búsquedas en bases de datos

Estudio de las proteínas SM en el hombre

1. Localización de la proteína objeto (de consulta)

Las proteínas SM se encuentran en complejos snRNP complexes. Existe un número muy elevado y son muy distintas, por lo que es casi imposible localizarlas todas con una única secuencia modelo. Todas poseen un pequeño dominio globular pero muchas de ellas tienen además un pequeño dominio no globular C-terminal. Esta diferencia es relevante para ilustrar los problemas derivados de buscar proteínas multidominio.

2.1. Búsqueda de secuencias similares con BLAST y la proteína SM-B de humanos

Responde a las preguntas siguientes

2.2. Búsqueda refinada

Las regiones de las proteínas que contienen algunos aminoácidos muy repetidos (las denominados "regiones de baja complejidad ") suelen considerarse responsables de ocasionar falsos positivos es decir, secuencias de la bases de datos cuyo E-valor esbajo pero que no están realmente relacionadas con la secuencia de la consulta. Por lo tanto, una buena estrategia es omitir estas regiones de la secuencia al realizar una bçusqueda. Para ello debe aplicarse un filtro a la secuencia problema que elimine estas regiones, antes de iniciar el BLAST.

Repite la búsqueda anterior activando un filtro que elimine las secuencias de baja complejidad ("reduced sequence complexity") y

Responde a las preguntas siguientes