Posgrado: Sesión práctica de mummer, blast y emboss

Posgrado: Sesión práctica de mummer, blast y emboss

1. Entra a la carpeta con nombre Bacillus subtilis 168 uid57675 en el sitio ftp siguiente:

ftp://ftp.ncbi.nih.gov/genomes/Bacteria/

2. Descarga los archivos gbk ptt ffn frn fna desde la terminal con el comando wget, si necesitas ayuda sobre wget teclea:


wget --help

3. Explora los archivos desde la terminal con cat, less / more, ¿Qué contienen cada uno de los archivos que descargaste?

4. Usa grep y menciona cuantas secuencias hay en el archivo ffn, faa, frn y el fna

5. Baja un segundo genoma de la siguiente dirección en formato fna y ffn

ftp://ftp.ncbi.nih.gov/genomes/Bacteria/Bacillus_clausii_KSM_K16_uid58237/

6. ¿Cuantas secuencias tiene el archivo ffn de Bacillus clausii, a qué corresponden?

MUMMER

7. Haz un alineamiento genómico entre los genomas de Bacillus clausii y Bacillus subtilis usando nucmer. Para saber más de nucmer usa el manual


man nucmer
nucmer --help

¿Qué archivos vas a usar para la comparación?

¿Qué archivo nuevo se genera con nucmer?

9. Utiliza el programa show-coords para imprimir las coordenadas de alineamiento

show-coords -rcl ref_qry.delta

¿Qué es -rcl?

Ahora usa el comando así:


show-coords -rcl ref_qry.delta >ref_qry.coords

¿Qué es lo que hace el signo «>»?

10. Imprime los alineamientos en tu pantalla con el comando show-aligns

show-aligns ref_qry.delta refname qryname

En este caso refname y qryname lo pueden obtener de las últimas dos columnas del archivo coords. Cuidado con los caracteres especiales, hay que usar «\» para declararlos

11. Vamos a hacer una representación gráfica de los dos genomas así:

mummerplot -l ARCHIVO.delta -p nucmer --png

12. Abre la nueva imagen:

eog NOMBRE_DE_LA_IMAGEN.png

13. Repite el alineamiento inicial, pero ahora con el programa promer, tiene la misma sintaxis general que usaste con nucmer, puedes revisar que hiciste con nucmer antes con las flechas arriba y abajo del teclado, en la terminal. Si no, pues revisa la ayuda de promer:

promer --help

14. Haz una representación gráfica de los alineamientos nuevos de promer, con el nuevo archivo de alineamiento (¿Cuál es?), usando mummerplot, con el prefijo (-p promer).

15. Abre la nueva visualización del alineamiento con eog NOMBRE_de_IMAGEN.png

16. ¿Qué diferencias observas entre usar nucleótidos y aminoácidos para los alineamientos?

BLAST

1. Formatea tu base de datos de referencia, vamos a comenzar con uno de los genomas que descargaste en los ejercicios anteriores. Se utiliza el comando formatdb

¿Cómo formatearía una base de datos (DB) de nucleótidos?

¿Cómo formatearía una base de datos de aminoácidos?

Formatea el genoma (*.fna) del genoma de B. subtilis

2. Usa el archivo de los genes predichos de B. clausii como query en la búsqueda contra el genoma de B. subtilis. ¿Qué programas de blast podrías usar?

En este ejercicio usaremos blastall, revisa las opciones que tienes para correr blastall


blastall --help

3. Después de que decidas el programa de blast, guarda la salida en un archivo nuevo.

4. Corre el mismo blast con el calificador -m9 y guarda la salida en un archivo nuevo.

5. ¿Qué diferencias hay entre la salida del punto 3 y 4?

EMBOSS

1. En la terminal teclea el siguiente comando:

wossname

y luego da enter en el menú emergente.

¿Qué aparace? ¿Para qué tipo de análisis podemos usar emboss?

2. Teclea el comando:


infoseq

Ingresa el nombre exacto del archivo con el genoma de B. subtilis o B. clausii ¿Qué información nos da infoseq?

3. Navega por cualquiera de los archivos *.ptt que descargaste en el inicio del tutorial. Escoge un gen favorito, el que sea, que por anotación te llame la atención. Para navegar usa cat, less, more o gedit.

4. En tu gen favorito, la primer columna representa las coordenadas en las que se encuentra en un genoma. Con el programa seqret genera un archivo fasta de tu gen solamente. Ayuda para seqret aquí (http://emboss.sourceforge.net/apps/cvs/emboss/apps/seqret.html).

Pista:

Puedes usar los calificadores -auto -stdout

5. Con el archivo de tu gen favorito, en formato fasta, utiliza el programa sixpack y:

1. ¿Qué información da la salida de sixpack?
2. ¿Dime para qué sirve sixpack?

6. Usa el siguiente comando con tu gen favorito:

plotorf -start ATG -stop TAA,TAG,TGA genfavorito.fas

Cuando te pregunte el tipo de gráfica escribe «png» (sin comillas) y da enter.

Visualiza la nueva imagen generada (eog) ¿Para qué sirve plotorf?