Posgrado: Emboss 2, Pfam y HMM

Posgrado: Emboss 2, Pfam y HMM

1. A partir del ejercicio anterior, en el archivo .ptt con la ayuda de grep identifica a todos los genes anotados como transportador ABC (ABC transporter).

2. Utilizando el comando seqret, de emboss encuentra la forma de hacer un archivo multifasta con todos los transportadores ABC del genoma predicho. Pistas, se utilizan las coordenadas de los genes, el archivo del genoma (fna), el comando grep, ojo con la orientación de la secuencia.

Si tienes duda de como usar seqret aquí esta el manual:

http://variome.bic.nus.edu.sg/cgi-bin/emboss/help/seqret

3. Con seqret selecciona una de las secuencias de transportador ABC y guárdala en un archivo fasta nuevo.

4. Con el programa sixpack de emboss encuentra el marco de lectura donde pienses que se encuentre la proteína identificada de este transportador ABC.

5. ¿De que tamaño son, en promedio los orfs encontrados por sixpack?

6. Determina si hay alguna forma de filtrar la cantidad de orfs posibles con el comando getorf, ¿Qué línea de comando tendríamos que utilizar para obtenerlo? Justifica tu respuesta

7. Utilizando seqret obten todas las proteínas anotadas como transportador ABC del proteoma predicho (*.faa)

8. ¿Cuántas proteínas hay en el archivo fasta?

9. En el nuevo archivo con las proteínas de los transportadores ABC, utiliza el comando cdhit de la siguiente forma:

cdhit -i ENTRADA -c 0.4 -n 2 -o SALIDA

¿Qué archivos se generan? ¿Qué contiene cada uno de los archivos? ¿Qué se controla con los calificadores -c y -n?

10. A partir del archivo generado con cdhit que contiene secuencias, escoge una y copiala, en esta página:

http://pfam.sanger.ac.uk/search/sequence

Haz una búsqueda con los parámetros default,

en la primer pantalla de resultados, escoge que te enseñe el alineamiento:

Significant Pfam-A Matches
Show alignments

¿Qué se observa?

11. Da click en la familia que identificó. Explora la página. ¿Que información te proporciona la página?

12. En el menú de la izquierda, da click al link HMMLogo, ¿Qué muestra el enlace?