Bioinformática ejercicio 11 septiembre

Bioinformática ejercicio 11 septiembre

Modelos ocultos de Markov

  1. Consulta el manual de HMMEr:

http://eddylab.org/software/hmmer3/3.1b2/Userguide.pdf

Describe las funciones relacionadas a hmmer:

hmmalign hmmconvert hmmlogo hmmscan hmmstat

hmmbuild hmmemit hmmpgmd hmmsearch

hmmc2 hmmfetch hmmpress hmmsim

Genera un modelo oculto de markov con el alineamiento generado la semana pasada (ejercicio 3) en hmmer

  1. Cuando tengas el alineamiento y el modelo oculto de markov, sube el modelo generado al siguiente servidor:

http://skylign.org/

Descarga el archivo PNG generado

Contesta:

¿Qué residuos pueden ser los más relevantes y en qué posición del alineamiento se encuentran?

  1. Descarga el genoma de Cupriavidus metallidurans (ftp://ftp.ncbi.nlm.nih.gov/genomes/refseq/bacteria/Cupriavidus_metallidurans/representative/GCF_000196015.1_ASM19601v1/GCF_000196015.1_ASM19601v1_protein.faa.gz) y utiliza el modelo de markov que generaste en (1) para encontrar proteínas de esa familia.

Contesta:

¿Cuántas proteínas de tu familia encontraste en Cupriavidus metallidurans?

¿La frecuencia de estas proteínas en Cupriavidus metallidurans es distinta a la frecuencia en los genomas de Agrobacterium?

 

Búsqueda de ortólogos por mejor acierto recíproco

  1. Obten una lista de aciertos recíprocos entre 2 pares de genomas de Agrobacterium y posteriormente la lista de aciertos entre un genoma de Agrobacterium y Cupriavidus metallidurans. ¿Cuántos aciertos recíprocos encontraste en cada comparación?¿Existe algún patrón con respecto a la biología de los organismos?

Opcional: Recrea la figura 5(b) del artículo de Pushker de familias de proteínas de 2004 con el par de genomas que quieras.