Bioinformática ejercicio 11 septiembre
Modelos ocultos de Markov
- Consulta el manual de HMMEr:
http://eddylab.org/software/hmmer3/3.1b2/Userguide.pdf
Describe las funciones relacionadas a hmmer:
hmmalign hmmconvert hmmlogo hmmscan hmmstat
hmmbuild hmmemit hmmpgmd hmmsearch
hmmc2 hmmfetch hmmpress hmmsim
Genera un modelo oculto de markov con el alineamiento generado la semana pasada (ejercicio 3) en hmmer
- Cuando tengas el alineamiento y el modelo oculto de markov, sube el modelo generado al siguiente servidor:
Descarga el archivo PNG generado
Contesta:
¿Qué residuos pueden ser los más relevantes y en qué posición del alineamiento se encuentran?
- Descarga el genoma de Cupriavidus metallidurans (ftp://ftp.ncbi.nlm.nih.gov/genomes/refseq/bacteria/Cupriavidus_metallidurans/representative/GCF_000196015.1_ASM19601v1/GCF_000196015.1_ASM19601v1_protein.faa.gz) y utiliza el modelo de markov que generaste en (1) para encontrar proteínas de esa familia.
Contesta:
¿Cuántas proteínas de tu familia encontraste en Cupriavidus metallidurans?
¿La frecuencia de estas proteínas en Cupriavidus metallidurans es distinta a la frecuencia en los genomas de Agrobacterium?
Búsqueda de ortólogos por mejor acierto recíproco
- Obten una lista de aciertos recíprocos entre 2 pares de genomas de Agrobacterium y posteriormente la lista de aciertos entre un genoma de Agrobacterium y Cupriavidus metallidurans. ¿Cuántos aciertos recíprocos encontraste en cada comparación?¿Existe algún patrón con respecto a la biología de los organismos?
Opcional: Recrea la figura 5(b) del artículo de Pushker de familias de proteínas de 2004 con el par de genomas que quieras.