Ejercicio de predicción de genes, bioinformática 2017
Predicción de genes codificantes
Ejercicio
1. Lee el artículo de Glimmer: https://ccb.jhu.edu/papers/glimmer2.pdf
2. Busca, que es un modelo interpolado de Markov
3. Selecciona un archivo fna (de Agrobacterium) de un cromosoma y corre la predicción de genes.
Baja el siguiente script en la carpeta en la que estes trabajando:
https://drive.google.com/file/d/0B7dtIr9rg974M25Wb3Zndkt6QkU/view?usp=sharing
Cambia sus permisos a ejecutable:
$chmod +x g3-from-scratch.csh
Ejecuta el script con el archivo de un genoma (fna)
$./g3-from-scratch.csh GENOMA.fna prefijo
prefijo= cualquier nombre que quieras que tengan los archivos
Este script hace los siguientes pasos:
long-orfs -n -t 1.15 genom.seq run1.longorfs
extract -t genom.seq run1.longorfs > run1.train
build-icm -r run1.icm < run1.train
glimmer3 -o50 -g110 -t30 genom.seq run1.icm run1
A partir del manual https://ccb.jhu.edu/software/glimmer/glim302notes.pdf
Responde:
¿Qué es cada paso?
¿Qué archivos se generan?
Ahora, hay múltiples formas de hacer esto, instala prodigal en tu computadora:
$sudo apt-get install prodigal #si te pide password es estudiante el que está predeterminado en la distro.
Luego ejecutalo, lo siguiente es un ejemplo:
$prodigal -a agro.faa -d agro.fna -s agro.genes.scores -i cromosoma.fas
¿Qué le estoy pidiendo a prodigal, con la línea anterior?
¿Qué archivos se generan?
Genera traducciones de los ORFs posibles con algún programa (de tu elección de emboss)
Abre el genoma que seleccionaste con el programa artemis (ya instalado):
$artimis genoma.fas #es un ejemplo
Busca que te genere los ORFs con un tamaño mínimo de 100
Del genoma que seleccionaste de Agrobacterium sp., abre el archivo genebank (*.gbk) con el programa (ya instalado) artemis:
$artemis agrobacterium.gbk #es otro ejemplo
Ahora tienes traducciones y predicciones de novo de genes del genoma con glimmer, prodigal, emboss y artemis. En el caso del último archivo que abriste es la anotación «oficial» del genoma.
Menciona e ilustra que pasos y programas utilizarías para obtener los genes predichos que coincidan entre los ORFs, glimmer, artemis y prodigal. ¿Es mucha la diferencia con los archivos de aminoácidos predichos en el archivo faa del genoma que utilizaste?