Bioinformática práctica 27 octubre

Bioinformática práctica 27 octubre

Anotación.

El objetivo de la práctica del día de hoy será generar la anotación de las predicciones de genes de los ejercicios anteriores (Glimmer), si no puedes usar el archivo ffn concatenado de cromosoma + plásmidos, con la base de datos del COG (Cluster of Orthologous Groups). Además de usar lo ya aprendido con cd-hit, el objetivo es generar esta figura con la especie que elijas de Agrobacterium:

 

 

Proportions of assigned functions among genes belonging to families and singletons in B. subtilis and E. coli K12. Gene functions were assigned according to the Cluster of Orthologous Genes (COGs) classification [41]. Extended gene families are considered, in which a gene belongs to a single family only (see Materials and methods).

Published online 2004 Mar 18. doi:  10.1186/gb-2004-5-4-r27
La base de datos para anotar la puedes descargar de la siguiente dirección:
El criterio mínimo de corte es 30% de identidad y un 70% de longitud de alineamiento entre la secuencia problema y la base de datos.
Detalla el procedimiento para hacer el ejercicio y súbelo a la siguiente dirección: