Bioinformática 9 de octubre. Anotación

Bioinformática 9 de octubre. Anotación

1. A partir de los resultados del ejercicio de agrupamiento en familias de proteínas de una de las especies de Agrobacterium (28 de agosto), reproduce la figura 9 del artículo de Pushker et al., 2004. Realiza la anotación con las base de datos de COG (https://drive.google.com/file/d/0B4yYJADlEqTndnBfV1Y3akI4QjQ/view?usp=sharing) utilizando como criterio de corte 30% de identidad y 70% de longitud de alineamiento entre la secuencia problema y la base de datos.

2. Utilizando las secuencias de proteínas predichas por Glimmer y Prodigal del ejercicio de predicción de genes codificantes (26 de septiembre), realiza la anotación contra la base de datos de COG empleando los mismos criterios de corte de la pregunta anterior. Describe los resultados y las diferencias que encuentras entre las anotaciones de ambos juegos de datos.

3. Realiza la anotación de las proteínas predichas por Prodigal con la base de datos de KEGG. Para esto visita la página web de BlastKoala (http://www.kegg.jp/blastkoala/) en donde se puede hacer la anotación en un servidor en línea. Compara los resultados que obtienes usando KEGG y COG. ¿Qué diferencias encuentras y qué tipo de información obtienes en cada caso?

Aquí puedes encontrar un archivo con un ejemplo para hacer las búsquedas de los identificadores contra los COGs. https://drive.google.com/file/d/0B4yYJADlEqTncDVWRDZCdmRLWFE/view?usp=sharing

Detalla los procedimientos que seguiste para llegar a los resultados. Utiliza capturas de pantalla para mostrar los resultados que obtienes en BlastKoala.