Anotación funcional genómica rápida a través de asignación de ortología con eggNOG-mapper

Anotación funcional genómica rápida a través de asignación de ortología con eggNOG-mapper

La identificación de los genes originados por especiación, conocidos como genes ortólogos, es una pregunta central en biología evolutiva. La teoría dice que la retención de funciones ancestrales es más probable entre genes ortólogos que entre parálogos. En este artículo, Huerta-Cepas et al. Describen una herramienta que utiliza la base de datos de ortólogos ‘eggNOG’ para la anotación rápida de secuencias nuevas usando perfiles de secuencias pre-computarizadas y asignamiento de ortología. El algoritmo consiste en
1) mapeo de secuencias: se buscan correspondencias (matches) entre la secuencia de interés y los modelos ocultos de Markov disponibles en eggNOG de ortólogos. Posteriormente, se busca la proteína para el mejor match en la base de datos eggNOG de proteinas. La secuencia del best match se utiliza posteriormente como semilla para buscar más ortólogos.  Estos pasos se llevan a cabo con el algoritmo HMMER. El software implementa oltro algoritmo, más rápido pero menos sensible, DIAMOND.
2)Asignación de ortología a partir de árboles filogenéticos preánalizados y disponibles en eggNOG
3) Anotación funcional restringida a los ortólogos taxonómicamente más cercanos.
Los autores compararon el método con otros dos métodos, Blast e InterProScan. EggNOG-mapper detectó mayor cantidad de ortólogos y de manera más precisa que BLAST aún con un umbral de E-value muy estricto (E-40). EggNog obtuvo la misma cantidad baja de falso positvos que InterPeoScan y aumentó la calidad de las anotaciones. EggNOG corre más rápido que ambos programas.

emapper workflow

emapper workflow

Fast genome-wide functional annotation through orthology assignment by eggNOG-mapper
Jaime Huerta-Cepas, Kristoffer Forslund, Damian Szklarczyk, Lars Juhl Jensen, Christian von Mering, Peer Bork
bioRxiv 076331; doi: http://dx.doi.org/10.1101/076331