Un nuevo algoritmo semi supervisado para la asignación taxonómica de lecturas metagenómicas.
Este algoritmo, llamado SeMeta, agrupa las lecturas metagenómicas por empalme y por cada grupo, asigna una serie de lecturas de referencia, las cuales serán las únicas utilizadas como secuencias problema para llevar a cabo la búsqueda de homólogos en bases de datos. Los hits de cada búsqueda son filtrados por bit-score y por sus frecuencias relativas de entre los hits del mismo conjunto de secuencias de referencia. Finalmente usa el algoritmo Lowest Common Ancestor para buscar el taxón más bajo de las secuencias restantes. Los autores comparan el desempeño de SeMeta con MEGAN y SOrt-ITEMS utilizando sets de datos tanto simulados como reales y muestran que su algoritmo tiene un desempeño similar al de otros algoritmos pero con un costo de cómputo sustancialmente menor.
Van Le, V., Van Tran, L., & Van Tran, H. (2016). A novel semi-supervised algorithm for the taxonomic assignment of metagenomic reads. BMC bioinformatics, 17(1), 1.