Clasificación de secuencias a partir de medidas dependientes e independientes de alineamiento

Clasificación de secuencias a partir de medidas dependientes e independientes de alineamiento

Este modelo, propuesto por Borozan, Watt y Ferreti, integra la información que aporta cada una de una serie de medidas de similitud de secuencias; algunas de ellas dependientes de alineamiento y otras independientes de alineamiento. Dado que algunas medidas son más informativas según las secuencias que se están analizando, este modelo pondera cada medida según la información que provee. Los autores prueban su modelo usando cinco medidas de similitud con distintos conjuntos de datos y lo comparan con otras estrategias de clasificación y demuestran que en algunos casos, la precisión es mayor. Finalmente señalan que el modelo es extensible a otras medidas de similitud.

Borozan, I., Watt, S., & Ferretti, V. (2015). Integrating alignment-based and alignment-free sequence similarity measures for biological sequence classification. Bioinformatics, btv006.