lectura martes 29 de abril
Pongan aquí sus comentarios
Edificio A Segundo Piso Laboratiorio de Biología Molecular y Genómica Facultad de Ciencias Universidad Nacional Autónoma de México 04510 Coyoacán Ciudad de México
lalcaraz [at] ciencias.unam.mx +52 55 5622-8222 ext. 44704
Agradecemos el financiamiento a nuestros proyectos: DGAPA-PAPIIT-UNAM IN221420; TA2001171 y SEP-CONACyT Ciencia Básica 237387
© 2025 Laboratorio de Genómica Ambiental, Facultad de Ciencias, Universidad Nacional Autónoma de México. Creado usando WordPress y el tema Mesmerize
2 comentarios
La revisión de McCormak profundiza en los retos que han tenido la Filogenética y la Filogeografía en el avance de metodologías genómicas, las necesidades a las que se han adecuado estos campos de estudio según la pregunta biológica, el sistema, y la escala temporal con la que se trabaje.
Los estudios poblacionales y los modelos que suelen plantearse en la filogenética y la filogeografía suelen no abarcar la secuenciación de genomas completos de muchos individuos sino acotar el análisis a las regiones genéticas a las zonas mas informativas, regiones homólogas o de regiones con mucha variación. Sin embargo, ahora con la masividad para encontrar marcadores genéticos que ofrece la genómica, sean propiciado avances que mejoran la resolución de los trabajos científicos, se disminuyan los costos, y también se afinen las resoluciones temporales.
En estos dos campos de la genómica los avances no pueden ser aplicados de la misma manera pues mientras que para la filogeografía sean utilizado estrategias de marcaje y de tipo “multiplex”, para diferenciar las procedencias en las muestras, en donde se procura la inserción de adaptadores que las distingan en la misma corrida de NGS, a partir de marcadores SNP’s. Para las construcción filogenéticas a partir de marcadores como SNP’s no suelen brindar suficiente información para la reconstrucción evolutiva puesto que no demuestran la variación de alelos completos de los genes. O que la detección de marcadores quede sesgada desde el planteamiento genómico previo, debida a la condición del muestro o la aleatoriedad de la secuenciación.
Las estrategias metodológicas mas comúnmente seguidas en estos campos de estudio son:
1) la secuenciación en multiplex o la secuencia preferencial de amplicones, en donde se requiere un análisis de secuenciación precedente, implicando que habrá un trade-off entre la cobertura y la amplificación del mismo locus en los distintos individuos (o distintas poblaciones o distintas especies)
2)Secuenciación basada en la digestión de fragmentos, representan oportunidades económicas, extendiendo la disponibilidad de marcadores en organismos no modelo. Sin embargo, la técnica no siempre puede ser reproducida con los mismos resultados, y ahí una alta incidencia para encontrar alelos nulos debida a la mutación de en los sitios de restricción.
3) Marcaje y enriquecimiento selección e hibridación de fragmentos específicos de gDNA o bien, secuenciación y captura de regiones altamente conservadas
Es importante reconocer que los retos de análisis y las diferencias entre los métodos “tradicionales”, la determinación de regiones informativas la selección de genes homólogos, la detección de parálogos, genes de copia única, que es visible en NGS hasta la alineación del genoma, y que depende del mecanismo de obtención de la muestra, los niveles de expresión y la cobertura del método de secuenciación.
La estructuración y el manejo de datos también representa un punto de quiebre para cualquier análisis genómico, descartar un porcentaje de datos y decidir la calidad mínima de las regiones hace más solido el estudio, así como el análisis de datos adecuado para los datos asociado a los requisitos bio-informáticos necesarios.
Los anteriores estudios sobre filogenética y filogeografía, se han basado en el uso de uno o más marcadores moleculares, ahora con la secuenciación de nueva generación (NGS) se ha abierto la posibilidad de plantear hipótesis con genomas. Sin embargo la incorporación de la NGS en las investigaciones de filogenética y filogeografía es mínima, esto podría deberse a que estos estudios no se hacen en organismos modelos, o a que se necesitan varias secuencias por ejemplar por especie, a que no existe consenso en los protocolos y la transición a esta tecnología. En el este artículo hablan de diferentes puntos que se tienen que tener en cuenta para trabajar con NGS en temas de filogeografía y filogenética. Los retos que los autores identifican son: 1) la aplicación de regiones homólogas del DNA para los individuos; 2) costos del multiplex y la preparación de las librerías; 3) el uso de los árboles de genes en filogeografía y filogenética.
Existen estudios en organismos no modelos, de los cuales se busca amplificar loci encontrados en los organismos modelos, lo que se conoce como parallel tagged sequencing. Para ello podría ser empleada la PCR multiplex, aunque tiene la desventaja de tener secuencias quimeras y tener parcialmente representados a algunos productos de PCR. Sin embargo la parallel tagged sequencing sigue siendo de lo más redituable, por lo que mencionan que es mejor generar tags multiplex para las NGS. Existe la secuenciación RAD (Restriction-site Associated DNA) que funciona también con enzimas de digestión y se cortan las bandas directamente del gel, pero la diferencia de otras técnicas es que tiene el control de los fragmentos con secuenciación ultraprofunda (ultra-deep) en muchos individuos. Esta tecnología sólo la maneja la plataforma Illumina.
Además, existe un método llamado Target enrichment, el cual implica que el DNA genómico fragmentado es mezclado con DNA y RNA, lo que genera fragmentos de DNA híbrido en arreglos o solución; el DNA de interés es eludido y secuenciado por NGS. Sin embargo, tiene un costo alto pues tiene que correrse pruebas, pero tiene la ventaja de seleccionar el tamaño del fragmento fácilmente, además de poder ensamblar secciones para generar largos contigs. Una vez que se hacen los contigs, miles de loci independientes pueden ser usados para realizar árboles de genes, aunque se necesitaría de una gran capacidad computacional.
Una vez que se empiezan a procesar las secuencias provenientes de NGS, deben ser eliminadas las secuencias de mala calidad. En seguida deben removerse los primers o taggs que flanquean los fragmentos, pues pueden contener errores. Después se alinean usando alguno de los dos métodos existentes, el que usa una secuencia de referencia o haciendo un alineamiento de novo, es decir sin secuencia de referencia. La mejor opción es esta última pero se necesita de excelentes recursos computacionales, mientras que el alineamiento con secuencia de referencia es más rápido. En caso de no contar con secuencia de referencia, existen programas de agrupamiento. El último paso para tener datos que se puedan usar para análisis filogenético y/o filogeográficos es genotype calling. Este consta de llamar dos alelos (diploide) de todas las lecturas de los SNPs o locus de acuerdo a los valores de threshold.
Debido a que los estudios filogeográficos y filogenómicos están basados en SNPs, las herramientas para analizarlos son PCA, o Structure para filogeografía, o métodos de distancia para filogenética. De esto ellos concluyen que los datos generados por NGS pueden ser utilizados para los árboles de genes, para comprobar hipótesis demográficas, por ejemplo el flujo génico.
Mencionan que deben empezar a incoporarse los análisis de recombinación en las inferencias filogenéticas. Que los softwares empleados para análisis filogenéticos y de genética de poblaciones necesiten escalarse a poder manejar cientos de loci en un marco de tiempo razonable. Y finalmente, dicen que prácticamente las limitaciones para usar NGS no es tecnológico, sino la habilidad de los laboratorios para adoptar estas nuevas tecnologías.
Los comentarios están cerrados.