Buscando patrones de evolución genómica en arqueas
Wolf y compañía evaluaron un modelo de evolución genómica basándose en un conjunto de principios dados por comparaciones de genomas procariontes:
1- existe un número muy reducido de genes universales, 2- del 10 al 30% de los genes en la mayoría de los genomas microbianos son ORFan (presentes en pocas especies emparentadas), 3- los genes restantes presentan conservación intermedia con una distribución en parches, 4- la sintenia rara vez se conserva más allá del nivel del operón y 5- la conservación del contenido genético decae de manera monotónica con la similitud en secuencia de los genes universales.
Los autores se preguntan si los genes ORFan son simplemente genes que evolucionan de manera rápida y si es posible explicar el contenido genético y el orden genómico dentro de un mismo modelo. Los datos biológicos usados en este trabajo fueron 166 genomas completos de arqueas y una filogenia de estos inferida a partir de un concatenado de proteínas ribosomales. Este modelo tiene dos parámetros principales, que son la tasa de recambio y la tasa de barajeo, y se ajustó simulando la evolución de un genoma modelo ancestral de 2000 genes, cada uno con su propia probabilidad de ser sustituído y de ser barajado. Este genoma se fue «desplazando» a lo largo de la filogenia, sufriendo cambios (reemplazamiento y/o barajeo) cada cierta longitud del árbol y generando dos genomas en cada bipartición. La simulación concluye con 166 genomas simulados y posteriormente se calcula una matriz de similitud de contenido genético y de orden genómico de todos los genomas, todos contra todos. Esta simulación se repitió cien (o mil) veces y cada matriz de similitud se comparó con la matriz de similitud de los genomas reales, calculando cada vez la verosimilitud de los datos dado el modelo. Los autores comenzaron con un modelo neutral de referencia en la cual todos los genes tenían la misma probabilidad de ser sustituidos. Posteriormente se usó una distribución exponencial truncada de probabilidades de reemplazo y se encontró que la verosimilitud mejoró de manera dramática cuando se tenían pocos genes que tenían alto recambio y muchos otros con evolución más lenta. Esta observación llevó a los autores a generar un nuevo modelo en el cual existe una segunda clase de genes de recambio instantáneo, los cuales serían sustituidos en cada evento de evolución. Este nuevo modelo describió mucho mejor los datos reales y el mejor valor para la proporción de los genes de recambio instantáneo fue del 12%, lo cual se aproxima al 8% de genes sustituidos entre genomas cuyos genes ribosomales han divergido en 2%. Una vez que los autores encontraron estas dos clases de genes, se preguntaron si esta clasificación es suficiente para explicar los cambios en orden genómico ajustando la tasa de barajeo a cero y encontraron que esto no se ajusta a los datos reales. Por otro lado, cuando definieron la tasa de barajeo en función de la tasa de recambio, el modelo mejoró en verosimilitud, lo cual se explica por la presencia de operones en los genomas reales. La clase de genes de recambio instantáneo bien podría corresponder a los genes ORFan y su evolución probablemente está mediada por los mecanismos de adquisición, recombinación y pérdida de DNA. Esto concuerda con observaciones de que los genes ORFan se obtienen de elementos genéticos móviles y rara vez aportan a la adecuación del organismo. Finalmente Wolf y compañía estiman la existencia de hasta 2 mil millones de genes ORFan únicos en procariontes. En este trabajo se presenta un modelo relativamente sencillo (4 parámetros) para explicar la evolución del contenido genético y orden genómico en arqueas.
Wolf, Y. I., Makarova, K. S., Lobkovsky, A. E., & Koonin, E. V. (2016). Two fundamentally different classes of microbial genes. Nature Microbiology, 2, 16208.