Descubriendo el potencial de la metagenómica a través de distintos diseños experimentales
Los primeros trabajos de metagenómica enfocados a estructura y función de comunidades microbianas de distintos ambientes dieron indicios del potencial de esta tecnología para detectar genes funcionales, interacciones y filotipos que no habían sido descritos. Sin embargo, con el paso del tiempo se han identificado desventajas, entre las que se encuentran la escasez y estandarización de metadatos de las muestras, presencia de genes sin identificar, dificultades para integrar y comparar resultados entre laboratorios y la subestimación de diversidad microbiana en muestras complejas. Esta última ha intentado solucionarse incrementando la profundidad de secuenciación en unas cuantas muestras para obtener información sobre taxa y genes raros. A pesar de esta ventaja, incrementar la profundidad de secuenciación en un número reducido de muestras genera otro tipo de problemas, ya que no es posible realizar análisis estadísticos significativos de los patrones observados y los patrones de co-ocurrencia y los factores bióticos y abióticos que estructuran a las comunidades no son tan sencillos de determinar. La decisión de secuenciar pocas muestras con gran profundidad o muchas muestras a baja profundidad depende enteramente de la pregunta que se busque responder. Una secuenciación profunda es necesaria para observar miembros de la comunidad microbiana que no son muy abundantes, mientras que realizar secuenciación menos profunda permite explorar la dinámica de las comunidades para entender el funcionamiento de ecosistemas, ya que los microorganismos dominantes en una muestra son aquellos que juegan un papel fundamental bajo condiciones ambientales normales.
Existe una tercera opción en la que se integran las dos profundidades de secuenciación: realizar secuenciaciones menos profundas de un gran número de muestras permite establecer qué muestras valdría la pena secuenciar de manera más profunda, pudiendo obtener un panorama de la información biológica mucho más completa. Obtener información detallada de una única muestra tomada bajo condiciones específicas en un instante determinado genera información de un momento y contexto particulares del sistema. En cambio, si se obtuviesen datos de más muestras, aunque se analicen a distintas profundidades de secuenciación, se podría reconstruir la dinámica temporal y la variación en la composición de la comunidad.
Es importante evitar el enfoque en el que se secuencia todo simplemente porque es posible. La hipótesis debe guiar la selección de las muestras más apropiadas para ser secuenciadas y a qué profundidad debe realizarse. En términos generales, deben ser muestras que cuenten con metadatos y que tengan el potencial de dilucidar nuevo conocimiento. Cabe mencionar que con la mayoría de los estudios, un incremento en el número de muestras influye en el poder analítico, ya que da la capacidad de correlacionar información con parámetros biológicos (parámetros ambientales que contextualizan a las secuencias). Es por esto que contar con un método que integre resultados recolectados sistemáticamente de proyectos a gran escala (Earth Microbiome Project, Global Ocean Survey, etc) y los resultados de diversos grupos de investigación permitirá que en un futuro se puedan realizar analogías a nivel temporal y geográfico.
Referencia: Knight, R., Jansson, J., Field, D., Fierer, N., Desai, N., Fuhrman, J., Hugenholtz, P., van der Lelie, D., Meyer, F., Stevens, R., Bailey, M., Gordon, J., Kowalchuk, G., Gilbert, J. (2012) Unlocking the potential of metagenomics through replicated experimental design. Nature biotechnology. 30, 6: 513-520.