11 de marzo: The Sorcerer II Global Ocean Sampling Expedition: Northwest Atlantic through Eastern Tropical Pacific
http://www.plosbiology.org/article/info%3Adoi%2F10.1371%2Fjournal.pbio.0050077
Abstract:
The world’s oceans contain a complex mixture of micro-organisms that are for the most part, uncharacterized both genetically and biochemically. We report here a metagenomic study of the marine planktonic microbiota in which surface (mostly marine) water samples were analyzed as part of the Sorcerer II Global Ocean Sampling expedition. These samples, collected across a several-thousand km transect from the North Atlantic through the Panama Canal and ending in the South Pacific yielded an extensive dataset consisting of 7.7 million sequencing reads (6.3 billion bp). Though a few major microbial clades dominate the planktonic marine niche, the dataset contains great diversity with 85% of the assembled sequence and 57% of the unassembled data being unique at a 98% sequence identity cutoff. Using the metadata associated with each sample and sequencing library, we developed new comparative genomic and assembly methods. One comparative genomic method, termed “fragment recruitment,” addressed questions of genome structure, evolution, and taxonomic or phylogenetic diversity, as well as the biochemical diversity of genes and gene families. A second method, termed “extreme assembly,” made possible the assembly and reconstruction of large segments of abundant but clearly nonclonal organisms. Within all abundant populations analyzed, we found extensive intra-ribotype diversity in several forms: (1) extensive sequence variation within orthologous regions throughout a given genome; despite coverage of individual ribotypes approaching 500-fold, most individual sequencing reads are unique; (2) numerous changes in gene content some with direct adaptive implications; and (3) hypervariable genomic islands that are too variable to assemble. The intra-ribotype diversity is organized into genetically isolated populations that have overlapping but independent distributions, implying distinct environmental preference. We present novel methods for measuring the genomic similarity between metagenomic samples and show how they may be grouped into several community types. Specific functional adaptations can be identified both within individual ribotypes and across the entire community, including proteorhodopsin spectral tuning and the presence or absence of the phosphate-binding gene PstS.
12 comentarios
Hoy en día los estudios metagenómicos se han convertido en una poderosa herramienta para poder conocer la diversidad de organismos que existen en la naturaleza, muchos de los cuales, refiriéndonos a microorganismos, habían pasado desapercibidos en buena medida por la incapacidad de ser crecidos en laboratorio. En este estudio lo que se nos presenta es el análisis de distintos metagenomas obtenidos principalmente de muestras de agua marina, muestreados en distintos puntos de los océanos Atlántico y Pacífico.
Uno de los puntos importantes de este trabajo es que nos describen paso a paso las distintas fases del trabajo desde el momento de la colecta hasta la comparación entre los distintos metagenomas, pasando por el ensamble y la asignación de funciones. Esta parte creo yo es importante pues nos permite conocer la manera en que este tipo de información era curada, procesada y analizada, pues actualmente con la existencia de distintos servidores que nos permiten analizar de manera automatizada nuestros datos, muchas veces esta parte se olvida.
Uno de los ejemplos más claros de esto fue la comparación pareada que se hizo de los metagenomas. Servidores como MG-RAST permiten realizar este tipo de comparaciones pero hay que recordar que éste no salió si no hasta el año 2008, varios años después de que concluyeron los muestreos de este trabajo. Una de las similitudes que se pueden observar entre el análisis realizado aquí y los hechos por MG-RAST es la formación de “clusters”, en este caso uno a priori basados en el origen de la muestra (templado o tropical) y otro después de analizarlos en el cual se encontraron similitudes respecto a la salinidad y la temperatura. La importancia de este tipo de análisis comparativos es que ayudan a explicar las diferencias entre las comunidades, ya sea tanto a nivel de especies encontradas o de contenido de genes.
Otro de los puntos en los que los autores se enfocan, es en lo que respecta a la presentación y colecta de datos, pues ellos proponen que el diseño de ensambladores de metagenomas debe considerar tanto el uso de los metadatos como el poder utilizar información presente en distintas fuentes. Estos dos puntos nuevamente los podemos encontrar en el MG-RAST. Adicionalmente está la descripción de las dos metodologías utilizadas, la denominada “reclutamiento de fragmentos” que está enfocada a responder preguntas en cuanto a la estructura, evolución y taxonomía del genoma, y el “ensamble extremo” que permite el ensamblaje de segmentos más largos de organismos no clonales, lo cual nos muestra la importancia de qué tan estrictos somos al establecer nuestros parámetros.
Creo que si la información presente en este metagenoma fuera analizada nuevamente hoy en día con las herramientas actuales sería un buen ejercicio, pues como los mismos autores señalan, una de las principales limitantes en su momento fue la falta de una colección apropiada de secuencias referencias y genomas, colección que se ha visto incrementada de manera importante desde la publicación de este artículo.
Control de Lectura.
No es sólo el hecho contundente de que la diversidad microbiana es increíblemente mayoritaria en los océanos y que sean la forma de vida más abundante, así como reconocer que su importancia ecológica es mayúscula, sino que hay un aspecto que resulta muy interesante: cuál es la relación entre la diversidad genética y la diversidad bioquímica o fisiológica. Por ejemplo, dos organismos que tengan un 97% de identidad en el gen 16S rARN, pueden al mismo tiempo, tener grandes diferencias en su fisiología, bioquímica y contenido del genoma.
El proyecto metagenómico de este proyecto aborda estas cuestiones relacionadas con la diversidad genética y bioquímica de los microorganismos.
Algunos datos: de agosto del 2003 hasta mayo del 2004, se colectó a lo largo de 8000 Km a lo largo de la costa del Atlántico Norte, a través del Canal de Panamá y terminando en el Pacífico Sur; se secuenciaron 7.7 millones de “reads”, 6.1 millones de proteínas y 1.2 millones de nuevos genes de 41 muestras diferentes; se desarrollaron nuevos métodos bioinformáticos para analizar los datos.
Los métodos son:
a) “Incorporación de fragmentos” (“fragment recruiment”). Se analizó la variación genómica y geográfica usando un genoma de referencia (cuando existía, lo cual es la principal limitante). Es un método de comparación genómica.
b) “Ensamblaje extremo”. Existe una variación conflictiva entre organismos relacionados que perturba el ensamblaje de los genomas completos. Este enfoque es una forma de presentar porcentajes de identidad gráficamente. Lo que entiendo es que para solventar el problema de la falta de genomas de referencia para la incorporación de fragmentos, estos fueron construidos con el ensamblaje extremo. También tiene el problema de que se pueden formar quimeras, sin embargo estas pueden ser detectadas; en general este método permitió el ensamblaje y reconstrucción de grandes segmentos de organismos no clonales.
c) “Comparación de metagenomas completos”. Para la comparación de la similitud genética promedio entre dos muestras, se implemento el “market-less” y “overlap-based comparison”. Es una técnica que usa secuencias de 16S.
Lo que más llama mi atención del estudio, es que a pesar de la increíble cantidad de información generada, los resultados indican aún el inicio o el delineamiento de la comprensión del monto y la estructura de la variación en las comunidades microbianas y cómo se relaciona esta con la filogenia y el ambiente. Varias preguntas se han generado como resultado de este trabajo.
Control de lectura 22
The Sorcerer II Global Ocean Sampling Expedition: Norwest Atlantic Through Eastern Tropical Pacific Rusch D., Halpern A., Sutton G., Heidelberg K., Williamsob S., Shibu Y., Wu D., Einsen J.,Hoffman J., Remington K., Beeson K., Tran B., Smith H., Baden-Tillson H., Steward C., Thorpe J., Freeman J., Andrews-Pfannkoch C., Venter J., Li K., Kravitz S., Heidelberg J., Utterback T., Rogers Y., Falcon L., Souza V., Bonilla-Rosso G., Eguiarte L., Karl D., Sathyendranath S., Platt T., Bermingham E., Gallardo V., Tamayo-Castillo G., Ferrari M., Strausberg R., Nealson K., Friedman R., Frazier M., Venter J., C. (2007). The Sorcerer II Global Ocean Sampling Expedition: Norwesth Atlantic through Eastern Tropical Pacific. 5(3) 399-431. Plos Biology.
Este tipo de expediciones inició años atrás con la expedición al mar de los Sargasos (Atlántico Norte), donde se muestrearon diferentes puntos y se hizo el análisis metagenómico de ese lugar. En este artículo se llevó a cabo un estudio similar pero en esta ocasión en el Atlántico al Noroeste, parte del Caribe, pasando por el canal de Panamá hasta algunos puntos del Pacífico Sur. Es impresionante la escala a la que llevan los estudios para conocer más acerca de las comunidades de microorganismos en el planeta. La cantidad de recursos de la que disponen es increíble. Una importante parte de lo que se hizo es la comparación de datos metagenómicos con datos genómicos de organismos con genomas secuenciados disponibles provenientes del mar de los Sargasos. Los fragmentos de las muestras mostraron reclutamiento con alto porcentaje de identidad para Prochlorococcus marinus MIT9312 (con el mayor porcentaje de identidad). Con otras cepas también se reclutaron segmentos aunque no con la misma identidad que ésta última cepa. Se mostraron patrones a manera de zig-zag en algunos casos, en otros barras verticales que pudieran ser zonas conservadas dentro del genoma. Se observó una gran variación entre las secuencias. Analizando las secuencias se observan zonas carentes de observación o “gaps”. En el genoma esas zonas si existen pues están flanqueadas por secuencias de genes, algunos de ellos funcionales. Encontraron diferentes ribotipos correspondientes a grupos taxonómicos bacterianos diversos, siendo los más abundantes los de cianobacterias entre otros. Al comparar la similitud genómica entre muestras de las localidades, a un valor de corte de 90% hay más identidad genómica entre secuencias de las diferentes muestras que si se analizara a 98% de corte. Tambien se hizo un análisis funcional de binning usando TIGRFAM hidden Markov Model.
Dado que sólo una pequeña fracción de los organismos son cultivables en laboratorio, se desconoce mucho acerca de su genética y bioquímica. Los organismos marinos no son la excepción, aun cuando se sabe de su importancia la cadena alimenticia y en procesos energéticos, muchas de sus características habían permanecido en la obscuridad. En este artículo se reporta un estudio metagenómico extensivo cuyo objetivo fue secuenciar el DNA de organismos planctónicos marinos sin necesidad de cultivarlos para develar un poco del misterio. Se tomaron 41 muestras diferentes en varios hábitats acuáticos superficiales desde el Atlántico Norte por el Canal de Panamá hasta el Pacífico Sur. Se obtuvieron 7.7 millones de reads, de los cuales el 85% pudo ensamblarse. Para realizar el análisis desarrollaron nuevos métodos de genómica comparativa (Reclutamiento de fragmentos) y de ensamblaje (Extreme assembly). Utilizando estos métodos se pudo ensamblar y reconstruir información de organismos muy abundantes pero no clonales, algunos presentaban una gran diversidad de ribotipos, en forma de gran variación en la secuencia en regiones ortólogas o islas genómicas hipervariables que no pudieron ser ensambladas, estos cambios podrían estar implicados en la adaptación de los organismos a ambientes distintos.
A pesar de que los autores contaban con una cantidad de información tremenda, fueron capaces de llegar a encontrar subtipos dentro de los metagenomas y tambien de hacer análisis filogenéticos. Todo esto fue posible gracias a la utilización de métodos ya existentes y al desarrollo de metodologías nuevas, adecuadas a este tipo de datos. Si bien este trabajo abre la puerta a qué las características genéticas y bioquímicas de los organismos marinos, quedan preguntas sin resolver como el porqué se detectan poblaciones genéticamente aisladas a pesar de la gran transferencia horizontal que podría esperarse en este contexto. El estudio de la hipervariabilidad como un factor en la innovación genética será muy importante para comprender si el desarrollo de nuevas funcionalidades se debe a ella o es sólo el reflejo de no tener suficientes metagenomas secuenciados para definir algo como raro o común.
Del recorrido realizado del Atlántico Norte al Pacífico Sur, cruzando por el Canal de Panamá, se recolectaron 44 muestras en 41 sitios y se trabajó con la fracción correspondiente a bacterias de acuerdo a tamaño. Utilizaron el Celera Assembler (originalmente diseñado para trabajar con el genoma humano y utilizado ampliamente para WGS de eucariontes) empezando con un alto grado de astringencia (98% de identidad cutoff para el traslape), sin embargo, estas condiciones dieron lugar a una falta general de ensamblados y pocos scaffolds de longitud significativa. En estos detalles es donde podemos darnos cuenta del impacto de los parámetros de corte en los resultados que esperamos obtener, como ya hemos discutido en clase. Si bien, el trabajo con condiciones laxas permite mejorar los hits, en este caso también optaron por utilizar directamente los reads para hacer las comparaciones con los genomas registrados en el NCBI (trabajo realizado en 2007, importante por el número de secuencias completas registradas hasta esa fecha). De las pocas coincidencias obtenidas se pudo apreciar una relación evolutiva lejana entre las bacterias en los metagenomas y los genomas registrados en la base de datos, así como una gran diversidad de fragmentos. De ahí surge la idea de “Recruited Reads” (y del “Extreme Assembly”) como un nuevo método, utilizando condiciones más astringentes para que la secuencia del read se aproxime más a la especie que corresponde al genoma de referencia, además de que muchas secuencias no tuvieron coincidencias. Con ello se consiguió que Pelagibacter, Prochlorococcus y Synechococcus son abundantes en diferentes muestras. Este reclutamiento de fragmentos junto con el respectivo plot parecen ser buenas herramientas para poder visualizar en conjunto los datos obtenidos de la comparación con los genomas de referencia y tener en cuenta también la metadata como la biogeografía de procedencia de las respectivas muestras, así como la variación genética, sin embargo, estará muy restringida por el número de secuencias de referencia disponibles y para el caso de microorganismos no cultivables representa una seria limitante.
Así, dentro de los objetivos planteados para este proyecto están el apreciar un mismo microorganismo puede estar presente en diferentes partes puesto que se detectaron muchos genes nuevos aunque poca diversidad. Que aunque se apreció poca diversidad en términos de definir género y especie esto se debió a que no se obtuvo mucho material para comparar (contigs o scaffolds de longitud adecuada) ni se disponía de una ilimitada base de datos de genomas de referencia. Lo que ya mete un poco de ruido a los resultados del ensamblaje y al análisis comparativo.
Otro objetivo consistía en observar cómo varían las comunidades microbianas entre las regiones oceánicas exploradas y el cómo diferentes condiciones ambientales pueden afectar a las comunidades. Para poder tener esta aproximación el trabajo considero desde el análisis de los ribotipos, la identificación de la variación estructural genética, la diversidad taxonómica, la comparación de muestras todo considerando el contexto de la metadata.
Así, dentro del análisis de la variación estructural genómica de las bacterias detectadas como más abundantes, se buscaron diferencias entre el genoma de referencia y los fragmentos de la muestra ambiental. Con esto detectaron regiones hipervariables muy distribuidas entre los microorganismos marinos y creen que es posible que esto sea debido a la transferencia horizontal de genes mediado por fagos y elementos de transposición ya que detectaron estas secuencias particulares que parecen indicar que estos eventos ocurren en estas poblaciones.
Así mismo, realizaron un análisis de la diversidad taxonómica basándose en 16S rRNA, detectando pocos ribotipos que parecen ser ubicuos y de relativa abundancia. Y también se observó que los hábitats no marinos poseen ribotipos distintos a los marinos, que parecen mantener consistencia entre regiones tropicales y templadas. En sí, los subtipos detectados poseen secuencias relacionadas estrechamente y están distribuidos en muestras con condiciones ambientales similares, aunque no son poblaciones clonales, puede que hayan adquirido sus particularidades a través de la historia y no como un evento reciente como respuesta ante algún cambio ambiental. Esta riqueza en subtipos y variantes puede contribuir a evitar que alguna clona en particular domine la comunidad o desplace a los demás miembros de ésta, además de que fomenta la recombinación. Igualmente, estas variaciones pueden ser un indicativo de la diversidad de funciones, hablando también de una relación compleja entre la comunidad. Se habla de un posible efecto “buffer”, pues esto contribuiría también a darle estabilidad a la población.
De la comparación de muestras en busca de similitudes, la aproximación utilizada fue por medio de varias secuencias del genoma, sin restringirse únicamente al 16S. Detectaron similitud entre muestras consecutivas o con cercanía geográfica, sin embargo, al parecer también son importantes los parámetros ambientales que caracterizan a la región (incluyendo salinidad, cantidad de luz, etc.).
Para el análisis de variación en la abundancia de genes, utilizaron la herramienta TIGRFAM (que permite la clasificación de secuencias de proteínas), detectando la abundancia relativa de genes, destacando la sobrerrepresentación como posible mecanismo de respuesta ante la presión ambiental. Así, también detectaron que la proteorodopsina es una familia bien representada en las muestras (abunda y está presente en todas las muestras y entre las bacterias), por lo que fue utilizada para apreciar la distribución biogeográfica de variantes (polimorfismo). Aunque no se conoce bien su papel funcional, ni se sabe la importancia del papel que tienen las proteínas homólogas presentes en la comunidad, al observar su persistencia se concluye que varios linajes contribuyen a mantener un amplio espectro de estas proteínas, la abundancia de alguna variante en particular es posible que indique la presencia alguna presión ambiental particular más que la predominancia de algún taxón. También se propel uso de otros genes core para llevar a cabo este análisis y complementar la información obtenida, como el PstS que estiman con mayor valor para el análisis evolutivo y comparativo.
Ciertamente, también se habían planteado el identificar diversidad a nivel genético y a nivel bioquímico. A nivel genético y a pesar de los infortunios debidos al manejo de toda esta monumental cantidad de información (derivada de todos los metagenomas y la complejidad de las comunidades microbianas que representan), sí consiguen identificar esta gran diversidad genética (incluso estas variaciones entre los subtipos y las islas hipervariables), sin embargo, ellos consideran aún limitante el poder llegar al nivel bioquímico para lo cual aún requieren más trabajo y mejorar o implementar nuevas herramientas de análisis.
Este trabajo de investigación dirigido por Craig Venter fue pionero para establecer diversos principios utilizados en la metagenómica actual. Su objetivo fue realizar un muestreo de agua superficial para analizar la diversidad microbiana a lo largo de un transecto del Atlántico Norte al Pacífico Sur, pasando por el Canal de Panamá. Con la extracción de DNA total y su secuenciación se genero una cantidad enorme de secuencias ambientales que ayudarían a identificar los principales grupos o clados que dominan los nichos oceánicos muestreados.
Una de las principales aportaciones de este trabajo fueron los métodos utilizados para el ensamblaje de las secuencias. Muchas de estas secuencias, junto con otras que no pudieron ser ensambladas, no se relacionaban con alguna secuencia presente en las bases de datos disponibles en ese momento, demostrando la gran diversidad microbiana que desconocía hasta ese momento. Por otro lado, al conectar la información asociada a las condiciones de muestreo (metadata) con la información obtenida del proceso de secuenciación se establecieron los principios de una nueva estrategia de análisis de genómica comparada. Una de estas estrategias permitía obtener información sobre la estructura y evolución del genoma con la diversidad filogenética de genes o familias de genes asociados a procesos bioquímicos (fragmented recruitment) y, la otra estrategia permitía la construcción de secuencias largas de organismos abundantes no-clónales (extreme assembly).
Con todo este trabajo fue posible identificar una gran diversidad de nichos microbianos en los que se encontraban grupos especializados a esas condiciones ambientales y que además mostraban un fundamento genético, por la presencia de cambios adaptativos asociados a dicha especialización. Además, con la información disponible del metadata se pudieron identificar cuáles eran las condiciones ambientales que definían dichos nichos. Con todo lo anterior, fue posible obtener un acercamiento de la gran diversidad microbiana que habita en los océanos y la identificación de diferentes adaptaciones que permiten su desarrollo bajo las condiciones ambientales tan heterogéneas.
En el artículo nos muestran el reporte de un estudio del metagenoma de la expedición del Sorcerer II Global Ocean Sampling, el cual es un estudio bastante extenso para comprender la diversidad, tanto taxonómica así como metabólica de los organismos marinos que habitan en el planeta.
Para este estudio se tomaron muestras de diversos lugares del mundo para tener un muestreo «representativo», con lo cual el equipo tendría tendría millones de secuencias para analizar.
El propósito del paper es analizar de manera detallada la diversidad existente en los océanos del mundo, en este estudio las muestras se colectaron del mar del Atlántico Norte, del Canal de Panamá y del Pacífico Sur, principalmente.
Para analizar los datos que obtuvieron del muestreo, realizaron varios análisis estadísticos para el ensamblaje.
se hicieron una gran variedad de análisis, en donde ellos analizaron la calidad de los datos obtenidos, el tamaño de los contigs, la estructura de la población yfueron capaces de determinar los géneros predominantes en los datos metagenómicos.
Determinaron también, la ribotipos más abundantes e hicieron análisis comparativos con ellos, dependiendo el lugar de muestreo.
Finalmente, ellos no solo se querían quedar en entender la diversidad taxonómica, sino que querían entender la diversidad metabólica, ya que ellos hacen hincapié en que a pesar de tener una identidad del 97% en el rRNA, la diversidad metabólica de los organismos es muy grande, para ello compararon la abundancia de las proteínas (diferentes funciones) de los diferentes lugares de muestreo, posteriormente hicieron un análisis comparativo de éstas, para saber en que ambientes se correspondían estos genes.
Definitivamente este tipo de trabajos son muy extensos y la cantidad de recursos que se necesitan para llevarlos a cabo son abismales, no obstante, el detalle con el que se pueden explicar la diversidad metabólica de los organismos es pobre, sin embargo, estos estudios permiten a los investigadores plantearse nuevas preguntas con respecto a la composición de los ecosistemas, así como de la presencia de los organismos en ellos y la presión de selección que les permite permanecer en dichos ammbientes.
Actualmente sabemos muy poco sobre la diversidad microbiana, lo que sabemos se refiere apenas al 1% del total de microorganismos que existen y se deriva principalmente de estudiar a los mismos a través de técnicas de genética molecular o bioquímica. Nuestro conocimiento de la diversidad filogenética de microorganismos viene de aproximaciones moleculares muy limitadas, ya que sólo sirven para identificar una pequeña fracción (los más abundantes, todos los demás no son detectados) de todos los organismos presentes en una comunidad. Por otro lado, existen técnicas que han revolucionado nuestro conocimiento de diversidad genética, como los análisis de rRNA, y el desarrollo de nuevos servidores y métodos de análisis de datos han permitido el establecimiento de la metagenómica como herramienta para estudiar la diversidad de forma más integral.
En el artículo se reportan los resultados de la expedición del GOS (Global Ocean Sampling), que es un estudio metagenómico cuyo objetivo es responder preguntas sobre la diversidad microbiana, tanto genética como bioquímica. En este estudio se desarrollaron nuevas técnicas de análisis y comparación de datos metagenómicos y sus datos incluyen información de 41 localizaciones marinas y un total de 7.7 millones de reads (¡!).
Una de las principales aportaciones del trabajo se relaciona con la incorporación de metadata asociada con el aislamiento o producción de los datos de secuenciación, ya que las gráficas que se obtienen ofrecen mucha información y permiten visualizar fácilmente los datos más interesantes y que requieren mayor análisis; aunque no todas las técnicas que describen incluyen la metadata, la comparación metagenómica basada en overlap es una aproximación cuantitativa para comparar la similitud genética general entre dos muestras y es igualmente informativa.
Las técnicas y herramientas implementadas en este trabajo permiten empezar a cuantificar la cantidad y a estudiar la estructura de la variación en comunidades microbianas marinas al mismo tiempo que ofrecen información de cómo estos factores se relacionan con la diversidad filogenética y las condiciones ambientales.
En este artÍculo se reportan los resultados de la primera fase de la expedicion Sorcerer II Global Ocean Sampling (GOS). El cual representó sin duda alguna, el primer proyecto metagenomico más ambicioso de inicios de siglo 21. La expedición comenzó en el 2004 y terminó en el 2006. Durante estos dos años, Craig Venter y su equipo navegaron mas de 32,000 millas naúticas y recolectaron 200 litros de agua superficiales cada 300 millas náuticas, con el objetivo de evaluar la diversidad microbiana en el oceáno.La gran cantidad de secuencias obtenidos en esta expedicion, representó el mayor número de secuencias nuevas en la base de datos (GenBank) con 7.7 milliones de reads que corresponden a 6.3 mil millones de pares de bases, del cual casi el 60% corresponde a secuencias únicas. La gran cantidad de información aportada en este trabajo, representó un enorme reto bioinformatico para poder analizar la gran cantidad y complejidad de las secuencias obtenidas. Por lo anterior, cabe resaltar el gran trabajo que Venter y su equipo lograron al sobrellevar este enorme reto técnico, para lo cual desarrollaron acercamientos bioinformaticos que permitieron filtrar, organizar y analizar toda la informacíon obtenida. Cabe mencionar que tambien integraron la informacion de las secuencias con el contexto ambiental (metadatos)para poder dar un sentido ecológico a sus análisis. Por lo anterior se pudo obtener información sobre la estrucutra y composicion de las comunidades microbianas marinas de aguas oceánicas superficiales. Se observó que las muestras no se agrupan por el origen de la muestra, es decir por la region biogeográfica, si no por temperatura (regiones templadas, tropicales). Aunado a esto, observaron que las variantes M de de las proteorhodopsinas , se encuentran asociadas a todas las muestras, la variante L se encontró en aguas templadas, y la variante Q, es dominante en aguas cálidas. Por lo anterior, se pudo sugerir que en el oceáno existen regiones biogeograficas y que NO todo esta en todos lados.
The Sorcerer II Global Ocean Sampling Expedition: Northwest Atlantic through Eastern Tropical Pacific.
El artículo está basado en el proyecto de metagenoma del océano pacifico y atlántico, para poder conocer la diversidad existente, lo realizan en los años 2003 y 2004, cuando aún no era muy común hacer este tipo de análisis (metagenomicos) debido al elevado costo, y la dificultad de poder interpretar los resultados. Así que genera varias dificultades al poder ensamblar los reads generados, 7.7millones en total, al comenzar con un criterio de corte del 98 % no lograban ensamblar todos los reads, y propusieron bajarlo a varios niveles de identidad. Ensamblado dos subgrupo de genes GOS. Usando un criterio de alineamiento de solo 30 % para cualquiera de los 584 genomas que tenían de referencia, llamando a estos alineamientos reads reclutados. Siendo 5 géneros de bacterias que se encontraban en las muestras; Prochlorococcus, Synechococcus, Pelagibacter, Shewanella, y Burkholderia. Tres géneros abundantes Pelagibacter , Prochlorococcus y Synechococcus. A través de la estructura y variación de los ribotipos lograron distinguir subtipos, como el caso de P.marinus MIT9312, Synechococcus RS99, P. ubique HTCC1062. Diversidad taxonomica; A traves del ensamblado de los GOS, identificaron el 16SrRNA, a 97 % de identidad, identificaron un total de 811 distintos ribotipos. 43 % de GOS y el 83 % de aquellos de GOS 16S, que se identificaron a través de bases de datos. La mayoría fueron secuencias encontradas por primera vez y a nivel de especie. Mientras que un 16 % derivo de las bases de datos y a nivel de familia. Entre varias secuencias abundantes se encuentra Roseobacter y P. ubique. Esto revelo la presencia de varias comunidades, siendo dominante en la superficie del agua las proteobactereas y actinobacteras. El siguiente nicho dominado fue por grupos de cianobacterias, Synechococcus, Prochlorococcus, y Rhodospirillaceae. Todo esto por medio de ribotipos. Comparación de las muestras: utilizaron el método de comparar dos muestras, haciendo uso de todas las porciones del genoma, a semajanza de calcular la fracción de una muestra que puede estar dentro de otra muestra. A un corte de >98 % y 90 %, este último para determinar subtipos. Y para el 98 % se dividieron las muestras dentro de subgrupos naturales, para tener un grado riguroso de comparación. Debido a la correlación que hay entre los parámetros físico químicos dentro de la toma de muestra, y el tamaño del filtro, los datos son difíciles de capturar en un clustering jerarquico.
Variacion en abundancia de genes: se examinó la abundancia de genes que pertenecían a categorías funcionales especificas en las muestras de GOS, los genes fueron enlazados a la función por medio de TIGRFAM hidden Markov model, asignados y curados manualmente. También compararon diferencias potenciales entre muestras que tenían un alto grado de similitud taxonómica, así como contenido genético. Encontrando solo diferencias en genes de adquisición de fosfato, siendo esto ligado más al ambiente en el que se encuentren y las distintas maneras que tienen para tomar este nutriente. Distribución biogeográficas de variantes de proteorodopsinas: para analizar las diferencias funcionales, analizaron miembros de la familia génica de proteorodopsina, que codifican para bombas de protones. Encontrando que la variación en algunos de los residuos de este gen han sido seleccionados bajo diferentes condiciones ambientales. Ensamblaje: A través del ensamblador Celera agruparon y ensamblaron las secuencias de GOS.
Entender la diversidad microbiana ha sido retador debido a la escaza cantidad de organismos cultivables. Esta situación genero dos formas de entender el concepto (diversidad microbiana) una que se basa en marcadores genéticos y en pruebas bioquímicas. Con las nuevas tecnologías de secuenciación ahora es posible utilizar marcadores como el 16S rRNA para conocer la diversidad de un sitio dado, sin embargo con los genomas completos se ha observado que dos organismos 97% similares en su marcador ribosomal pueden ser inmensamente distintos en cuanto a sus capacidades metabólicas. Por lo que los metagenomas representan una oportunidad para entender la biodiversidad a partir de estas dos perspectivas y adentrarse al oscuro camino de la especie bacteriana.
Para este articulo se muestrearon 44 sitios de ambientes marinos, para las que se obtuvieron secuencias de DNA que fueron posteriormente ensambladas y analizadas. Se desarrollaron nuevas técnicas para este objetivo, que derivaron de los estudios previos en el mar de Sargaso. Una de estás técnicas fue el reclutamiento de fragmentos, esta herramienta permitió analizar la variación genómica (cuando se contaba con genomas de referencia) y redondearla con la información proveniente de los metadatos, lo que facilito la aproximación biogeográfica.
Encontraron una enorme cantidad de diversidad genética dentro del nivel de especie. Dicha diversidad se aprecian en la estructura del genoma y en las diferencias entre las secuencias; donde al parecer la sintenia parece ser más importante que la conservación nucleotídica.
La variación encontrada dentro de la especie sostienen que no es al azar sino que más bien se asocia a la locación de la muestra y al contenido génico, prueba de la existencia de barreras al intercambio genético. Dicha variación a demás de afectar conceptos como el de especie también se interpreta en el contexto ecológico como un buffer que provee estabilidad al sistema, contrastando con los barridos selectivos y la teoría de una sola clona.
Por lo que este articulo deja ver nuevamente la enorme diversidad microbiana que existe, a demás demuestra la deficiencia de los marcadores taxonómicos clásicos para determinar especies y finalmente provee nuevas herramientas bioinformáticas que seguramente tendrán utilidad en estudios futuros.
Este trabajo busca explorar la diversidad de procariontes en el ambiente marino de todo el planeta y como tal es una aproximación inicial para saber qué tantas especies están representadas y qué tantos genes o funciones metabólicas diferentes encuentran. En términos generales se hace un muestreo de más de 40 sitios colectados a lo largo de las costas de las Bermudas, USA, Canadá, México, Honduras, Panamá, Costa Rica, Ecuador, las Polinesia y en mar abierto en aguas internacionales. Incluyen distintos hábitats como estuarios (con influencia de aguas continentales y de actividades antropogénicas) pero predominantemente ambiente salino, algunos coralinos y otros asociados a las islas Galápagos. Lo que se hizo fue filtrar las muestras de modo que todas caen dentro del rango menor a 3.0, 0.8 y 0.1 micras. Es interesante que los datos se procesaron con tecnología de sanger y construcción de librerías en vectores y en E. coli. De la misma forma en la que se armó el genoma humano. Se picaron colonias, se usaron robots, y se secuenciaron de forma pareada los insertos para generar fragmentos de 820 bases (en promedio y ya cortadas para su posterior análisis bioinformático). Como una de los objetivos era ensamblar los datos hicieron también uso de Fósmidos con insertos de mayor tamaño (39-40 Kb). Varias cosas se hicieron con los datos, por un lado se ensamblaron lecturas con una superposición del 98% y 94% de identidad para ir construyendo contigs. Por separado también se apartó un conjunto de datos para otros superposicionamientos más laxos. A partir de los contigs y fragmentos más grandes ensamblados se hizo un reclutamiento de los fragmentos de genes (de tamaños de 500 bp) de los genes homólogos encontrados a partir de referencias para contruir las filogenias de los mismos (secuencias completas y mayores a 70% de identidad). También se calculó la similitud entre librerías con índices de similitud (y disimilitud). Se hizo un agrupamiento de ribotipos basados en los 16S encontrados, de lo cual después se eligieron secuencias representativas. La clasificación taxonómica se utilizaron las bases de datos de RDP ribosomal y con blastn a la base no redundante del NCBI. El reclutamiento de fragmentos también incluyó alinearlos a los genomas secuenciados de distintas bacterias y arqueas (fragmentos de más de 100 o 300 bases con más del 30% de identidad. El análisis es extenso pero se buscó enfocarse en lo más representativo de todo el conjunto de datos como son abundancia y variación en los genes de proteorodopsinas, análisis de transolaciones e inversiones y en comparar algunos sitios y muestras, y ambientes como los tropicales vs los templados y especies como P. marinus y P. ubique, resultado de los ribotipos más abundantes y entre los cuales están los phyla de las proteobacterias (alfa, gama), bacteroidetes y cianobacterias. En conclusión creo que es un trabajo bastante interesante e ilustrador de la diversidad que hay de procariontes en el mar y que da a conocer una gran diversidad de proteínas dentro de diversos grupos de organismos.
Los comentarios están cerrados.