NBT:使用納米孔測序從微生物組中得到完整閉環的細菌基因組

使用納米孔測序從微生物組中得到完整成環的細菌基因組

Complete, closed bacterial genomes from microbiomes using nanopore sequencing

NBT:使用纳米孔测序从微生物组中得到完整闭环的细菌基因组

Nature Biotechnology[IF:31]

2020-02-10 Articles

doi: https://doi.org/10.1038/s41587-020-0422-6

全文可開放獲取 https://www.nature.com/articles/s41587-020-0422-6

第一作者:Eli L. Moss 1,Dylan G. Maghini1

通訊作者:Ami S. Bhatt1,2*([email protected])

作者單位:

1斯坦福大學遺傳學系(Department of Genetics, Stanford University, Stanford, CA, USA)

2斯坦福大學醫學系(血液學,血液和骨髓移植)(Department of Medicine (Hematology, Blood and Marrow Transplantation), Stanford University, Stanford, CA, USA.)

熱心腸導讀

① 雖然基因組中重複元件結構對於理解基因組功能至關重要,但使用常規短讀長的測序去組裝重複元件非常困難;② 本文提出一套測序流程(Lathe)結合長讀長序列組裝和短讀長序列糾錯可以從複雜的微生物群落中組裝完整的基因組;③ 這套流程成功在12種細菌的模擬群落中組裝出7個完整基因組,在13個人類糞便樣本中組裝了20個環狀基因組;④ 這一方法將在研究微生物功能尤其是重複元件的作用等方面具有廣闊應用前景。

點評: 基於二代測序讓我們對複雜環境微生物群落組成和功能有了進一步的認識,然而更深層次的研究就需要從複雜環境中組裝得到完整基因組,雖然三代測序準確率有待提升,但是卻幫助我們將序列讀長擴展到足夠用的地步,可我們卻還是無法從複雜環境中得到可用於三代測序的大片段DNA。因此,從複雜環境中組裝完整基因組的工作,從樣本提取就開始困難重重,本文提出了一整套方案,從樣本提取到下游的生物信息學分析,帶我們跨越障礙,組裝高質量基因組。

摘要

微生物基因組通常使用短讀長數據組裝,但是組裝的連續性受宏基因組測序重複元件(repeat elements)影響。正確的組裝基因組重複元件的位置對於我們理解基因結構對基因功能的影響至關重要。我們的工作流程(作者稱為:Lathe)結合了長讀長組裝和短讀長糾錯功能,可以從複雜的微生物組中組裝完整的細菌基因組。我們用12種細菌的合成菌群驗證了我們的方法。七個基因組被完全組裝成一個單個的重疊群(contigs),三個基因組被組裝成四個或很少的重疊群。接下來,使用我們的方法來分析來自13個人糞便樣本的宏基因組學數據。我們組裝了20個環狀基因組,包括

Prevotella copriCibiobacter sp的基因組。儘管與其他測序和組裝方法相比核苷序列準確性降低,但我們的方法改善了組裝連續性,可研究重複元件在微生物功能和適應性中的作用

前言

從宏基因組中組裝得到細菌和古細菌的完整基因組(MAG,宏基因組拼接/組裝基因組)是微生物組研究的長期目標。由於現有的宏基因組測序和組裝方法通常無法組裝完整的細菌基因組,因此通過對相似的重疊群進行分箱來得到基因組草圖。這種方法已生產的數量可觀的細菌基因組和擴展了我們的微生物群落的認知。分箱的質量很大程度上取決於數據量的大小和連續性。隨著裝配連續性的增加,基因組裝箱的敏感性和特異性得到提高,因為需要將更少,更大的contigs分配到每個基因組。測序和組裝技術(包括讀雲測序)的進步提高了組裝基因組的質量,但在正確放置重複序列元件的能力方面仍然受到限制。重複元件的大小範圍從幾十個鹼基對到幾千個鹼基。長讀取數據可涵蓋整個常見重複元件,例如:miniature inverted repeat transposable elements,轉座子(transposons),基因重複(gene duplications)和噬菌體序列。

最近,納米孔和PacBio的長讀長方法已被應用到腸道和其他微生物組研究方向。然而,由於缺乏從糞便中提取超長(HMWhigh molecular weight 超大)DNA的有效方法,阻礙了長讀長方法在腸道微生物組分析中的應用。標準的磁珠研磨可導致大範圍基因剪切作用,儘管SPRI珠子的“清除”步驟可去除數百個鹼基對中的DNA片段,但通常無法富集足夠長的DNA片段以在細菌中進行組裝重複元件。輕柔的研磨可以減少剪切,但可能無法從難以裂解的生物中提取DNA。因此,需要一種方法來提取可跨越革蘭氏陽性細菌和革蘭氏陰性細菌的重複元件的長DNA片段,以克服基因組裝配中的侷限性

我們提出了糞便樣品納米孔測序的工作流程,包括DNA提取和基因組組裝的詳細實驗方法(補充圖1)。我們的DNA提取方案適用於培養細菌的提取,包括用裂解酶混合物對細胞壁進行酶促降解,然後進行苯酚-氯仿提取,然後進行RNAseA和蛋白酶K消解,重過濾柱純化和SPRI大小選擇。這種方法可從低至300 mg的糞便中產生純高分子量(HMW) DNA,適合長讀長測序平臺測序。我們的生物信息學工作流程Lathe使用的是基於長讀長序列組裝,而不是最近有報道的諸如OPERA-MS之類的混合組裝 NBT:宏基因組二、三代混合組裝軟件OPERA-MS。可以通過納米孔或PacBio技術生成長讀長數據。長讀長組裝和短讀長校正與用於錯誤檢測和基因環組裝的修正。

結果

Result

圖1 定義的12種細菌混合物中的序列分類學組成、每種細菌的讀長分佈和基因組組裝

Fig. 1 | Taxonomic read composition, perorganism read-length distributions and genome assemblies in a defined 12-species bacterial mixture.

NBT:使用纳米孔测序从微生物组中得到完整闭环的细菌基因组

a,顯示了模擬添加的相等細菌細胞組成和測序得到的的相對丰度計數,並校正了相對基因組大小。

b,每個細菌序列長度分佈。在某些情況下,不同菌顯示出不同的序列長度分佈。

c,Circos圖顯示了納米孔測序相對於短讀取序列組裝方法的相對組裝連續性。納米孔測序和裝配(彩色外環)優於短讀裝配(黑色內環),在12例中有7例產生完整的基因組裝配(圈圖中的黑色點),另外3例組裝成了四個或者少數contigs。數字表示以兆為單位的基因組大小。請注意,由於參考序列和裝配序列中的線性化斷點不同,因此完整的基因組可能包含一個明顯的斷裂。

圖2:在兩個健康的人類糞便微生物群中,每個人樣本組裝的連續性,多樣性和微生物分類學組成

Fig. 2: Per-organism assembly contiguity, diversity and taxonomic read composition in two healthy human stool microbiomes

NBT:使用纳米孔测序从微生物组中得到完整闭环的细菌基因组
NBT:使用纳米孔测序从微生物组中得到完整闭环的细菌基因组

a,上圖顯示了獲得的序列數據集的物種水平香農多樣性。在用本流程的DNA提取方法制備的文庫中發現更高的物種多樣性。下圖展示了常規工作流程的相對物種水平丰度,常規測序數據由打珠研磨和基於短讀長測序組成,而本文測序工作流程由HMW DNA提取和長讀測序組成。

b,連續性表示為每單元N50除以每單個bin長度(分配給該bin的序列總長度)。隨著bin裝配接近完成,無論基因組大小如何,數量N50除以bin長度都將接近1。納米孔測序和組裝(藍色,紫色)顯示出比read-cloud (金色)和短讀長測序(綠色)方法更高的組裝連續性。圖中展示對於通過任何方法達到至少500 kbp的N50組裝或完整基因組草圖的所有微生物,對於長讀長,read-cloud和短讀長都顯示了基因組草圖的質量和連續性。形狀表示草圖質量。星號標記了一個基因組,後來被註釋為:

putative Cibiobacter

Read cloud是基於10X建庫的方法,詳見 NBT:宏基因組”讀雲”10X建庫+雅典娜算法組裝獲得微生物高質量基因組

表1. 從人類糞便樣品中組裝得到的環形細菌基因組

Table 1 Circular bacterial genomes assembled from human stool samples

NBT:使用纳米孔测序从微生物组中得到完整闭环的细菌基因组

圖3. P. copriCibiobacter sp的閉合環形完整基因組的圈圖

Fig. 3: Circos diagrams of closed, circular genomes of P. copri and Cibiobacter sp.

NBT:使用纳米孔测序从微生物组中得到完整闭环的细菌基因组

a. P. copri從樣本P2-A中組裝得到;

b,Cibiobacter sp1從樣本P1中組裝得到。在兩個圖中,最外環代表給定微生物的完整,封閉和環化的基因組。中環和內環分別代表contigs來自read-cloud和短讀長測序組裝,他們被映射到納米孔組裝的基因組上。內部標記代表註釋和預測的移動遺傳元件(mobile genetic elements),例如插入序列(IS),transposases和prophage。

材料方法

人類糞便DNA提取

Short-read和read-cloud測序,使用Qiagen Stool Mini試劑盒使用標準的磁珠研磨機械裂解法從樣品P1和P2-A中提取DNA。對於read-cloud建庫,使用BluePippin(Sage Science)將其DNA片段大小選擇為10 kbp。

對於HMW提取,將約0.7g的冷凍糞便等分到2 ml的Eppendorf管(Eppendorf)中,並用4-mm穿孔器(Integra Miltex)並懸浮在500 µl PBS(Fisher Scientific)中,並輕輕搖動,然後加入5 µl的lytic enzyme solution (Qiagen)混混勻。然後加入10 µl MetaPolyzyme(Sigma Aldrich;在750 µl PBS中復溶),並加入10 µl的裂解酶溶液(Qiagen),然後在37°C下孵育1 h。接下來,添加12 µl 20%(w / v)SDS(Fisher Scientific)和約100 µl用作鎖相凝膠的真空潤滑脂(Dow-Corning)。然後,加入500 µl pH 8的苯酚-氯仿異戊醇(Fisher Scientific),將樣品輕輕渦旋5秒鐘,然後以10,000 g離心。使用Legend Micro 21微量離心機(Fisher Scientific)離心5分鐘。然後將水相倒入新的2-ml管中。

接下來,在室溫下用90 µl 3M乙酸鈉(Fisher Scientific)和500 µl異丙醇(Fisher Scientific)沉澱DNA 10分鐘。上清混勻翻轉三遍後,將樣品在室溫下孵育10分鐘,然後以10,000 g離心10分鐘。除去上清液,並用新鮮製備的80%(v / v)乙醇(Fisher Scientific)將沉澱洗滌兩次。然後將沉澱在37°C下加熱乾燥10分鐘,或直至沉澱外觀無光澤,然後重懸於100 µl無核酸酶的水中(Ambion,Thermo Fisher Scientific)。接下來,以100 mg ml-1的濃度加入1ml Qiagen緩衝液G2、4 µl Qiagen RNase A 然後將樣品輕輕倒轉3次,然後在56℃下孵育90分鐘。在30分鐘開始,輕輕倒轉一次,將沉澱物移出。

每個樣品一個Qiagen Genomic-tip 20/G色譜柱用1 ml Qiagen緩衝液QBT平衡,並在重力作用下排空。將樣品輕輕倒轉兩次,加到柱子上,使其流過。每列合併三份糞便提取物。然後用3 ml Qiagen緩衝液QC洗滌色譜柱,然後用1 ml預熱至56°C的Qiagen緩衝液QF洗脫DNA。然後通過加入700 µl異丙醇沉澱洗脫的DNA,然後將其倒置並以10,000 g離心15分鐘。用移液管小心地除去上清液,並用1ml 80%(v / v)乙醇洗滌沉澱。通過在37°C空氣乾燥10分鐘除去殘留的乙醇。隨後將沉澱在4°C下重懸於100 µl水中過夜,無需攪拌。

然後使用改良的SPRI磁珠方案選擇大片段的DNA。稍作修改:將小珠以0.9*添加,並將洗脫的DNA重懸於50 µl水中。然後分別用Qubit熒光計(Thermo Fisher Scientific),Nanodrop(Thermo Fisher Scientific)和TapeStation 2200或4200(Agilent Technologies)定量提取的DNA的濃度,純度和片段大小分佈(參見補充表1)。除非另有說明,所有步驟均在室溫下進行。

數據可用

所有序列數據,完整的基因組組裝和單個完整的基因組都可以在NCBI BioProject上找到,登錄號為PRJNA508395。

代碼可用

  • 本文設計的流程代碼:

    https://github.com/bhattlab/metagenomics_workflows/

  • 後續分析,分箱註釋可視化代碼:

    https://github.com/bhattlab/lathe

相關研究

利用納米孔測序從混合樣本中進行分析單個物種的基因組研究具有以下優點:

  • 實時分析能夠快速從混合種群中鑑定和量化個別微生物

  • 長讀長更利於微生物鑑定和基因組組裝

  • 不受地點限制:

    從實驗室到極限環境,便攜式MinION測序儀可在任何地方進行測序

利用上述優勢,全球的科學家們利用Oxford Nanopore Technologies的測序技術進行宏基因組研究並獲得了諸多前瞻性研究結論,如:

  • 英國諾維奇研究中心厄勒姆研究所(Earlham Institute)的Leggett等人近期在《Nature Microbiology》雜誌發表了首個探索MinION用於臨床腸道宏基因組測序研究的出版物,揭示早產兒腸道微生物多樣性。

  • 英國東安格利亞大學的Justin O’Grady博士和Earlham研究所的科學家成功開發了一種宏基因組學檢測的研究方法,可從臨床呼吸道樣本中去除高達99.99%的宿主核酸,並利用納米孔測序的實時檢測在6小時內準確識別病原體和抗生素抗性基因。

  • 中國南方科技大學夏雨副教授在海拔4km祁連山對凍土和冰川融水進行現場實地測序,得到在實驗室測序無法獲得的更多信息。

  • 香港大學張彤教授結合納米孔測序技術,快速鑑定並追蹤抗生素抗性基因的宿主,同時全面解析抗生素抗性基因的遺傳背景

10000+:菌群分析 寶寶與貓狗 梅毒狂想曲 提DNA發Nature Cell專刊 腸道指揮大腦

系列教程:微生物組入門 Biostar 微生物組 宏基因組

專業技能:學術圖表 高分文章 生信寶典 不可或缺的人


分享到:


相關文章: