Cell子刊:人體腸道病毒組高度多樣、穩定且個體特異

人體腸道病毒組高度多樣,穩定並且個體特異

The Human Gut Virome Is Highly Diverse, Stable, and Individual Specific

原文鏈接:https://www.sciencedirect.com/science/article/pii/S1931312819304767

Cell Host and Microbe [IF:17.872]

DOI:https://doi.org/10.1016/j.chom.2019.09.009

Resource: 2019-10-09

第一作者:Andrey N. Shkoporov1

通訊作者:Andrey N. Shkoporov([email protected])1

Colin Hill([email protected])1

其他作者:Adam G. Clooney1, Thomas D.S. Sutton1, Feargal J. Ryan1, Karen M. Daly1, James A. Nolan1, Siobhan A. McDonnell1, Ekaterina V. Khokhlova1, Lorraine A. Draper1, Amanda Forde1, Emma Guerin1, Vimalkumar Velayudhan1, R. Paul Ross1

作者單位:

1 愛爾蘭科克大學愛爾蘭APC微生物組和微生物學院 (APC Microbiome Ireland & School of Microbiology, University College Cork, Cork, Ireland)

熱心腸日報

鏈接:https://www.mr-gut.cn/papers/read/1081524258

①納入10名健康成年人,用宏基因組學方法深入分析糞便病毒組成在1年間的變化,發現腸道病毒組是高度個體化和穩定的;

②將個體腸道病毒中穩定存在且高佔比的病毒組分命名為“持久穩定的個體病毒組”(PPV),主要包括烈性的crAss樣噬菌體和其它有尾噬菌體目成員,以及微小噬菌體科;

③這些持久穩定存在的噬菌體可能與占主導地位的腸道細菌類群(如擬桿菌屬、普氏菌屬和糞桿菌屬)有關。

主編推薦語:

人類的腸道中含有大量的病毒,其中絕大部分是噬菌體。在人腸道微生物組的研究中,關於病毒組的研究還比較缺乏。Cell Host and Microbe發表的一項研究,開發了基於宏基因組學的方法工具,能更為深入全面的分析人類腸道病毒組。該研究通過縱向隊列分析表明,人腸道病毒組是穩定且高度個體化的,且每個人都存在“持久穩定的個體病毒組”(PPV),由靶向主要腸道細菌類群的烈性噬菌體組成。這些發現為進一步深入研究人類腸道病毒組打下了基礎。

寫在前面

技術亮點:用自己的產生的數據作為參考數據庫,提高數據利用率;加入已知量的外源噬菌體來估計腸道噬菌體的載量。

圖型摘要

Shkoporov等人證明了人類腸道病毒高度的個體特異性和時間上的穩定性

。他們描述了病毒群落中數量上廣泛分佈且持續存在的部分,稱為持續的個體病毒(persistent personal virome,PPV)。PPV主要由烈性噬菌體組成,我們預計他們會靶向裂解腸道細菌的主要分類群。

Cell子刊:人體腸道病毒組高度多樣、穩定且個體特異

摘要

人類腸道中含有大量病毒,主要是噬菌體。大多數仍然未被發現,我們對它們在腸道微生物組的形成和影響人類健康方面的作用仍然知之甚少。我們對健康成年人糞便病毒組進行了縱向宏基因組分析,揭示了高度的時間穩定性、個體特異性以及與細菌微生物組的相關性。我們使用了一種利用大多數測序數據並且不依賴於數據庫的方法,我們發現了一種穩定的、數量上佔優勢的個體特異性持續的個體病毒(PPV)的存在。病毒基因組的聚類和重新分類註釋確定了幾組crAss-like噬菌體和Microviridae噬菌體是人類腸道最穩定的共生體。基於CRISPR的宿主預測強調了這些穩定的病毒群落與高度優勢的腸道細菌類群如Bacteroides,Prevotella和Faecalibacterium之間的聯繫。這項研究為人類腸道病毒的結構提供了見解,併為假說驅動的研究奠定了重要的基礎。

背景

人類腸道微生物群落是一個複雜的生態系統,從出生時的定殖開始,並在整個生命過程中不斷改變和適應。微生物群落中的細菌和古細菌為宿主提供了一系列功能,包括免疫系統發育、維生素合成和能量生成。該細菌成分的特徵是在健康受試者中具有高的時間穩定性,但是會受到諸如旅行、疾病和抗生素使用等事件的短暫影響。在Actinobacteria門和Bacteroidetes門中通常觀察到最高的持續性,其中高度豐富的成員表現出最大的穩定性,而Firmicutes門在時間上更具動態性。

微生物組中的病毒成分(病毒組)主要是噬菌體,它們被認為在通過捕食和水平基因轉移形成微生物群落中起著關鍵作用。這些複雜的噬菌體群落代表了我們對人類微生物群的理解和推動其組成的力量的認知非常不足。高達90%的病毒體序列與當前的參考數據庫幾乎沒有同源性,並且病毒基因組缺乏通用的標記基因來幫助其分類。許多病毒學研究依賴於數據庫,這些方法將研究範圍限制在一小部分(通常只有10%左右)可以識別的病毒序列中。其餘的病毒DNA通常被忽略,一般被稱為“病毒暗物質(viral dark matter)”。

已經提出了存在健康的核心腸道病毒組,該病毒組由溫和的噬菌體主導,並且病毒組和細菌微生物組成之間的聯繫已經得到強調。許多橫斷面人群研究報告了一些胃腸疾病和全身性疾病(如炎症性腸病、艾滋病、糖尿病和營養不良)中腸道病毒的疾病特異性改變。然而,在缺乏關於大多數差異的噬菌體的分類信息、宿主範圍和生物學特性的情況下,對病毒組組成的這些差異進行有意義的解釋是不可能的。更好地理解不同分類水平的病毒組組成的短期和長期動態也是至關重要的。

儘管最近有所進展,但關於噬菌體捕食的動力學、細菌宿主的噬菌體抗性獲得、宿主-噬菌體共同進化和在腸道中的多樣化,仍有待研究。健康人群和患者人群的縱向病毒學研究對於在複雜的多微生物在群落水平上闡明這些機制至關重要,並有望在橫斷面病毒學研究和簡化的體內和體外模型的假設驅動在研究之間建立聯繫。

在單個受試者身上進行的人類腸道病毒組的開創性縱向研究表明,腸道病毒組在2.5年的時間內顯示出與細菌微生物組相似的高時間穩定性。在這裡,我們擴展了以前的發現,並報告了12個月內10個個體腸道病毒的全面縱向研究。我們使用了一種優化的獨立於參考數據庫的流程,能夠從頭提取和組裝源自糞便類病毒顆粒(VLPs)的鳥槍測序reads,我們嚴格去除了殘留的細菌序列汙染,並且我們可以對超過80%的單個鳥槍讀數進行臨時分類。我們還利用假定的病毒congtigs的重新聚集來鑑定結構和/或功能相似的病毒群,並揭示腸道病毒組隱藏的系統發育核心。我們報道了令人印象深刻的時間穩定性和病毒個體間的多樣性。

最後,我們證明了一個高度個體化和持久性的病毒組部分的存在,即“持久性個體病毒體”,主要由烈性的crAss-like噬菌體、Caudovirales目的其他成員和烈性的Microviridae科組成,預計它們會感染細菌微生物群的主要代表。

結果

總病毒載量和α-多樣性是是個體特有的,並具有持久的特徵

Total Viral Load and a-Diversity Are Subject Specific and Persistent Features

在12個月的時間裡,我們通過每月同步採樣監測了10名健康成年受試者的糞便病毒組。對一名受試者在第19、20和26個月進行了三次隨訪取樣(圖1A)。使用Illumina平臺(圖1B)對從糞便VLP級分中提取的擴增的DNA和RNA(cDNA)進行集中的基因組測序。為了補充這一數據,並有助於類似的低覆蓋重疊群,在一個時間點(第8個月)對每個受試者進行了未擴增的VLP深度核酸測序。隨後,將讀數彙編成一個非冗餘的重疊群目錄,並進行嚴格過濾以去除殘留的細菌DNA汙染。為了將病毒組組成放在整個微生物結構的更廣闊的背景下,對所有糞便樣本進行16S rRNA基因文庫測序,並在對第8個月的樣品進行了群落DNA的宏基因組學分析。

圖1 通過VLP鳥槍測序恢復的病毒多樣性的實驗設計

Experimental Design and Viral Diversity Recovered by the VLP Shotgun Sequencing

Cell子刊:人體腸道病毒組高度多樣、穩定且個體特異

(A)從10個研究對象收集糞便樣本的時間軸以及進行分析的類型。

(B)用於糞便類病毒顆粒(VLP)相關核酸提取和鳥槍測序的實驗和生物信息學方法的簡要概述。

(C)在每個受試者的每個時間點上,Illumina的reads總數比對到最終去汙染的39254條重疊群目錄的比例。

(D)計算出的10個個體在時間點9-12之間每月的總糞便病毒載量。

(E)每個受試者在每個時間點經過去汙染後剩餘的contigs數量。

(F)含有整合酶或位點特異性重組酶基因的contigs的相對丰度。

(G)重疊群長度和覆蓋深度分佈。

病毒序列的最終目錄包括39254個非冗餘的完整和部分病毒基因組。10名受試者的大部分樣本顯示了該重疊群目錄的對於reads序列覆蓋的高水平(中位數為82.8%,圖1C),這表明我們的汙染過濾策略是有效的,並確保大部分數據包含在分析中。這也被另一個現象印證了,只觀察到相對較少一部分reads(7.23±3.107)比對到保守的單拷貝細菌cpn60伴侶蛋白基因(cpn60chaperonin gene)上,假設平均細菌基因組大小為3.5 Mb,在過濾前的數據集中大約有0.45%是細菌染色體DNA序列。

在時間點第9–12個月的樣品加入外源性乳球菌噬菌體Q33,這在人類腸道微生物群落研究中並不常見,這使我們能夠粗略地定量每克糞便在2.2 X 108和 8.4 X 1010基因組拷貝之間的總病毒載量, 假設總基因組的平均大小等於Q33(31.1 kb;圖1D)。估計的病毒載量是受試者特異性的(p = 0.05,ANCOVA分析),並且在3個月期間沒有顯著變化(p = 0.35)。我們觀察到糞便病毒群落的豐富程度有很大差異,每個樣本中有11到4509個基因組或基因組片段。豐富度水平因受試者而異(p = 0.002,圖1E),並且在每個受試者在1年期間中穩定(p = 0.27)。通過包含整合酶和位點特異性重組酶基因的重疊群的丰度進行估計,溫和噬菌體的相對丰度變化很大(0%–68%)。然而,甚至這一特徵似乎也反映了病毒的個體差異(p = 6.32±3.106)並且隨時間相對穩定(p = 0.08;圖1F)。

有趣的是,病毒α-多樣性的測量結果僅顯示與細菌多樣性呈輕度正相關(Spearman ρ = 0.25–0.36,在FDR(錯誤發現率)校正後p < 0.05),但與溫和噬菌體contigs的相對丰度呈強相關(ρ = 0.69–0.79)。與此同時,病毒α-多樣性的測量顯示弱至中度負相關(ρ = -0.11到-0.45),而後者與溫和噬菌體丰度呈負相關(ρ = -0.41)。

重疊群的分類分配揭示了Caudovirales目和Microviridae未知噬菌體的普遍存在。檢測到一些Inoviridae噬菌體的代表,以及真核ssDNA病毒(Circoviridae, Anelloviridae, Genomoviridae)。特別值得注意的是,有相當數量的植物RNA病毒Virgaviridae(圖1G)。總的來說,恢復了不同大小的重疊群,主要代表具有中-低水平序列覆蓋的基因組片段。完整的環形病毒基因組(n = 623)的大小從Anelloviridae的略大於3kb到某些“巨型”Myoviridae噬菌體的287kb不等。在39254個病毒基因組和基因組片段中,6961個被歸入科級分類組。在先前描述的病毒中,只有241種具有相近的同源物(>50%的核苷酸同一性超過90%的序列長度)。這些主要包括與乳球菌(Lactococcus)噬菌體和腸桿菌科(Enterobacteriaceae)噬菌體具有同源性的重疊群,並添加了一些隱蔽的真核ssDNA病毒(Torque teno viruses、gemycircular-virus)和多種植物RNA病毒。共有3556個contigs(包括162個完整的環狀contigs)包含整合酶或位點特異性重組酶的基因,表明可能存在溫和的生活方式。大多數完整的溫帶噬菌體基因組的大小為40-50kb,屬於Siphoviridae。

隨著時間的推移人類病毒高度個體且組成穩定

Human Viromes Are Highly Individualized and Compositionally Stable over Time

10個受試者糞便病毒群落最令人印象深刻的特徵是高度的個體間特異性和至少1年至26個月的個體內保守性。

儘管總病毒多樣性高得多,但在研究隊列中,只有1380個相對丰度高於0.1%的重疊群佔VLP測序空間的99%。在某些受試者(917、918、920和924)中,在相對丰度達到95.6%時,可以看到單一且獨特的病毒重疊群的明顯優勢。在大多數情況下,這種佔絕對優勢的病毒重疊群可分為Microviridae或crAss-like噬菌體的臨時科(圖3B)。由於使用了全新的組裝和分類方法,我們能夠為病毒重疊群分配到科級,佔每個樣本的VLP讀數中位數的82.6%。有尾噬菌體目成員(crAss-like噬菌體、Siphoviridae、Myoviridae、Podoviridae, reads的累積相對丰度分別為21.2%、12.7%、8.3%和5.0%)和Microviridae成員(31.0%)佔優勢,而其他病毒科,如絲狀Inoviridae噬菌體(0.1%)和真核病毒科圓Circoviridae和Genomoviridae(0.07%和0.02%),偶爾也能見到。

圖2 個體間病毒組特異性、保守性以及與細菌組組成的相關性

Inter-individual Virome Specificity, Conservation, and Correlation with Bacteriome Composition

Cell子刊:人體腸道病毒組高度多樣、穩定且個體特異

(A)按時間點劃分的10個受試者中病毒組的科水平分類組成,個體contigs(相對丰度為0.001的有1380條)用黑色邊框標出;紅色三角形表示受試者最近使用抗生素的時間點。

(B)通過16S rRNA擴增子測序確定的對應細菌樣本的分類組成,僅顯示相對丰度≥0.05的科。

(C)基於Jensen-Shannon差異度量的病毒群落矩陣的主座標分析排序;統計橢圓由受試者以0.95置信水平給出;主題的顏色代碼在(D)中給出。

(D)根據16S rRNA基因擴增子測序數據,對病毒群落PCoA座標和細菌OTU PCoA座標進行Procrustes旋轉(rotation);詹森-香農散度度量(Jensen-Shannon divergence metric)用於兩種情況;前56個軸被納入分析,但僅顯示前2個軸。

儘管隨著時間的推移會有一定的波動,但病毒組組成在科水平和重疊群水平上都是穩定的,這是由穩定的和個體特異性的細菌組組成所模擬的(mimicked)。(圖2A圖2B)。受試者身份解釋了重疊群水平上病毒組成的66.2%的方差(PERMANOVA, p = 0.001)和OTU水平上細菌群落的82.4%的方差(p = 0.001)。這比數據集中包含的任何其他變量都高得多,包括細菌和病毒成分相互作用的相互影響。然而,我們觀察到病毒和細菌群落的組成之間有很強的相關性(Procrustes randomization test, p = 0.001,0.804,

圖2D)。受試者922中由兩次抗生素治療引起的細菌群落的短暫擾動導致病毒成分的類似擾動(圖2A圖2B)。

在約束排序試驗(constrained ordination tests)中,病毒組變異的至少一個維度是由一方面是Prevotella,另一方面是Bacteroides, Barnesiella, Alistipes和Eggerthella的反向效應來解釋的。Prevotella丰度較高與觀察到的病毒多樣性(Spearman r = 0.28)和溫和噬菌體重疊群的流行率(prevalence)(r = 0.27)輕度相關,與總病毒載量(r = 0.53)呈負相關。有趣的是,與這個維度無關,發現crAss- like噬菌體contigs和Microviridae之間呈負相關(r = 0.53)。

儘管穩定性很高,但我們觀察到細菌和病毒成分隨時間緩慢轉變(draft),遠離在時間點1採樣的原始群落。在病毒的情況下,這種轉變(draft)更明顯,幾乎可以肯定是由於鳥槍式VLP測序與16S rRNA擴增子測序相比具有更高的分類學分辨率。

PPVs穩定,並且在數量上佔優勢

PPVs Are Stable and Numerically Predominant

我們對顯著的時間穩定性和個體獨特性的觀察,以及少量病毒重疊群對個體病毒體的控制,使我們得出一個假設,即

相對小的、高度個體化的和穩定的病毒集合,我們稱之為持續的個體病毒體(persistent personal viromes,PPVs),可能是個體間病毒體多樣性和穩定性的主要驅動力。病毒體中剩下的不太穩定的部分可能包括丰度低的噬菌體、感染短暫微生物組成員的噬菌體和飲食來源的植物病毒。為了檢驗這一假設,我們逐步細分了每個個體的病毒群落矩陣,使其僅包括至少在第3、6、9或11時間點出現的病毒重疊群。這一過程給我們留下了數10個重疊群,而不是每個樣本上的數千個重疊群(圖3A),儘管大多數VLP reads仍然可以被比對到這些較小的重疊群目錄中(圖3B)。儘管我們認識到測序深度可能是檢測低丰度持續性重疊群的一個限制因素,並尋求嚴格性和敏感性之間的折衷,但我們根據經驗選擇了每個受試者12個時間點中的6個時間點作為界定PPV重疊群的閾值

圖3 病毒組中的相對重量和PPV的分類組成

Relative Weight in the Virome and Taxonomic Composition of PPV

Cell子刊:人體腸道病毒組高度多樣、穩定且個體特異

(A)每個受試者具有保守功能的病毒重疊群數量。

(B) 與(A)相同,與保守重疊群比對上reads數目。

(C)每個受試者在PPV中的reads比例。

(D和E) NMDS病毒群落數據(使用g Bray-Curtis 差異)分離成個人持久性部分(D)和瞬時檢測部分(E);持久性病毒體的縮放導致應力值為0.2的收斂解;瞬時病毒體沒有給出收斂的解(scaling of persistent virome results in convergent solution with stress value of 0.2; transient virome gives no convergent solution)。

(F)持久性和短暫性病毒粒級中病毒科級分類群的累積相對丰度。

(G)以重疊群數量(藍色)表示的每個個體的PPV大小,以及個體之間共享的PPV比例(紅色);箱線圖給出了共有PPV 重疊群的分類組成。

(H)至少在兩個個體之間共享的PPV 重疊群的相對丰度。

基於這一標準,我們建立了一個由10個受試者的833個重疊群組成的PPV目錄,該目錄在每個樣本中招募了中位數為92.3%的去汙染後能比對上的VLP reads(圖3C)。我們將每個個體群落中剩餘的病毒群定義為短暫檢測到的病毒群(transiently detected virome,TDV)。然後,我們應用了非度量多維標度(non-metric multidimensional scaling,NMDS)和PERMANOVA分析,以找出這兩個分數中的哪一個賦予病毒更大的個性(individuality)和穩定性(

圖3D圖3E)。與預期一致,PPV部分以高度有序的方式按個體聚集(55.2%的方差由受試者解釋,p = 0.001),而TDV部分則無序得多(17%的方差由受試者解釋,p = 0.001)。除此之外,TDV顯示出個體間明顯更多的共享。從分類學的角度來看,Microviridae和crAss-like是PPVs最突出的代表。相比之下,TDV顯示出Siphoviridae的流行,以及諸如Inoviridae, Genomoviridae, Papillomaviridae, Anelloviridae和Virgaviridae等少數病毒群的存在(圖3F)。

儘管10個人共享一個工作環境,但PPV的規模和組成高度個性化(圖3G)。無論PPV大小如何,個體之間共享的PPV重疊群 的數量非常少,只有46個重疊群(22個完整或幾乎完整的病毒基因組,圖3H)在兩個或更多個體之間共享,兩個重疊群(6.6 kb的環形Microviridae基因組和93 kb的環形crAss-like噬菌體基因組)在五個或更多個體之間共享。沒有重疊群在10個人的PPVs中被分享。

PPV成員的聚類揭示了與人類細菌微生物群主要成員相連的系統發育核心的存在

Clustering of PPV Members Reveals the Existence of a Phylogenetic Core Connected to the Main Members of Human Bacterial Microbiota

在缺乏基於系統發育的噬菌體分類信息的情況下,並且由於絕大多數病毒序列不能被分配到科水平以下的任何已知分類單元,我們使用vConTACT2聚類流程將病毒重疊群分成近似屬或亞科水平的組。為了便於重疊群的分類定位,已知的病毒基因組(NCBI參考序列數據庫)被包括在其中,其中710個基因組與本研究中的重疊群聚類在一起。使用這種方法,我們在整個數據集中確定了3639個病毒聚類,只有114個聚類和66個單重體(singletons)形成了所有10個個體的PPVs(圖4A)。

圖4 PPV噬菌體聚類及其預測細菌宿主

Phage Clusters of the PPV (Based on Gene Orthology) and Their Predicted Bacterial Hosts

Cell子刊:人體腸道病毒組高度多樣、穩定且個體特異

(A)重疊群的vConTACT2網絡僅限於653個PPV的非單一重疊群;使用MCL將頂點顏色隨機分配給114個聚類中的每一個;大小反映重疊群長度。正方形,線性重疊群;圓,圓形重疊群。邊緣厚度反映了對數顯著性得分,使用Kamada-Kawai算法的圖形佈局。

(B)與(A)相同,但根據病毒家族對頂點進行著色(E中的顏色代碼);紅色輪廓,含有整合酶和/或位點特異性重組酶基因的重疊群。

(C)通過CRISPR間隔匹配預測的持久性病毒簇的宿主範圍;頂點顏色根據病毒家族而定(顏色代碼請參閱圖E)。對於包含已知噬菌體的簇,其分類名稱為藍色。連接病毒簇和細菌屬的邊緣數等於含有CRISPR匹配的重疊群。紅色輪廓線表示含有含有整合酶和位點特異性重組酶基因的重疊群的簇。

(D)PPV和TDV中病毒簇的數量隨所包含個體數量變化的反射曲線。

(E)32個病毒簇表明PPV和TDV之間分佈不均(在使用Bonferroni校正的Wilcoxon試驗中p <0.05>

從系統發育的角度來看,大部分PPVs重疊群屬於大的、多樣的、相互聯繫的有尾噬菌體目(Siphoviridae,Myoviridae, crAss-like 噬菌體),或者形成非常緊密的孤立聚類(Microviridae, 小的Podoviridae噬菌體,圖4B)。在180個暫定病毒分類群中,有24個與已知病毒的基因組聚類在一起,並確立了分類地位。通過在大量細菌參考基因組中尋找CRISPR間隔區匹配,進一步證實了基於從頭分配和vConTACT2與已知病毒分類群共聚類的病毒分類群的分類位置。我們能夠找到對63個PPVs聚類成員的強有力的匹配(hits)。同一個群的成員經常命中不同的相關或不相關的細菌屬,而某些細菌屬,如高度流行的腸道共生體Bacteroides, Parabacteroides, Prevotella, Blautia, Faecalibacterium和Clostridium,則命中多個不同的噬菌體群(

圖4C)。

與先前的預測和實驗數據一致,多簇高度豐富和持久的crAss-like噬菌體和Microviridae噬菌體與Bacteroides屬和Bacteroidales目的相關分類群相關聯。類似地,Clostridiales目的革蘭氏陽性嚴格厭氧菌與許多有毒和溫和的Siphoviridae群以及一些Microviridae形成了一個相互連接的網絡,不同於感染革蘭氏陰性厭氧菌的細菌(圖4C)。我們觀察到的與人類健康相關的屬如Akkermansia、Faecalibacterium和Ruminococcus相關的PPVs噬菌體群值得進一步研究。

圖5 個體病毒組中PPV聚類的相對丰度

Relative Abundance of PPV Clusters in the Individual Viromes

Cell子刊:人體腸道病毒組高度多樣、穩定且個體特異

頂部註釋欄,受試者;左側註釋欄,病毒科。基於歐氏距離完全連鎖聚類的樹形圖(Dendrograms based on complete linkage clustering with Euclidean distances.)。右邊給出了大於5個個體中出現的聚類的名稱;帶有編碼整合酶和位點特異性重組酶的contigs的聚類用紅色突出顯示。

與個體的病毒重疊群一樣,PPVs中病毒聚類的相對丰度顯示了受試者的明顯分離(圖5)。然而,聚類揭示了個體病毒組之間更高的共同性。一半或更多的研究對象共有22個PPV聚類。這些噬菌體群主要由強毒的crAss-like和Microviridae噬菌體聚類組成,只有三個溫和的Siphoviridae基因組群(genomic groups)。與PPV不同的是,TDV噬菌體群的丰度沒有受到區分。當比較人類糞便病毒體的PPV和TDV部分的病毒聚類的相對丰度時,32個噬菌體群顯示出對其中一個或另一個的明顯偏好(圖4E)。例如,雖然集群c924 (CRISPR命中Enterococcus)和c2181 (CRISPR命中Blautia和Coprobacter)的存在量相當,但c2181在三個個體中是PPV的一部分,而c924在所有受試者中僅是TDV的一部分。這一方面可以反映出Blautia和Coprobacter噬菌體在微生物群中更為確定的位置,另一方面可以反映出Enterococcus噬菌體-宿主對的快速動態。關於聚類c1774(未知宿主的Siphoviridae,兩個受試者)和c65(混合預測,八個受試者,CRISPR命中Akkermansia和Butyricimonas),可以得出類似的結論。

PPVs基因組的微小異質性和突變累積率

Microheterogeneity and Mutation Accumulation Rates in PPV Genomes

已經建立了糞便病毒的高度個體性和時間穩定性,以及屬於相對少數系統發育群的PPV的存在,我們決定在單個菌株水平上檢查PPV基因組的時間穩定性。總之,我們在424個PPV重疊群中鑑定出31061個高質量多態性位點(30600個雙等位基因和461個三等位基因)。為了簡化分析流程,我們將單核苷酸多態性和三核苷酸多態性(triallelic SNPs)排除在本研究之外。此外,我們將我們的分析限制在9258個在研究初始時間點未檢測到的多態性位點。這給我們提供了一個機會來跟蹤研究過程中每個重疊群先前未發現的(新的)SNPs的積累。

具有僅38個病毒重疊群的小PPV的受試者918(圖3G)作為我們觀察到的等位基因動力學類型的例子(圖6A)。在一些重疊群中,相繼出現了新的變異體,這些變異體逐漸佔據了整個群體(99.1和93.1 kb的c264和c567聚類的Ass-like噬菌體基因組)。對於其他重疊群,我們看到了新變異體的協同爆發,它們迅速取代了早期的基因型(c849聚類的99.1kb crAss樣噬菌體)。後一種類型的行為表明一種新的但相關的噬菌體菌株的出現和舊菌株的快速替代。不管怎樣,

我們觀察到在任何特定的時間點,每種類型的噬菌體都是由多種緊密相關的基因型(微異質性)混合而成的。

圖6 1年間PPV基因組中新SNPs的積累

Cell子刊:人體腸道病毒組高度多樣、穩定且個體特異

(A)來自受試者918的持久性病毒基因組的實例,隨著時間的推移,具有相對豐富的替代性SNP等位基因;

(B)PPV片段中每個contig、每個病毒科的突變累積率(between-group comparisons were done with Kruskal-Wallis test [p = 1.8 * 108], followed by a post hoc Wilcoxon test with Bonferroni correction);

(C)同上,但是是整合酶基因的存在;

(D)與先前相同,但contigs按受試者分組(p < 0.05 in Kruskal-Wallis test for subject 922 versus 917, 918, 919, 921)。

然後,我們評估了來自所有10個個體的PPV重疊群中新等位基因累積的比率,該比率在4個數量級上變化(圖6B)。根據預測的病毒科水平對重疊群進行分組突出了一些顯著的差異。例如,Microviridae的突變累積率幾乎比crAss-like噬菌體高一個數量級(Wilcoxon test,p = 0.011)。同時,整合酶基因的存在並沒有影響突變率(p = 0.3,圖6C)。這與之前觀察到的人類腸道中毒性噬菌體比溫和噬菌體有較高突變率形成對比。有趣的是,受試者922(接受了三個療程的β-內酰胺(b-lactams)抗生素)的相對重疊群突變率與研究組的其他受試者相比顯著增加(圖6D),這可能是由於抗生素誘導的微生物宿主群體的擾動,或者甚至是由於β-內酰胺(b-lactams)的直接突變促進作用。

討論

自從人類腸道病毒的第一次關注宏基因組研究揭示了以前未知、複雜和多樣的噬菌體和真核病毒群落以來,已經過去了十多年,這些噬菌體和真核病毒在形成微生物群落和影響人類健康方面具有潛在的作用。儘管過去十年在理解這些病毒群落方面取得了相當大的進展,但

病毒宏基因組方法學的許多缺點是顯而易見的,例如難以區分真正的病毒序列和細菌DNA汙染,DNA擴增偏差,當前病毒數據庫的不完善、不能對大多數序列進行分類學上的分類(“病毒暗物質”)以及缺乏關於噬菌體宿主範圍和感染週期類型的信息。因此,許多以前的研究只專注了一小部分可識別的序列(14%-30%),忽略了病毒組的其餘部分。要了解腸道中這些病毒群落的動力學和生物地理學,以及它們對腸道微生物組和整個有機體穩態的重要性,還有許多工作要做。

在這篇文章中,我們對10名健康受試者進行了為期至少1年的糞便VLP部分的全面縱向宏基因組研究。在嚴格去除細菌汙染序列後,我們不再依賴於不完整的病毒序列數據庫,而是採用了全新的病毒發現方法,並創建了一個大的完整病毒基因組和片段病毒基因組序列的目錄(n = 39254)。我們知道病毒基因組具有模塊化結構,並且經常通過重組表現出相當大的鑲嵌性,因此我們通過設置覆蓋範圍75%作為病毒序列檢測的閾值以此去除數據集的噪聲。儘管如此,我們還是能夠比對到82.8%的VLP reads。雖然大多數腸道病毒仍然未知,但我們應用了兩種獨立的從頭分類方法,將大多數數量上佔優勢的病毒序列分配到科水平,並初步分配到亞科或屬水平。我們還在一些糞便樣本中添加了已知濃度的外源噬菌體,以實現內源性病毒基因組的絕對定量。

使用這些方法,我們能夠證明與糞便病毒個體特異性一致的令人印象深刻的時間穩定性。相同或非常接近的病毒株穩定裝配在微生物組中持續長達26個月(圖2A)。這與早期在一個健康成人中觀察到的病毒組高度穩定性和在一組單卵雙胞胎中進行的較短時間的研究相一致。這種組成的穩定性也反映在α-多樣性水平和病毒總數的穩定水平上(圖1D),表明病毒種群不受週期性波動和經典的“殺死贏家(kill the

winner)”動力學的影響,至少在物種水平上是如此,但通過其他機制在腸道生態系統中得以維持。這種行為完全符合溫和的噬菌體生活方式。事實上,通常假設腸道病毒與其他細菌密度極高的環境相似,是由溫和的噬菌體控制的,它們與宿主之間遵循“搭載贏家(piggyback the winner)”式的動態相互作用。在人類腸道中也報道了溫和噬菌體序列的流行。在這方面某種程度上矛盾的發現,我們將在後面討論。

我們證明組成病毒組的穩定性主要與相對少量的高度流行、持久和個體歧視(individual-discriminatory)的病毒基因組聯合體(PPV)有關

,後者構成了大多數VLP序列(圖3D)。CRISPR間隔序列匹配分析表明,大多數PPV噬菌體感染Bacteroides, Faecalibacterium, Eubacterium,Prevotella,和Parabacteroides,所有這些都是豐富的、持久的,並且高度適應腸道環境(圖4C)的細菌。儘管PPV噬菌體構成了病毒組的主要部分,並且在數月至數年內組成穩定,但也存在低丰度但高度多樣性的病毒序列(每個樣品高達數千個)。我們將這種不太穩定和非個體化的病毒稱為“瞬時檢測的病毒”(transiently detected virome,TDV)。我們的數據提供了一些初步證據,TDV相對PPV可能在個體間更為共享,這需要在更大規模的橫斷面人群研究中驗證。與PPV相反,TDV噬菌體含有多種CRISPR原間隔區,這些原間隔區對應於不太豐富和更短暫的細菌分類群,如Streptococcus, Clostridium, Akkermansia, Acinetobacter, Listeria, Escherichia,和Bilophila。這並不排除瞬時病毒基因組具有同樣持久性的可能性,但對相對丰度非常低的基因組進行可重複檢測可能是不可能的。

與以前的研究一致,大部分PPV和TDV片段都是由雙鏈DNA有尾噬菌體目噬菌體和單鏈DNA裂解性噬菌體Microviridae科(圖3F)的代表的,儘管Microviridae科的流行可能由於擴增偏倚而有些誇大。通過使用一種全新的聚類方法,我們能夠檢測到一個佔優勢的和持續存在的病毒群的小的跨主體系統發育核心,它整合了22個crAss-like噬菌體、其他有尾噬菌體目和Microviridae科(

圖4E圖5)。我們的數據證實了以前的觀察,即在腸道病毒組中,crAss-like噬體具有特殊的,有時是核心的作用。在這項研究中,只有十個個體中的一個沒有通過檢測一種或另一種類型的crAss-like噬菌體的可檢測水平而被定殖。這些具有90-105 kb dsDNA基因組的明顯烈性的噬菌體也具有在受試者之間共享的最高傾向(圖3G),並且與小的裂解性單鏈DNAMicroviridae一起控制了小的系統發育核心。一半受試者共有22個病毒聚類,其中12個由這兩個病毒群代表(圖5)。在兩個受試者(918和924)中,屬於兩到三個不同聚類的四到七個不同聚類的crAss-like噬菌體菌株的特定組合佔總病毒組的高達97%,並在研究期間持續存在於微生物組中,通常具有最小的基因組序列變異(圖3I6A)。同一受試者的總病毒載量很高表明,類似crAss的噬菌體形成了大量的群體,這些群體疊加在腸道中的其他病毒上,而不是取代它們。與此同時,在crAss-豐富的個體中,多樣性的降低(圖1E)和PPV大小較小(圖3F
)可以通過在有限的測序深度條件下用幾個高度佔優勢的序列掩蓋背景多樣性來解釋。

與預期一致,有尾噬菌體目的許多其他成員似乎是溫和的。然而,溫和噬菌體並不主導病毒組,在核心(22個聚類中的3個)中也不佔優勢。受試者916是這一規則的一個有趣的例外,其總病毒載量持續較低,與高病毒多樣性和溫和的有尾噬菌體目(Caudovirales)的明顯優勢一致(圖1D)。在受試者916中沒有大量裂解性噬菌體的情況下,很可能是從常駐微生物菌株中誘導原噬菌體,而不是裂解性複製,成為高度多樣化、均勻分佈且主要是溫和的噬菌體集合的主要貢獻者。

由於經典的溫和噬菌體很少控制腸道病毒組,除了整合入宿主基因組的能力之外,其他機制似乎也是人類腸道噬菌體長期存在的主要原因。最近,有報道稱,一種crAss-like的噬菌體能夠與其宿主一起增殖,而不會顯著影響其生長。甚至一些特徵明確的裂解性噬菌體,如大腸桿菌噬菌體T7,已被證明能穩定地在單系小鼠的腸道中定殖。在糞便微生物移植研究和動物定殖模型中,crAss-like噬菌體可以穩定地植入並逐漸控制病毒體,而不會顯著影響其宿主群體的水平。裂解性噬菌體在腸道中穩定、高水平定殖的確切機制需要進一步闡明。

我們對SNPs的逐漸積累和親本基因型的替換以及噬菌體群體的顯著微基因組的觀察(圖6A)支持了以前一項小規模研究的數據,並可被解釋為紅皇后(Red Queen)共進化動力學存在的標誌,而被早期人類腸道病毒體的縱向研究所忽略。最近的一份報告觀察到小鼠腸道中連續的拮抗噬菌體-宿主共進化,導致細菌抗性和噬菌體抗性之間的“軍備競賽”。De Sordi等人提出,噬菌體捕食的選擇性壓力和持續的軍備競賽可能是腸道中細菌和宿主種群持續高多樣性背後的主要驅動力,這反過來又導致微生物群落整體更大的穩定性和彈性。在PPV的某些病毒類型的高丰度和最近提出的針對水生環境產生的噬菌體動態的“皇室(royal family)”模型之間可以得出一些有趣的相似之處。與海洋相似,腸道中的“殺死贏家(kill the

winner)”效應很可能在細菌和噬菌體菌株以及子菌株的水平上起作用,使得微生物群落在物種、屬或更高級別分類水平上的分類組成長時間保持完整。

在我們的研究隊列中,我們觀察到細菌微生物群落和病毒群落之間存在非常密切的相關性

(圖2D)。例如,Prevotella相對丰度的相對梯度和Barnesiella, Eggerthella和Bacteroides的相對丰度似乎是病毒組組成中很大一部分差異的原因。最近的研究表明,Prevotella的相對丰度越高,表明微生物總量越低,結腸運輸時間越快。一致地,我們觀察到,在我們的受試者中,Prevotella的相對丰度較高,同時總病毒載量較低(圖1D-1F),溫和噬菌體的流行率較高。Prevotella的相對高水平和低的總病毒載量也與病毒體的α-多樣性增加相關(例如,在受試者916和922中)。這是合乎邏輯的,因為去除少量優勢病毒會自動暴露低丰度病毒的高多樣性。有趣的是,crAss-like噬菌體和Microviridae科的累積相對丰度之間的權衡似乎與前述的Prevotella/Bacteroides比率無關,這與之前的預測一致,即這兩個屬都可以作為這兩個病毒科成員的宿主。

細菌、古細菌和真核生物的病毒在大小和物理性質上有很大差異。因此,由於方法學的限制,在我們的數據集中,許多病毒分類群似乎沒有得到充分的代表,甚至完全沒有引起我們的注意。

通過0.45毫米孔過濾器過濾糞便勻質物,並用氯仿提取,可除去大的或有包膜的噬菌體顆粒,而用聚乙二醇沉澱可能不能有效地捕獲一些最小的病毒顆粒。最近,在豬、狒狒和某些人類群體的腸道中檢測到一種基因組大小大於0.5 Mbp的未培養的Prevotella大噬菌體。據報道,包括人類和動物微生物群在內的各種環境中存在大量的巨型噬菌體,其基因組特徵表明存在複雜的噬菌體-宿主和噬菌體-噬菌體相互作用。在我們的研究中,使用200 kb基因組大小的“巨人”閾值,我們能夠檢測到三個部分的噬菌體基因組(201-292 kbp)以及一個288 kbp的完整環狀基因組。然而,它們都不是PPV的一部分。許多研究也報道了使用病毒宏基因組學在人類腸道中檢測到巨型變形蟲和藻類感染病毒的爭議。

總之,我們展示了一項深入的縱向研究如何為人類腸道病毒體的複雜性質提供了新的見解,並證明了一種個人持久性病毒組的存在,這一發現在橫斷面研究中是不可能的。我們還開發了一些工具,在應用了嚴格和可靠的病毒重疊群鑑定流程後,可以對回收序列的大部分進行分析,而不是少數。儘管高個體間變異性是病毒體的一個特徵,但幾乎可以肯定的是,這是單個病毒重疊群的菌株水平特性的結果,我們表明基於蛋白質的聚類方法允許在個體或組群之間進行比較。這項研究提供了一個平臺來理解組成病毒體的不同生物實體及其在腸道微生物群和人類健康中的作用。

翻譯:秋芒樹 待業

責編:劉永鑫 中科院遺傳發育所

Andrey N. Shkoporov, Adam G. Clooney, Thomas D. S. Sutton, Feargal J. Ryan, Karen M. Daly, James A. Nolan, Siobhan A. McDonnell, Ekaterina V. Khokhlova, Lorraine A. Draper, Amanda Forde, Emma Guerin, Vimalkumar Velayudhan, R. Paul Ross & Colin Hill. The Human Gut Virome Is Highly Diverse, Stable, and Individual Specific. Cell Host & Microbe 26, 527-541.e525, doi: https://doi.org/10.1016/j.chom.2019.09.009 (2019).

10000+:菌群分析 寶寶與貓狗 梅毒狂想曲 提DNA發Nature Cell專刊 腸道指揮大腦

系列教程:微生物組入門 Biostar 微生物組 宏基因組

專業技能:學術圖表 高分文章 生信寶典 不可或缺的人


分享到:


相關文章: