骨灰分析!新冠病毒是不是源自實驗室?

骨灰分析!新冠病毒是不是源自實驗室?

撰文 | 薛宇(華中科技大學生命科學院)

●  ●  ●


近日,美國匹茲堡大學學者James Lyons-Weiler發過兩個帖子,認為2019-nCoV有可能來源於實驗室。這些菌株在實驗室裡連接了載體pShuttle-SN,該載體是通用載體,連接這個載體制備的菌株,主要是為了生產冠狀病毒的疫苗。

這兩個帖子的原文如下:


1. On the Origins of the 2019-nCoV Virus, Wuhan, China, 1/30/2020, https://jameslyonsweiler.com/2020/01/30/on-the-origins-of-the-2019-ncov-virus-wuhan-china/

2. Moderately Strong Confirmation of a Laboratory Origin of 2019-nCoV, 2-2-2020, https://jameslyonsweiler.com/2020/02/02/moderately-strong-confirmation-of-a-laboratory-origin-of-2019-ncov/

Lyons-Weiler將2019-nCoV和其他冠狀病毒的基因組序列進行比對,發現2019-nCoV存在一段在其他冠毒裡不存在的、長度為1,378 bp的插入片段(INS1378),將這段序列與pShuttle-SN重組載體序列進行比對,有67%的同一性(圖1,參見James的第一篇博文)。


骨灰分析!新冠病毒是不是源自實驗室?

因此,他的主要論點是:來自實驗室的重組病毒,其目的是為了生產疫苗(A recombined virus made in a laboratory for the purpose of creating a vaccine)。他認為支持或反對這個論點的證據如下:


A. 支持的證據:INS1378與pShuttle-SN之間的相似性;存在蝙蝠冠毒中的類SARS的Spike蛋白,或者與冠毒非常相似;自展值低。

B. 反對的證據:低序列相似性(指INS1378與pShuttle-SN之間,但仍然高度顯著);這些RNA病毒可能快速演化(例如在實驗室條件下)。

C. 論點的可能性:高度可能。

D. 驗證:檢測中國實驗室裡的所有在研的冠毒(一例即可證明);在野外分離一個菌株能夠與2019-nCoV匹配(一例即可證偽)。

Lyons-Weiler描述的驗證方法。事實上要證明Lyons-Weiler的觀點是正確的,比較困難,因為必須要檢測到一株實驗室裡在研的、用來生產疫苗、並且與2019-nCoV高度相似的病毒菌株。如果找不到這樣的菌株,既不能證明James的觀點是對,也不能證明他的觀點是錯的。但是James也提出了證偽的方法,那就是找到一株在野外分離的菌株能夠與2019-nCoV匹配,這樣即可表明他的觀點是錯的。

下面證明開始。第一,我們需要先知道冠狀病毒的突變速率。查閱文獻,2004年Zhao等人發表論文,推測SARS-CoV基因組的突變速率約是0.80 - 2.38 x 10^-3個鹼基/位點/年,這個結果與其他RNA病毒有相同的數量級(Zhao et al. BMC Evol Biol. 2004 Jun 28;4:21. https://www.ncbi.nlm.nih.gov/pubmed/15222897)。

我們考慮上限,一個SARS-CoV基因組的突變率應當不超過3x 10^-3個鹼基/位點/年,2019-nCoV的基因組長度為29,903 bp(https://www.ncbi.nlm.nih.gov/nuccore/NC_045512),這樣可以算出來2019-nCoV每年突變的鹼基應該<29,903*3x 10^-3=~90 bp。由於計算方法不同,估算出來的突變速率可能不盡相同;病毒基因組的各個部分,可能進化速率也不一致。例如,2004年一篇Science上估算SARS-CoV的突變率為8.26 × 10^–6個鹼基/位點/天(https://www.ncbi.nlm.nih.gov/pubmed/14752165),換算得到2019-nCoV每年突變鹼基為90 bp(8.26 × 10^–6*365*29,903),與我上面的分析一致。


2004年另一篇論文估算SARS-CoV的突變率為5.7 × 10^–6個鹼基/位點/天(https://www.ncbi.nlm.nih.gov/pubmed/15347429),換算之後得到2019-nCoV每年突變鹼基為90 bp為62 bp。另外,需要注意的是,目前的分析表明,2019-nCoV的進化速率比較低,有研究者估算2019-nCoV的突變率是2.067×10^-4個鹼基/位點/年(http://virological.org/t/temporal-signal-and-the-evolutionary-rate-of-2019-n-cov-using-47-genomes-collected-by-feb-01-2020/379),換算之後大約是每年全基因組6個鹼基突變,遠比我假設的突變率要低。因此,我們估算2019-nCoV每年大約突變90個鹼基位點,這個數字可以認為是上限。


第二,中科院病毒所石正麗等人1月23日在線提交了一篇預印本文章,標題為《Discovery of a novel coronavirus associated with the recent pneumonia outbreak in humans and its potential bat origin》(https://www.biorxiv.org/content/10.1101/2020.01.22.914952v2),其中很重要的一個分析就是發現2019-nCoV與從雲南省的某種菊頭蝠(Rhinolophus affinis)裡分離的BatCoV RaTG13(https://www.ncbi.nlm.nih.gov/nuccore/MN996532.1,基因組長度29,855bp)有96.2%的全基因組相似性。我們把2019-nCoV(核酸序列標識符NC_045512)與BatCoV RaTG13(核酸序列標識符MN996532)做雙序列比對,在NCBI BLAST(https://blast.ncbi.nlm.nih.gov/Blast.cgi)點擊“Global Align”,進入到雙序列比對的頁面,結果如下:

骨灰分析!新冠病毒是不是源自實驗室?

兩者同一性96%,有29,905-28,717=1,188對鹼基差異,由於兩者可以獨立演化,全基因組突變速率3x 10^-3個鹼基/位點/年,2019-nCoV和BatCoV RaTG13每年大約分別全基因突變90 bp,因此大致可以估算兩者的分歧時間大約是:1,188/(90*2)=6.6年。在石老師的文章裡,他們先利用較短的RNA依賴的RNA聚合酶(RdRp)區域確定與2019-nCoV可能相似的蝙蝠來源的冠毒,根據結果對BatCoV RaTG13進行了全基因組測序。

因此,BatCoV RaTG13可能是實驗室裡目前找到的、與2019-nCoV最相似的病毒;其次,如果石老師的實驗室發生洩漏,BatCoV RaTG13在自然界中獨立演化成2019-nCoV,至少需要6.6年。第三,由於2019-nCoV需要演化6.6年,那麼必須在野外找到大量的過渡性、相似度與2019-nCoV更高的菌株,才能證明實驗室洩露是可能發生的。

第三,James宣稱的INS1378是2019-nCoV獨有的片段,這個分析是不對的。我們根據James提供的序列(https://jameslyonsweiler.com/wp-content/uploads/2020/02/inserted-portion.txt),在https://blast.ncbi.nlm.nih.gov/Blast.cgi頁面,點擊“Nucleotide BLAST”選項,進入頁面之後輸入這段序列,“Program Selection”裡選擇“Somewhat similar sequences (blastn)”進行核酸序列的比對,“Algorithm parameters”的Max target sequences選擇“250”,這樣能看到更多的比對結果。然後點擊BLAST找相似性序列,部分結果如下:


骨灰分析!新冠病毒是不是源自實驗室?

注意從下往上數的第3和第4個結果,分別是蝙蝠來源的類SARS-CoV,包括bat-SL-CoVZC45和bat-SL-CoVZXC21。我們點擊“Bat SARS-like coronavirus isolate bat-SL-CoVZC45, complete genome”,部分比對結果如下:


骨灰分析!新冠病毒是不是源自實驗室?


可以發現INS1378在bat-SL-CoVZC45裡有相似度較高的片段。在剛才的比對結果頁面,使勁的往下翻,任意點擊一個比方說SARS coronavirus PC4-13, complete genome,比對結果如下:


骨灰分析!新冠病毒是不是源自實驗室?


因此INS1378在SARS-CoV PC4-13裡也有相似性片段。所以結論是INS1378在冠狀病毒裡廣泛存在相似片段,並不是僅在2019-nCoV或BatCoV RaTG13裡獨有。


第四,INS1378有沒有可能來源於pShuttle-SN載體?根據James提供的pShuttle-SN載體的序列標識符(https://www.ncbi.nlm.nih.gov/nuccore/AY862402,長度5,607 bp),我們用BLAST頁面的“Global Align”做全局雙序列比對,結果如下:


骨灰分析!新冠病毒是不是源自實驗室?

兩者的整體相似性是20%,這麼低的相似程度,不能說明INS1378來源於pShuttle-SN載體。由於BLAST的“Global Align”用的是Needleman-Wunsch算法做全局雙序列比對,我們換個工具,用基於Smith-Waterman算法的EMBOSS Water(https://www.ebi.ac.uk/Tools/psa/emboss_water/)來做局部雙序列比對,結果如下:

骨灰分析!新冠病毒是不是源自實驗室?

可以看到這兩條序列之間有局部的66.0%的同一性,差異的鹼基對是1387-916=471 bp。我們上面講過了,冠毒全基因組突變速率不超過3x 10^-3個鹼基/位點/年,因此長度為1387 bp的片段,每年平均突變4個位點。實驗室用的載體,是恆定的、不發生自然演化的,因此INS1378如果來源於pShuttle-SN載體,其獨立進化的時間是471/4=~118年。James在博文中講了pShuttle-SN載體是Bert Vogelstein在1998年構建的,距今22年,因此INS1378不可能從pShuttle-SN載體演化出來。另外,所謂的載體,應當是全長才會有效,目前沒有文獻表明,pShuttle-SN載體中長度約為1378 bp的片段能夠單獨發揮作用。


因此我的結論是,第一,如果2019-nCoV源自實驗室洩露的BatCoV RaTG13,這個洩露事件應當至少在6.6年之前,且野外必須能夠找到大量的、介於2019-nCoV和BatCoV RaTG13之間,且與2019-nCoV具有更高相似度的病毒菌株。第二,James宣稱的僅在2019-nCoV裡存在的長度為1387 bp的片段,即INS1378,事實上在各種冠毒中廣泛存在相似性片段。第三,INS1378與pShuttle-SN載體的序列全局相似性只有20%,局部相似性也並不高,不能支持INS1378源自pShuttle-SN載體的觀點。


分享到:


相關文章: