《美國科學院院報》"反水"了?

文 觀察者網專欄作者 岑少宇

留澳科普作者,《生物學的足跡》

4月8日,《美國科學院院報》(PNAS)發表了一篇文章,在國際學術圈與中國輿論場內,又掀起了些許波瀾。有些媒體和自媒體在報道時,將其視為病毒溯源的重要證據;與之相反,學術界卻對其有不少批評意見。

PNAS論文好眼熟

這篇題為《Phylogenetic network analysis of SARS-CoV-2 genomes》的文章,與之前被部分人引為“溯源證據”的兩篇論文有些相似之處:即西雙版納熱帶植物園(版納所)的《Decoding the evolution and transmissions of the novel pneumonia coronavirus (SARS-CoV-2) using whole genomic data》,以及多位中國科學家共同撰寫的《On the origin and continuing evolution of SARS-CoV-2》。

看英文名字也許你還不熟悉,不過一提坊間流傳的說法——“五毒說”和“S型、L型”,大概就知道了吧。

《美国科学院院报》

PNAS論文的配圖

《美国科学院院报》

被錯誤歸納為“五毒說”的版納所文章的配圖

《美国科学院院报》

《On the origin and continuing evolution of SARS-CoV-2》的配圖

三篇論文都是根據早期樣本的基因差異建立網絡,看著相似一點都不奇怪。只不過版納所和PNAS的主要歸類,都是依據網絡的結構,而S型、L型的歸類則是根據兩個互相關聯的位點——8782與28144,PNAS論文的網絡中,A類與B類分支也正是據這兩個位點形成的。

一些媒體與自媒體對文章的解讀也相似,認為其中某一個類群更為“古老”,進而認為“古老”類群在哪個地方多,那個地方就可能是起源地。

遺憾的是,“古老”類型的推斷並不成立。PNAS論文與另兩篇論文一樣,都用蝙蝠冠狀病毒序列RaTG13作為參考。我在之前的文章中就指出過:

蝙蝠冠狀病毒序列RaTG13與新冠病毒雖然接近,但要用來確定“祖先”還差得太遠。RaTG13與新冠病毒大約有4%的差異,即1000個以上的核苷酸,而新冠病毒的差異也就十幾個,根本不能確定RaTG13哪些地方與真正的“祖先型”接近。

大牛Andrew Rambaut一連噴了好幾條推特,以下只是其中的三條:

《美国科学院院报》

這篇文章有許多地方都犯了大錯,包括內容、發現結論和發佈的途徑。

首先是試圖用蝙蝠病毒RaTG13給新冠樹定根。這是最接近的非人病毒,但和新冠仍有超過1100個核苷酸的差異。然而請注意,由於某些原因,圖上連到蝙蝠的分支比1100個核苷酸短些。

實際上,關於內容我想說的就這麼多,根定錯了,所有的結論(包括《每日郵報》裡的那些)都得不到支持了。

Andrew有一條推特尤為重要,可以直觀看到用RaTG13為什麼錯了。他用差不多時間段的156個基因組,建了一棵樹(JC69是Jukes和Cantor 1969年建立的模型),圖中右側往下一串密密麻麻的,就是新冠的分支,而上面一個孤零零的紅點,則是RaTG13,用相距這麼遠的玩意兒定根不是搞笑嗎?

《美国科学院院报》

在方法上,PNAS論文還廣受詬病的一點是,這麼晚還在用僅僅160個樣本,如果是2月的文章,還說得過去,可現在還發這樣的文章,遲鈍得簡直像IE瀏覽器。

版納所等文章提前上網進一步放大了PNAS論文的滯後感,但即使忽略這一點,PNAS論文確實也沒有帶來多少新東西。但後者甚至沒有提及這兩篇已有頗多討論的類似文章。

不過,我在這裡要為論文作者說兩句公道話,現在固然已經公佈了大量樣本基因,但一般而言,它們對溯源並無幫助。我在最近的文章裡寫過:

後面採集的樣本其實主要是在把“樹”做大,對挖“深”根部沒什麼幫助……最多也就是整體判斷下,“大樹”有沒有什麼“異常”。

因此,作者沒有用上後來的幾百上千個數據,並不是什麼過錯。

但早期數據的弊病,作者也沒有克服。我曾說明:

中國一開始對疾病的判斷限定與海鮮市場有關,美國等一開始限定與中國有關,從避免恐慌、避免擠兌醫療資源的角度來說,是可以理解的,但給溯源帶來了更多困難。

現有的早期樣本的比對研究,都無法擺脫這個困擾。而且樣本少的情況下,稍有缺失,就會有很大影響。

早期樣本的數量需要增加,但如果只是在原有數據中,稍微放寬選取的時間,是沒有用的;如果新測了一些早期樣本,但這些樣本是按照舊原則確定的,同樣也沒用。簡單地說,測來測去都是市場相關、武漢相關或中國相關的病例,那麼溯源問題幾乎不會有突破性的進展。

怎麼做才有用呢?對於這樣一個存在大量輕症且可自愈的疾病,需要廣泛尋找更早的疑似病例檢測。

可見,在這樣的情況下,論文作者用的數據不多,不是什麼大問題,但在數據沒有根本性突破的時候,確實做了無用功。

PNAS論文將古生物學已有不少應用的系統發生網絡,應用到病毒進化上,算是一點小小的創新。但版納所的文章用得更早,連軟件都是一樣的NETWORK(當然具體工具還是有所不同)。

系統發生網絡,和一般的系統樹相比,一個比較明顯的特徵,就是樣本會出現在節點上,而樹的樣本出現在末端。系統發生網絡在病毒進化中也許可以更好地反映出重組信息。

學術研究會有路徑依賴,但我想病毒學家此前沒有積極應用系統發生網絡的原因,可能不只是這樣。樣本間兩兩比較地構建系統樹,也許更方便將流行病學調查的數據納入模型,而這些對病毒學研究是至關重要的。

因此,PNAS論文的這些小創新,很難得到喝彩。

這裡插播點學術八卦。學術圈很快注意到,這個古生物學方法的遷移很可能來自作者之一、古人類學者Colin Renfrew,而另外三個是Forster一家……

這篇文章呢,正巧是Colin Renfrew以美國科學院院士的身份在自家院報上“貢獻”(contribute)的。有人嘲諷說,其實誇師孃的文章都能“貢獻”到院報上,我覺得有點誇張了;但“貢獻”文章有相當一部分質量不高,這樣的說法並不誇張。

另外,《2018 年中國科學院文獻情報中心期刊分區表》把PNAS降為了2區,只把Nature和Science留在了1區。

更早幾年,有人在學術論壇上說:“PNAS是美國科學院院刊,在上面發文章,美國科學院院士有一定的特權(一年能contribute 4篇),由此導致一些不規範和不公平在所難免。現在國內一些課題組有錢,常請一些美國科學院院士過來交流訪問,然後通過這些院士在PNAS上發文章,接著拿著這些文章當作重大成果去申請經費,其中有些文章的水平連專業學科二類雜誌的水平都達不到。特權的存在是這麼多年來PNAS常被人詬病以及在一些學科領域顯得非主流的一個重要原因。”

與國內的這層關係,這是不是PNAS降區的主要原因呢?這隻能問中科院了。

八卦到此結束,回到正題。

媒體的烏龍

前面的討論或許還可歸為學術範疇,絕大部分媒體、自媒體工作者“無能為力”,但以下關鍵性誤讀還是難辭其咎的:論文作者壓根就沒有從某一“古老類群”中某地類型的多寡,去談論起源地。

對於致病微生物來說,某些分支變大,基因多樣性變高,不能單單憑此證明來源地是哪裡,我之前文章裡舉過一個例子:

病毒在A地傳播,但傳播的人數有限,傳到B地後,疫情失控,B地的病毒雖然晚,複製的機會卻比留在A地的病毒多得多,那麼複製出錯的機會也就更多,基因多樣性也就上去了。

PNAS論文作者當然不會犯這樣的錯誤。我們可以比對論文原文與流傳的說法,看看誤讀到底是怎麼發生的。

作者在摘要裡說的是:A類與C類有相當多比例在東亞以外地區被發現。相反,B類是東亞最常見的類型,B類的原始類型似乎沒有傳到東亞以外,直到最初的突變產生B類衍生型後才傳出去。這一現象指向奠基者效應或東亞以外對B類原始型在免疫上或環境上的抗性。

《美国科学院院报》

在正文裡說的是:根據同義突變T29095C,A類可以明顯分為兩個子簇。在T突變子簇裡,四個中國個體(來自華南沿海省份廣東)攜帶原始類型,三個日本和兩個美國病人與之不同,有一些突變差異。據報告,這些美國病人都在推測是爆發源頭的武漢有居住史。

C突變子簇裡有相對長的突變分支,包括五個武漢個體,其中兩個顯示在原始節點裡;還包括8個來自中國和鄰國的東亞人。然而值得注意的是,C突變子簇裡幾乎一半(33個裡面的15個)的類型,在東亞以外被發現,主要在美國和澳大利亞。

《美国科学院院报》

一些媒體、自媒體說A類裡“更多”“主要”的是美國、澳大利亞,實在離譜。仔細看原文就能發現,作者講到美澳時,只是提了其中一個子簇,而東亞以外的樣本,甚至還不到這個子簇的一半。

我都懷疑作者是不是寫錯了,在那張圓圈大小代表的樣本數沒有具體標註、T子簇與C子簇也沒有標註的爛圖上,根本看不清楚啊,一下子還真數不出15/33。

我乾脆下了數據表格看,給中國的標上紅色,總共12個,包括臺灣、香港各1,給美國的標上藍色,給澳大利亞標上紫色,給歐洲標上綠色。作者原來沒寫錯,非東亞還真是15/33,其中美國7個,澳大利亞5個,兩者相加比C子簇總數的1/3,也就是11個多1個。

《美国科学院院报》

所以,美澳的“主要”是指A類中的C子簇中的非東亞樣本中的“主要”。可一些媒體和自媒體,竟然直接把中間內容全部砍掉了。

此外,從上面兩段引文裡還可以看到,作者指出A類T子簇、C子簇的原始類型,中國都有份。不管A類是否真的“古老”,從這篇文章中,也無法得出令人滿意的關於起源的確切結論。

早在探討版納所論文時,就有不少學者指出,美國和廣東最早的病例,雖然因為錯誤的定根而被誤認為更“原始”,但都有武漢旅行史,而且發病時間晚於武漢早期病例。所以,很難說是從那裡傳到武漢的。

但我們也不能斷言,就一定是武漢傳過去的,新發現一批早期樣本,就有可能產生顛覆性的結果。

這可以充分說明,如我前面所言,早期樣本缺失帶來了多麼大的困境。

總體而言,這篇論文和先前的類似論文一樣,由於方法上的缺陷,在學術圈“收穫”了一堆批評,而媒體則由於誤讀,又鬧了一次烏龍。

科學的結論依然是,根據現有證據,不知道新冠病毒確切的起源。

政治與科學

有的朋友也許會問,新冠病毒起源問題已經政治化了,怎麼能就科學談科學呢?

然而,科學問題是基礎,如何做出政治決策是要建立在科學基礎之上的。輿論戰就是戰爭,你可以把各種論據比作彈藥,科學家和科普工作者就是彈藥專家。他們有義務告訴指戰員們,哪些彈藥威力巨大,哪些彈藥可能是啞彈,哪些彈藥甚至可能會炸膛。至於在瞭解彈藥性能後,指戰員如何使用,那就是政治範疇了。

你也可以把一篇論文,視作輿論戰的一處戰場,科學家和科普工作者的任務就是勘察戰地,必須報告指戰員:哪些地形有利,可以大作文章;哪些地形不利,不妨避戰;還有哪些地形可能依然處於迷霧中,情況不明,需要慎重對待。

但是地形不利,地形不明,或許也可以“兵行險著”,也可能會取得戰果,這些也是政治決策者的工作。

反過來說,如果科學家和科普工作者,出於某種政治目的,刻意錯誤解讀論文,也就是給出了錯誤“情報”。這樣不僅沒有幹好自己的本職工作,反而有越俎代庖之嫌。

也有的朋友或許會說,那這些情報完全可以寫內參啊,為什麼要在公共領域裡發佈呢?

這也許要歸結為新媒體時代的特殊性。如今的輿論戰有官方和民間兩種力量。“民間武裝”可以當好一個免疫系統,與癌細胞(境內謠言)和病原體(境外輸入謠言)作鬥爭。現在,極少數“民間武裝”還有走出國門、反駁謠言的可能。

“民間武裝”的這些行動,同樣需要“情報支持”。然而,他們不受官方節制,與官方不通情報,如果科學家和科普工作者只通過內部渠道向官方提供信息,這些“民間武裝”就得不到可靠的“情報”。

因此,在公共平臺上,還是有必要堅持科普,堅持實事求是。至於“民間武裝”收到情報後,如何決策,如何行動,那是他們的權利。

也有人擔心,這些“情報”不會被別人利用嗎?當然有可能,但因此而閉塞信息,實在不符合互聯網精神,也沒有更好的辦法,向這麼廣大的“民間武裝”提供情報。

而且,目前沒有證據證明任何一個國家是病毒源頭,這些“情報”並不能被敵人用作實錘。有些美國人倒是想“兵行險著”,妄言源頭,妄用名稱,已經吃了從WHO、中國到美國國內反對派的很多批評。

最後不得不提的是,政治化也許已經徹底阻絕了找到源頭的可能。如前所述,要找源頭,最需要的是突破早期診斷標準的限制,各國都應該去“偷墳掘墓”,但政治化後,恐怕誰都不想去做“吃力不討好”的事。

政治化真真切切地阻礙了“人類衛生健康共同體”的構建,這一共同體事關每個人的福祉,誰有理由不譴責這樣的政治化呢?

來源|觀察者網

《美国科学院院报》《美国科学院院报》


分享到:


相關文章: