02.01 新冠病毒破解有了巨大突破:疑似病例基因分析縮短至半小時!

2月1日,浙江省疾控中心上線自動化的全基因組檢測分析平臺。利用阿里達摩院研發的AI算法,可將原來數小時的疑似病例基因分析縮短至半小時,大幅縮短確診時間,並能精準檢測出病毒的變異情況。

新冠病毒破解有了巨大突破:疑似病例基因分析縮短至半小時!

達摩院算法專家顧斐博士在疾控中心基因檢測分析現場

01

新冠病毒破解有了巨大突破:疑似病例基因分析縮短至半小時!

當前,全國新型冠狀病毒肺炎疫情依然嚴峻,快速、精確診斷對於疫情控制尤其重要。公開信息顯示,該病毒是基因組序列最長的病毒之一,全基因組序列全長29847bp,臨床診斷需要將患者樣本與該病毒基因序列進行比對才能確定診斷結果。

目前醫院普遍採用核酸檢測方法,其只能檢測到病毒基因的局部。由於病毒存在變異的可能性,對於整個基因序列來說這種檢測方法猶如盲人摸象,一旦病毒發生變異,就可能出現漏檢的情況。

新冠病毒破解有了巨大突破:疑似病例基因分析縮短至半小時!

新型冠狀病毒結構

不同於傳統核酸檢測方法,全基因組檢測技術可以對疑似病例的病毒樣本進行全基因組序列分析比對,能夠有效防止病毒變異產生的漏檢。此次阿里巴巴達摩院與傑毅生物技術公司聯合研發的平臺採用的就是全基因組檢測方法,其突破之處在於大幅縮短了檢測時間。

在基因分析階段,阿里巴巴達摩院和阿里雲彈性計算團隊提供的系統還能提供病毒快速拼接能力,將快速精準捕捉變異後的病毒序列,二級結構及三維結構,為病毒疫苗和藥物提供了基礎。

新冠病毒破解有了巨大突破:疑似病例基因分析縮短至半小時!

設置基因檢測分析參數

診斷效率的提升得益於算法的創新。達摩院團隊針對新型冠狀病毒基因進行特徵分析,並推出多個算法模型。在序列比對過程中,達摩院對算法增加了分佈式設計,提升了比對效率;在病毒序列拼接階段使用分佈式設計的de Bruijn圖算法,變異病毒也能精準檢測。

浙江省疾控中心基因測序負責人孫逸博士表示:“該平臺基於阿里雲的強大算力與達摩院新算法可以為病毒的解析提供支撐,基於該平臺,未來還可以在短時間內將檢測範圍覆蓋整個確診病例,也為後續疫苗與藥物研發打下了堅實基礎。”

02

以下是達摩院算法專家對該平臺的解讀:

Q:這一平臺有何特點?

A:此次研發的自動化全基因組檢測分析平臺屬於高通量測序,平臺由阿里巴巴達摩院聯合傑毅生物共同研發,可以給浙江省疾控在新型冠狀病毒疫情防控上提供了全自動建庫和分佈式計算分析能力。傑毅生物開發了全自動高通量測序建庫儀,把整體常規人工需要12小時的工作縮短到2個小時。每次測序過程會產生海量的數據,達摩院採用分佈式設計的分析算法,樣本基因分析的速度由數小時縮短到半小時;同時,由於採用分佈式算法,病毒拼接的速度由30分鐘-1小時縮短到15-30分鐘。除此之外,不同於傳統核算檢測方法,這一平臺還可以檢測到病毒的全貌,避免因為病毒變異造成的漏檢情況。

Q:達摩院團隊提供的算法有哪些價值?

A:達摩院針對新冠病毒基因的特徵進行了分析,基於pdb等公共數據集的數據進行算法的優化訓練。本次分析病毒檢測和病毒變異部分主要基於開源算法,設計分佈式算法以加速分析流程。病毒序列拼接完成後,通過設計BiLSTM+DNN的方式訓練模型預測病毒蛋白二級結構。同時,達摩院還在研究基於序列的蛋白質三維結構預測模型以及藥物篩選模型。


分享到:


相關文章: