喜大普奔!國際知名醫學科研期刊《自然醫學》刊登我國教授文章

北京時間12日零時14分,國際知名醫學科研期刊《自然醫學》(Nature Medicine)在線刊登於文章題為《使用人工智能評估和準確診斷兒科疾病》(Evaluation and accurate diagnoses of pediatric diseases using artificial intelligence)。

這一研究結果由廣州市婦女兒童醫療中心夏慧敏教授、張康教授(加州大學聖地亞哥分校)、數據中心梁會營博士、醫務部孫新主任以及兒內科門診何麗雅主任團隊與依圖醫療倪浩團隊、康睿智能科技等業內頂級研究團隊及廣東省再生醫學重點實驗室,利用人工智能技術診斷兒科疾病實現。

喜大普奔!國際知名醫學科研期刊《自然醫學》刊登我國教授文章

這是全球首次在頂級醫學雜誌發表有關自然語言處理(NLP)技術基於中文文本型電子病歷(EMR)做臨床智能診斷的研究成果。其核心是利用兒科疾病的文本病例數據訓練人工智能,以達成智能診斷的目的。

那麼,為什麼說這是一次里程碑式的勝利?動脈網記者採訪到了依圖醫療CEO倪浩與廣州市婦女兒童醫療中心的梁會營博士,以瞭解這一項目背後的故事。

如何讓機器像醫生一樣思考?

自然語義處理是人工智能技術中至關重要的一個分支,其目的是幫助人工智能在識別影像的基礎上,通過自動學習病歷文本數據(醫生的知識和語言)中的診斷邏輯,逐步具備一定的病情分析推理能力,並更進一步讀懂、分析複雜的病例,逐漸使人工智能能像醫生一樣“思考”。

將人的智慧以機器形式表現出來是該研究的目的,所以人工智能的學習是對醫生日常就診流程的學習。常規的就診包括望聞問切、視觸叩聽,即醫生看病時需要融合患者的主訴、症狀、個人史、體格檢查、實驗室檢驗結果、影像學檢查結果,甚至在來醫院前的用藥信息,多方面才能做出綜合的病情判斷。如果人工智能能把這些信息都給吃進去,然後消化,並吸收。當醫生或患者輸入病症時,輸出的便是一個診斷結果。

梁會營認為:“要實現人工智能模擬醫生就診,做臨床推理,必須做到以下幾點;第一,它要自動學習文本病歷中的診斷邏輯,醫生是從書本中去學習的,而人工智能是從上百萬份電子病歷中去學習;第二,學習後,人工智能需具備一定的進行病情分析的推理能力;第三,要能夠像人類醫生一樣,讀懂各類兒科文本病歷,並做出準確的智能推薦。簡單而言,當這個算法成熟後,患者察覺病情時,無需百度就可以獲得專業的診斷結果。”

在實踐之中,倪浩認為,這將分為兩個階段:“第一個階段是如何去解構各個領域的責任與數據,所謂的解構就是去挖取數據中的信息點。本篇文章中一個非常重要的基礎就是基於解構後的電子病歷數據,建立一個高質量、結構化的病種庫,並在這個病種庫的基礎之上去做診斷模型。第二個階段是語義理解,即通過訓練讓機器的模型能夠完全去理解人類語言。這個階段相當困難的,整個業界還有很長的路要走,但依圖的工作已經實現了語義理解的初級階段。”

十倍於常量的數據集

過去發佈在頂級期刊上的相關論文,其使用的數據集的數據量級在十萬左右,而本次實驗中的人工智能理解了近60萬患者,136萬份電子病歷的數據。這些數據來源的患者均為兒童,平均年齡為2.5歲,其中40%是女孩;數據結構覆蓋了患者主訴、症狀、個人史、體格檢查、實驗室檢驗結果、影像學檢查結果、用藥信息等多方面的數據。所患疾病包括消化科、呼吸科等55種疾病,覆蓋了超過75%的常見兒童疾病疾病。對於腦膜炎等危急疾病,實驗同樣也做了一些設計,以提高人工智能的診斷能力。

研究團隊利用依圖醫療的NLP技術建立了一套病歷智能分析系統,深度挖掘和分析醫療文本的信息,將非結構化文本形式的病歷數據變成規範話、標準化和結構化的數據,以便AI準確完整地“讀懂”病歷。為此,醫生、科學家和技術人員通力合作,由30餘位高級兒科醫師和10餘位信息學研究人員組成的專家團隊手動給電子病歷上的6000多張圖表進行註釋,並持續對模型進行檢驗和迭代。

圖表是研究人員研究疾病的副機碼,作用為找出某一疾病的特徵。一個疾病可能有300個特徵是有意義的,只要按這個特徵填進去的話,人工智能就可以診斷這個疾病。在現實中,醫生書寫的最完善電子病歷的特徵數在100左右。

同時,不同疾病的圖表結構不同,有的疾病不含診斷,而有的包含家族史、主訴、實驗室檢查、影像學檢查、超聲檢查等多維信息,研究人員必須對不同情況下的圖表進行區分。

喜大普奔!國際知名醫學科研期刊《自然醫學》刊登我國教授文章

優異的訓練結果

由於豐富數據庫的加持,所訓練出的模型也表現出了優異的結果,以部分疾病為例:神經系統的準確性為0.98,呼吸系統的準確性為0.92,全身性疾病的準確性為0.87,最低的消化系統的準確性為0.85。若細化疾病的分類,上呼吸道的準確率為0.89,而下呼吸道的準確率為0.87。

不同的疾病之間準確率的差異源於數據與特徵的差異。某一疾病的特異性的症狀越多,它就更容易被學習,這是因為這些特異性給了人工智能進行區分的先決條件。同時,學習更多數據的人工智能將在準確度方面做出更好的表現,這一點人與機器同理。

倪浩對此舉了一個很好的例子:“如果某患者患有急性喉炎,但喉炎發病的部位和症狀與支氣管炎類似,要區別兩種疾病,需找出喉炎的特異性的症狀。由於醫生可能不會描述相關症狀,患者病歷中便會缺失,造成結果的誤診。對此,我們作出了這樣的解決方案:假如系統懷疑患者有可能是急性喉炎,而它的置信度不是排名第一,人工智能會追問是否出現了呼吸時伴隨卷鼻音(急性喉炎的另一特徵),這是醫生容易缺失的一個操作。儘管現有準確率已達到一定水平,但仍有提升的空間,通過這種方式,我們能逐漸在現有準度的基礎上進一步提升系統準確率。”

NLP的發展是漫長而充滿意義的過程

談及為什麼選擇兒科作為突破口,除了廣州市婦女兒童醫療中心提供的翔實數據,兒科荊棘的現狀也是倪浩團隊選擇這一領域進行實驗的重要原因:“中國兒科醫生非常稀缺,流感季節的三甲醫院總是爆滿。此外,兒科是一們啞科,很多小孩子不具備很強的語言表達能力,他們不能詳細講述自己的病情,這是我們一直堅持在兒科做出巨大投入的原因。”

“我一直在想象這樣的場景,在就診時,當醫生與患者的問答環節結束,關聯電子病歷的語音識別助手就已經寫好了電子病歷,而輔助診斷系統也根據這一病例得出結果,告知患者該去做什麼樣的檢查。這樣下來,醫院的效率將大幅提高,醫生的解放也得已實現。”

總的來說,本次研究是一次成功的嘗試,這為NLP技術在其他科室的發展打下了一個很好的開端。在接下來的研究之中,依圖醫療將沿著就診鏈路進行產品延伸,包括但不限於治療方案、護理方案、給患者家長健康指導以及互聯網醫院場景。

通過互聯網技術打破地域的限制,通過語音識打破就診方式的限制,通過智能診斷打破醫院效率的限制,依圖醫療正通過技術不斷打破傳統醫療模式,讓人工智能技術惠及更多的患者。也許,人們理想中的醫療方式,離我們不再遙遠……


分享到:


相關文章: