更懂醫生的嘉和美康,其大數據臨牀科研平台都有哪些亮點?

數據重複採集,利用率低;

數據存儲分散且結構不一;

數據質量和完整性缺乏統一監控;

數據查詢邏輯複雜;

醫學研究階段性驗證困難;

研究思路難挖掘……

類似上面這些臨床科研的問題,還有很多。終歸而言,提高醫療數據的質量才是解決問題的關鍵。

目前,患者的病案在絕大部分醫院都以非結構化或半結構化的方式進行存儲。這種信息,醫生難以直接利用,只能採用人工謄寫或摘抄的方式整理數據,極大地增加了科研數據採集的時間成本。

此外,科研數據根據課題研究目的不同,往往來源於多個業務系統。並且根據治療方式和階段的不同,數據的類別也具有多樣性,如患者的隨訪、CRF表單以及生物樣本、組學分析等數據。這就造成了,醫生在實際數據收集和整理過程中,需要來回在多個系統間切換,並將多系統來源的數據人工進行關聯核對,因此錯誤成本顯著提升。

除此之外,科研課題如何切入,如何實現創新型的研究思路和觀點,也困擾著當代的醫生群體。

基於以上問題,以大數據為基礎的科研平臺在研究型醫院建設過程中逐步體現出其重要的位置和優勢,也成為近年來,以大數據為基礎的新型臨床研究模式的新熱點。

從臨床系統到科研大數據平臺

大數據平臺通常基於Hadoop技術,實現海量異質數據,包括非結構病歷數據與大規模影像數據的標準化存儲,並通過自然語言處理(NLP)等技術實現數據的標準化、規範化處理。同時,大數據平臺所彙集的醫療數據,還為深度學習等方法提供了海量訓練與驗證集,從而推動了醫療數據智能分析的發展。

時下大熱的病歷數據的自然語言處理以及醫療影像的AI分析,其基礎便是大數據平臺。

作為國內電子病歷的代表性企業,嘉和美康從2013年起便開始了大數據平臺的研發和探索。經過幾年的沉澱,嘉和美康逐步實現了Hadoop、Spark、機器學習等大數據相關技術的成熟應用。而以往電子病歷等臨床系統項目的積累,也為公司大數據模型的建立打下了堅實基礎。

2017年,在醫院醫生越來越強烈的科研需求下,嘉和美康大數據事業部正式推出了大數據臨床科研平臺。

更懂醫生的嘉和美康,其大數據臨床科研平臺都有哪些亮點?


嘉和美康供圖

據動脈網瞭解,該平臺主要藉助大數據處理、自然語言分詞、機器學習、知識圖譜等技術,整合並挖掘包括電子病歷、檢驗檢查、醫療影像、基因序列等在內的海量醫療數據,形成以患者為中心的完整時間序列研究資源庫。此外,平臺還利用數據挖掘算法,實現臨床數據的深度解析與可視化,輔助臨床醫生構思科研想法以及提出病因假設。

從效率上看,大數據臨床科研平臺基於大樣本臨床試驗,能夠快速完成問題驗證並生成統計結果,降低科研成本,提升醫療機構服務質量和科研成果轉化效率。

五大優勢功能

大數據臨床科研平臺,在國內並不少見。嘉和美康大數據事業部憑藉多年對臨床數據深入透析經驗,建立起了五大產品優勢:

1、多級數據分層模型

嘉和美康大數據事業部的大數據臨床科研平臺針對臨床數據複雜的分級結構,特別是病歷文書、檢查報告等,研發出了“多級數據分層模型”。該模型能深度挖掘各層次數據,把數據的顆粒度做到極致,並建立其層次關係,從而能支撐複雜關聯性分析等深度的科研應用研究。

據嘉和美康大數據事業部科研產品部總監甘偉介紹:“多級數據分層模型的數據顆粒度優勢,主要建立在病歷的複雜結構程度上。經過多年電子病歷系統的研發,目前嘉和美康的系統已經覆蓋了全國1200多家醫院,對病歷的理解十分深刻。所以在分析數據時,要比其他公司分析得更為細緻,顆粒度更小。”

舉例來說,如果醫生想要研究飲酒對某種疾病的影響,首先第一層要觀察其是否飲酒,第二層要觀察其酒齡,第三層要研究其喝的是紅酒、白酒或者是其他類型的酒。對疾病的差異分析,顆粒度越細,醫生研究得也就越深入。

2、專病庫

嘉和美康大數據事業部的大數據臨床科研平臺專病庫是以專科疾病為中心,整合患者在院期間,包括門急診在內的各類臨床診療資料,具體包括病歷文書、檢驗檢查、醫囑用藥、手麻、護理等。

除此之外,患者隨訪數據、生物樣本數據、組學研究數據或公開發布的環境質量數據,以及一些自主維護的課題庫數據以及疾病專有標籤數據,也被納入到專病庫中。

基於專病庫,科研PI(課題負責人)可以不用再像以前一樣,帶著研究生去病案室耗時耗力地翻閱紙質病案,摘取關鍵信息點。

另外,醫生的視野往往依賴於過往的臨床經驗,因此發現的臨床問題也很侷限。但當其有了基於多學科數據的專病庫之後,便可以藉助科研平臺,對海量數據進行多維度分析。利用可視化功能,醫生能夠發現過去難以發掘的臨床問題,找出科研的新思路。、

更懂醫生的嘉和美康,其大數據臨床科研平臺都有哪些亮點?

嘉和美康供圖

3、數據智能質控

評價一份病案的質量往往需要從兩個角度出發,從形式上包括組成部分的完整性、實效性、格式規範性,從內涵上要求內容準確、詳實,能滿足思辯和學術探討。

過去,醫院多以人工方式開展病案質控。如某三甲醫院,聘請了30多位資深臨床專家組成病案內涵質控專家組。同時,每月有數十位主任、教授、主治醫師對科室病案進行自查。

智能質控,是指通過明確一些常用的質控規則,再通過機器學習,補充和完善質控體系。嘉和美康大數據事業部針對大數據資源庫每個數據項,實現實時多級的質量監控,包括資源的完整度、異常數據點、異常數據類型以及數據分佈情況等。並可針對不規範數據進行溯源分析,追溯到原始病歷文書,發現書寫誤差。比如入院記錄裡的評分和出院記錄的評分不一致,確定診斷和患者的症狀不符等。

據甘偉介紹:“一方面,醫生可以對所需數據的數據質量一目瞭然;另一方面,他還能及時發現問題,儘早採取培訓、必填項等方式規範醫生病歷書寫,從源頭提高數據質量。”

4、數據深度挖掘

嘉和美康大數據事業部的大數據臨床科研平臺的數據深度挖掘能力包括兩大特點:病種分析和在線統計建模。

1) 病種分析

病種分析提供影響因素分析、預測分析、干預分析三大核心主題的分析研究。

影響因素分析,圍繞專病相關幾千個維度分析挖掘疾病的危險因素,並進行分類排名;有利於進行疾病的相關性分析的同時,還可以挖掘出影響平均住院日等運營指標的相關因素,從而定位相關業務環節,進行針對性的調控。

預測分析,通過學習相關真實病歷,藉助時間序列分析、神經網絡等大數據挖掘技術,構建疾病預測模型,實現對患者相關疾病危險因素預測分析、疾病嚴重程度分級,治療效果評估。同時,還支持對門診量、住院量、手術以及相關費用的預測,為醫院運營管理提供參考。

干預分析,針對用藥、手術、放療等治療手段,進行關鍵事件前後的對比分析,從而直接產出治療效果對比報告。

2) 在線統計建模

過去,醫生寫科研論文之前,需要把excel表的數據處理成統計軟件能用的格式。這個過程中,需要耗費很長的時間,包括一些數據轉化、空值處理,以及一些數據的不規範。利用科研平臺,醫生不需要再像以前一樣,只需通過平臺將數據處理好,量化成統計軟件需要的格式即可。

數據統計方面,嘉和美康大數據事業部還提供在線統計模型工具。

目前,科研平臺已整合醫學上常用的統計算法40餘種,包括獨立樣本T檢驗、卡方檢驗、迴歸分析、相關分析以及Cox迴歸等。其操作設計完全結合醫學專業特點以及科學研究思路,將大部分數據處理和量化過程轉由後臺直接完成,省去人工處理數據的複雜度,提高科研效率。

且考慮到臨床醫生統計學知識匱乏的現狀,平臺上還智能的融合了統計模型推薦以及模型結果解析等。分析後的結果可直接導出,供醫生撰寫論文中時使用。

5、數據導出

平臺可針對數據的分類模型,定製每種分類數據的導出模式,基於關鍵事件處理、複雜邏輯計算、自動行列轉換、智能標準化值域輸出等新技術。替代統計學處理之前大量的手工數據處理工作,為醫生在階段性統計階段節省大量時間。

不限於院內,廣闊的應用空間

大數據臨床科研平臺的應用場景,並不限於醫院內。

在臨床輔助方面,科研平臺通過對真實世界數據的學習,包括網上疾病的一些診療指南建立起的知識庫,輔助醫生規範其診療行為。讓不管是進修醫師還是資深醫師,都能夠根據知識庫,將相應的治療方案推薦給醫生,讓他快速完成工作,減少失誤的概率。

除此之外,在一些拓展領域,科研平臺也有著廣泛的應用價值。

甘偉表示:“除了為醫院和醫生端提供服務之外,嘉和美康目前已經聯合CRO公司,輔助藥廠去做一些三期四期的臨床評價,以及藥品的適應症和一致性評價的研究。後續,嘉和美康大數據事業部還計劃與保險公司合作,為其提供醫保控費、保單設計、不良記錄的核查等方面的服務。”


分享到:


相關文章: