臨床路徑電子化中數據採集與預處理方法研究

临床路径电子化中数据采集与预处理方法研究

點擊上方“中國數字醫學”可以訂閱哦!

海量臨床數據為開展基於循證的臨床路徑的實施成為可能。依託於大量的臨床證據,做到真正的循證醫學,避免了在制定與優化臨床路徑模板時的隨意性。從臨床數據利用角度闡述如何開展臨床數據採集以及為保證數據質量如何進行數據預處理工作。

臨床數據採集

數據採集是影響臨床研究質量的關鍵環節之一,臨床數據的採集工具電子數據採集系統(electronic data capture,EDC)隨著醫療信息化的快速發展目前已經普遍使用。通過EDC實現數據採集具有節約時間和人力物力、提高效率、保證質量和可靠性等優勢。臨床數據的採集包括標準規範的選擇和臨床數據的選擇。

標準規範為解決異源異構數據融合的問題,臨床數據的多項標準規範應運而生,其中臨床數據交換標準協會(Clinical Data Interchange Standards Consortium,CDISC)數據標準涵蓋臨床試驗全流程,並廣泛使用和採納,臨床試驗的效率和質量也相應提升。CDISC數據標準包括結構規範和術語規範。

結構規範在數據組織形式中,有兩種不同的結構:水平型數據結構和垂直型數據結構。從數據庫設計範式角度看,垂直錄入才是應該採用的數據錄入模式,會更符合數據直接導入的需求。

術語規範術語規範是臨床數據採集與利用的基礎,臨床術語的應用是臨床信息從採集到管理利用的保證數據完整性與規範性的重要環節。目前,臨床試驗廣泛採用的《系統化臨床醫學術語集》已廣泛應用於醫療信息系統中。而中醫的臨床術語集還在發展、完善階段,已有專家分析中醫臨床常用術語質量的基本要求及中醫臨床常用術語在完整性、規範性、概念關係等方面的常見問題,提出利用本體技術建立中醫臨床常用術語本體,並總結中醫臨床常用術語本體構建的關鍵技術環節。

表1 臨床數據來源及採集要點

临床路径电子化中数据采集与预处理方法研究

注:CPOE:計算機化醫生醫囑錄入系統, computerized physician order entry; RIS: 放射科管理信息系統, Radiology Information System; PACS: 影像歸檔和通信系統, Picture archiving and communication system; LIS,實驗室信息系統, Laboratorial information system.

數據核查與預處理

數據質量核查真實、準確、完整和可靠是保證臨床試驗數據質量的基本原則。數據核查包括以下內容:違背方案核查、時間窗核查、邏輯核查、閾值範圍核查、一致性核查、數據完整性核查等。數據核查後產生的質疑需要反饋給臨床監查員或研究者。研究者對質疑做出回答後,數據管理員根據返回質疑答覆對數據進行修改。

數據預處理數據預處理的過程包括缺失值處理和與數據標準化兩個過程。

缺失值處理主要效應指標(有效性和安全性)原則上不應存在缺失值,應儘量避免非隨機缺失。一般而言,若能判斷數據缺失由完全隨機缺失、隨機缺失(MAR)造成的,可以採用末次觀測值結轉、基線觀測值結轉、均值填補、迴歸填補、多重填補等多種不同的方法。若是隨機缺失或缺失值佔的比例不超過5%,則可以不填補。還應簡單說明一下不同填補方法的適應情況。需要說明的是,遵循保守原則的缺失數據處理措施更有利於控制潛在偏倚。

數據標準化 數據標準化過程就是把臨床實踐中收集的數據與標準字典中的詞目進行匹配的過程。當出現的詞目不能直接與字典相匹配時可以進行人工編碼,對於醫學編碼員也無法確認的詞目,可通過多方溝通以獲得確切的編碼。

面對臨床路徑電子化推廣中建模與優化的難題,基於循證的臨床路徑構建已經成為臨床路徑研製與推廣的重要研究方向。臨床數據凝聚了臨床經驗與科技創新活動的成果,是傳播衛生科學技術知識的重要載體,也是國家寶貴的知識財富,臨床數據的分析挖掘是實施循證醫學研究方法、總結臨床診療規律、轉化隱性的臨床診療經驗為可共享的顯性知識的必要途徑。只有通過規範的數據採集與預處理方法,才能保證海量的臨床數據為基於臨床需求的數據挖掘的可行性,也使基於臨床數據挖掘方法構建基於循證醫學的臨床路徑成為可能。

傳播數字醫學領域發展最新動態,關注醫療衛生信息化相關資訊。

長按掃碼關注我們


分享到:


相關文章: