作者:張傳寶 汪靜 閆穎
單位:北京醫院,國家衛生健康委臨床檢驗中心
計量溯源性(metrological traceability)是實現檢驗結果準確可比的前提條件,也是國際間相互承認測量結果的前提條件,中國合格評定國家認可委員會(CNAS)將計量溯源性視為測量結果有效性的基礎,並確保獲認可的測量活動的計量溯源性滿足國際規範的要求[1]。在產品註冊檢驗中,校準品定值的計量溯源性已經成為明確的要求。
一、計量溯源性及其實現
計量溯源性的定義來源於ISO/IEC指南99:《國際計量學詞彙—基礎和通用概念及相關術語(VIM)》,即通過文件規定的不間斷的校準鏈,將測量結果與參照對象聯繫起來的測量結果的特性,校準鏈中的每項校準均會引入測量不確定度【VIM 2.4.1】。用於將測量結果與參照對象聯繫起來的測量標準和校準的次序,則被稱之為計量校準鏈(metrological traceability chain)【VIM2.4.2】,簡稱為溯源鏈[2]。計量溯源鏈的理想終點是定義到國際單位制(SI)的相關單位,但對於某一指定值,程序的選擇和計量溯源鏈的最終水平取決於是否有較高等級的測量程序和校準品。目前很多情況下,生產商選定的測量程序或工作校準品為計量溯源性的最高等級。因此,在有國際公認的參考測量程序和/或校準品可用之前,測量的正確度取決於其校準等級水平[3]。
在JJF 1001-2011中,國際單位制(international system of units,SI)【VIM 1.16】是指由國際計量大會(CGPM)批准採用的基於國際量值的單位制,包括單位名稱和符合、詞頭名稱和符號及其使用規則。其基本量和相應的基本單位分別為:長度(米)、質量(千克)、時間(秒)、電流(安培)、熱力學溫度(開爾文)、物質的量(摩爾)、發光強度(坎德拉)[2]。
目前,常規醫學檢驗定量項目大約有400到700個,其中多數臨床檢驗項目因被測物質(主要是生物大分子類物質)的複雜性(如混合物、異構體等),其一級參考測量過程的建立和一級參考物質的製備非常困難,其量值溯源只能停止在較低水平,如為產品校準品定值的(參考)測量程序等級,或測量程序和(參考)校準品二個等級。在ISO/DIS 17511:2009(E)中,根據計量學溯源至SI的可能性及測量程序和校準品的不同計量水平的可獲得性,可將檢驗項目確定為以下6種典型的計量學溯源鏈。
1. 測量結果可以在計量上溯源至SI單位。(1)有可用的一級參考測量程序和一種或多種(經認定的)一級參考物質(用作校準品)。這樣的檢驗項目有大約有25到30個,電解質類物質(如鉀、鈉、氯、鎂、鈣、鋰離子等)、代謝物類物質(如膽固醇、甘油三酯、葡萄糖、肌肝、尿酸、尿素等)和某些甾體類激素及甲狀腺激素。這些項目雖佔的數目不大,卻是臨床檢驗常規項目的主要組成部分;(2)無一級校準品,但有用於定義待測物的參考測量程序。如酶類的催化活性測定等;(3)有一級參考物質和參考測量程序,待測物是由參考測量程序定義的。這種情況下,參考測量程序測定的是被測量的一個片段或者組分,而非整個分子結果。最典型的例子是IFCC 測定糖化血紅蛋白參考方法。
2. 測量結果計量學不能溯源至SI單位。(1)有國際約定校準物(非一級校準物)可用於定義待測物,並遵從ISO15194,無參考測量程序;(2)有國際一致化程序支持的計量溯源性,無國際約定校準物或約定參考測量程序;(3)待測物溯源到生產商內部定義/專有參考物質,無一級校準品或參考程序。計量溯源性的目的,應是使經校準的常規測量程序所得的結果,表示為按現有校準等級高水平所得值的方式。應在開始進行終測量前建立計量溯源性鏈,並以校準等級下降的相反方向,即從計量高參考到終用戶結果進行描述。本文僅列出第一種情況的校準溯源鏈,見圖1;其他類型的校準溯源鏈,可參考ISO/DIS 17511:2019(E),沒有條件的可參見CNASGL18量值溯源要求在醫學測量領域的實施指南(等同ISO 17511:2003)。
根據被測量的類型和特點,建立合適的校準溯源鏈,儘可能的將最高等級的測量程序和參考物質的量值,通過從上到下逐級的校準,傳遞到產品校準中上,是IVD廠商實現計量溯源性的任務。在這一過程中,廠家需要合理評估不確定度,儘量消除校準偏倚,以滿足每個項目的分析質量要求為目標,校準品的不確定度應小於目標不確定的1/2為宜。需要注意的是,計量溯源性是檢驗結果準確的必要條件,而非充分條件。正如VIM 2.41在計量溯源性定義的注5指出的:測量結果的計量溯源性不能保證其測量不確定度滿足給定的目的,也不能保證不發生錯誤。
二、常規測量過程的特異性和參考物質的互通性問題
陳文祥研究員在《臨床檢驗的量值溯源問題》[4]中,對這一部分的內容作了很重要的闡述,引用如下:常規測量過程的特異性及其校準物質或用於常規測量過程校準及質量控制的參考物質的互通性(或稱“互換性”)是臨床檢驗計量學溯源性的兩個重要問題。常規測量過程特異,測量量與參考測量過程測量量完全一致,是實現計量溯源性的前提。然而,由於臨床檢驗被測物質的複雜性,許多常規測量過程,尤其是利用免疫學原理的測量過程,做到真正意義上的特異非常困難(如不同測量過程作用於同一被測物質的不同抗原決定位點,可能給出不同測量結果)。還有些常規測量過程甚至還作用於被測物質以外的其它物質,其特異性問題則更為嚴重。在這種情況下,僅通過不同校準物質或參考物質逐級溯源顯然不能提高測量的準確性。
臨床檢驗參考物質或校準物質的互通性,指用不同測量過程測量該物質時,各測量過程測量結果之間的數字關係,與用這些測量過程測量實際臨床樣品時測量結果的數字關係的一致程度,亦即該物質理化性質與實際臨床樣品的接近程度。參考物質,雖然一般採用與實際樣品相同的物質作原料,但出於對被測物質濃度的要求、貯存、運輸等方面的原因,往往需對原料成分進行調整並作處理(如凍幹、冰凍等)。這些經加工的材料在某些測量過程中的行為有時會不同於實際臨床樣品,這種差異有時稱基質效應,更確切的描述是缺乏互通性。缺乏互通性是各種臨床檢驗質量保證中的常見問題。值得指出的是,互通性問題的存在,不應是參考物質單方面的原因,認識和解決互通性問題需從參考物質和測量過程兩方面入手。使參考物質與實際樣品儘量接近是必要的,但對基質過分敏感的測量過程一般不是好的測量過程,尤其是對於小分子化合物的分析。然而,某些參考物質對於某些常規測量過程缺乏互通性,目前仍然是客觀存在,在利用參考物質進行量值溯源時需首先鑑定參考物質的互通性,鑑定的方法一般是用參考方法和常規方法同時分析參考物質和實際新鮮樣品。若存在互通性問題,需進行修正,或改用無基質效應的參考物質。
參考物質的互通性評價通常需要兩種以上的測量程序、多份臨床病人樣本、待評價的參考物質。如果用參考測量程序作為比對方法,其評價過程可參考我國衛生行業標準WS/T 4356-2011《基質效應與互通性評估指南》;如果採用多種常規測量程序進行評價,其評價方法和數據處理可以參考CLSI EP14-A3(Evaluation of Commutability of Processed Sample;Approved Guideline-Third Edition)[5]或者EP30-A(Characterization and Qualification of Commutable Reference Materials for Laboratory Medicine;Approved Guidline)[6]。
三、計量溯源性的確認
鑑於上述特異性和基質效應問題及其它質量問題(線性、靈敏度等)的可能存在,臨床檢驗計量學溯源性均需最後確認其有效性。確認方法是用參考測量過程和常規測量過程同時分析足夠數量的、有代表性的、分別取自不同個體的實際新鮮樣品,將每個樣品一分為二,分別用參考方法和常規方法進行分析測定,可用線性迴歸進行結果判斷。若兩方法結果一致(在一定置信水平下斜率與“1”及截距與“0”無顯著差異),常規方法的結果的溯源性得以驗證或確認,如圖2-a所示;如果兩個方法結果不一致,可能會有不同情況,一種情況是兩種方法結果關係密切,無明顯截距,但是斜率與“1”的偏離不能接受,如圖2-b,此種情況說明常規方法有足夠的特異性,但存在校準偏差,可通過調整校準使常規方法結果準確;另一種情況可以是,兩種方法結果的關係過於分散,此種情況的出現往往是由於常規方法存在特異性問題,如圖2-c。當然常規方法的特異性問題還會有其他表現,如兩種方法間存在明顯的截距等。常規方法測量範圍不足也會在與參考方法對比中得以發現。兩方法的比較,除用上述線性迴歸方法外,還可以用其它統計方法,如用兩種方法結果之差對濃度作圖等,如圖2-d所示。
四、計量溯源性的驗證與室間質量評價
對於絕大多數臨床實驗室,受參考測量過程不易獲得、成本高昂、效率較低等因素的影響,上述確認方法在絕大多數實驗室很難實現。而且,對於臨床實驗室來說,也的確不需要進行如此複雜的確認實驗,而是進行相當簡便的(正確度)驗證實驗即可。正確度驗證實驗在實際操作上,可以分為方法比對和測定定值參考物質兩種方式,下文主要對測定定值參考物質進行敘述。
定值參考物質的來源,比較公認的定值參考物質包括:具有互通性的國際、國家有證標準物質;具有互通性的正確度驗證物質(標準物質、正確度驗證室間質量評價材料、廠家提供的正確度驗證質控物)等,這些在CLSI EP15-A2[7]、CLSI EP15-A3[8]、CNAS-GL37[9]、WS/T 492-2016[10]等文件中是一致的。除此以外,對於非正確度驗證的室間質量評價材料是否可用於常規方法的正確度驗證呢?我國定量生化檢驗室間質量評價主要分為如下幾類:
1. 使用具有互通性的質控品,參加實驗室多次重複測定樣品,質控品的靶值通過參考方法確定。例如我中心的脂類、酶學、電解質、總蛋白及代謝物、糖化血紅蛋白正確度驗證計劃。
2. 使用具有互通性的樣本,實驗室單次測定,質控品靶值通過參考方法確定。例如我中心的糖化血紅蛋白室間質量評價計劃。
3. 採用可能具有基質效應的商品或者自制質控品,實驗室單次測定,靶值採用參加者公議值(分組後的中位數或者平均值),這是最常見的一類室間質評計劃,是國內為普遍採用的室間質評方式。上述第一類和第二類計劃,都可用來評價參加實驗室的正確度,驗證其計量溯源性。毋庸置疑,這兩類計劃的樣本是可以提供給臨床實驗室正確度驗證。對於第三類計劃的樣本,能否用作正確度驗證呢?在CNAS-GL37、WS/T 492-2016均未推薦用常規室間質評計劃做正確度驗證;而在CLSI EP15-A2、CLSI EP15-A3均提到,此類室間質量評價計劃的樣品可以用作正確度驗證,其作用在於驗證實驗室與參加EQA的同組(peer group)實驗室結果的一致性,這個同組可能是使用相同的(封閉)系統(如內分泌、腫瘤標誌物、心肌標誌物等EQA)、相同的試劑(如常規化學EQA)等,而產品的計量溯源性由生產廠家負責實施及確認。使用這類質控品的條件是:組內實驗室足夠多(至少大於20家)、組內SD應足夠小(定值的不確定小、結果更可靠);缺點包括:由於基質效應的影響,即便採用相同的系統,也可能因為試劑批號或\和校準物的批號不一致,對測定結果帶來偏差,影響正確度驗證結果的判斷。在我國,開發系統特別普遍的情況下,常規化學採用的試劑廠家分組進行統計,不可避免會引入質控品基質效應帶來的偏差,對結果的判斷帶來影響。鑑於此,常規室間質量評價的樣本,只能作為備選項,在其他方式不能獲取的情況下采用。
室間質量評價結果,能不能用做正確度驗證?在CNAS-CL38《醫學實驗室質量和能力認可準則在臨床化學檢驗領域的應用說明》5.6.3中,這樣敘述[11]:使用配套分析系統時,可使用製造商的溯源性文件,並制定適宜的正確度驗證計劃;使用非配套分析系統時,實驗室應採用有證參考物質、正確度控制品等進行正確度驗證或與經確認的參考方法(參考實驗室)進行結果比對以證明實驗室檢驗結果的正確度,如以上方式無法實現,可通過以下方式提供實驗室檢測結果可信度的證明:參加適宜的能力驗證/室間質評,且在最近一個完整的週期內成績合格;……
五、全國臨床生化正確度驗證室間質量評價計劃
我中心2010年開展小分子代謝物正確度驗證計劃、脂類正確度驗證計劃,2012年開展了酶學正確度驗證計劃和糖化血紅蛋白正確度驗證計劃,2014年開展電解質正確度驗證計劃。這些正確度驗證室間質量評價計劃和常規EQA計劃的區別主要在於:(1)採用新鮮冰凍樣本(血清或全血),不存在基質效應(具有互通性);(2)樣本測定採用批內多次重複、在不同天內多批測定方式,不同於常規EQA的單次測定方式;(3) 採用參考方法測定值作為靶值,其結果可溯源至SI單位,而非採用參加實驗室的公議值為靶值; (4) 評價標準也和常規EQA不同。由此可見,正確度驗證計劃的兩個必備條件是:1)具備可準確定值的參考方法;2)使用互通性的樣品。
1. 樣本:正確度驗證室間質量評價計劃的樣本力求與臨床分析標本一致,但是考慮到運輸過程,我們採用國際通用的新鮮冰凍樣本:1)新鮮冰凍血清:下列正確度驗證計劃採用新鮮冰凍血清:總蛋白及代謝物(TP、Glu、Crea、Urea、UA)、電解質(K、Na、Ca、Mg、Cl)、酶學(ALT、AST、ALP、AMY、CK、GGT、LDH)、脂類(TC、TG、HDL-C);2)新鮮冰凍全血:糖化血紅蛋白(HbA1c)。
為保持樣本中分析物的穩定性,正確度驗證計劃採用乾冰(固態二氧化碳,-60℃)運輸。以2018年全國電解質正確度驗證計劃為例:2018年3月初將兩個濃度各3只樣本使用CO2乾冰運送到參加實驗室,實驗室收到樣本後保存在-70℃或者20℃冰箱中。實驗室分別於3月30日、4月6日和4月13日取每個濃度水平各1只在一個實驗批次內重複測定5次;於4月20日一次性將所有測定結果通過網絡進行上報。
2. 靶值(指定值)確定及合格評定:不同於常規室間質量評價(能力驗證)計劃通常採用參加者公議值(平均值和中位數)作為靶值(指定值)的做法,正確度驗證室間質量評價計劃的靶值採用參考實驗室或者參考實驗室網絡(酶學)進行確定。目前全國正確度驗證計劃靶值確定方法包括同位素稀釋液相色譜串聯質譜法(TC、TG、Glu、Crea、UA、HbA1c)、同位素稀釋氣相色譜串聯質譜法(Urea)、超速離心色譜法(HDL-C)、同位素稀釋電感耦合等離子體法(K、Na、Ca、Mg)、離子色譜法(Cl)、分光光度法(TP、ALT、AST、ALP、AMY、CK、GGT、LDH)等,測定結果可溯源至SI(國際單位制)單位。
在檢驗結果上報後,計算各參評實驗室測定結果的平均值與靶值間的相對偏差,作為實驗室測定偏倚,與允許偏倚標準進行比較,用於評價實驗室正確度是否滿足要求。採用的評價標準包括WS/T 403-2012《臨床化學檢驗常規項目分析質量指標》或其他標準,具體可參考我中心每年寄送的《臨床檢驗室間質量評價計劃》中的《評價標準》章節。
3. 報告:正確度驗證室間質量評價計劃的報告分為數據和圖形兩個部分,數據報告如圖3所示,每列數據的意義如框圖所示。圖形報告如圖4所示,圖形中按照某一批號樣本測定結果的相對偏倚,從負到正(從小到大)畫出每個實驗室結果的棒圖。上下紅線為該樣本偏倚合格範圍,圖中紅點表示用戶實驗室所在位置,並標出該實驗室編碼。
4. 不合格的處理:正確度驗證的目的在於通過評價測定方法的偏倚是否符合標準,從而驗證方法正確度及計量溯源性。正常情況下,測定方法的精密度對該計劃結果的影響較小,正確度驗證計劃成績不合格表明測定方法存在系統誤差,實驗室應從消除系統誤差因素著手進行改進,特別是校準品的配套問題。
需說明的是,採用具有互通性的樣本並利用參考方法確定靶值是最理想的室間質評方式,但現階段還存在較多的限制,比如具有互通性的樣本來源、參考方法資源及運輸成本等因素,故正確度驗證計劃還只能是常規EQA的補充,尚無法完全替代常規EQA。
參考文獻略
注:本文來源於《臨床實驗室》2020年第4期“生化”專題