醫學實驗室評定不確定度爭議的小結
國內很多學者曾討論醫學實驗室是否有必要評定測量不確定度以及采用什么評定辦法,這很難給出一個結論。隨著科學發展,近年來不少組織、專家提出不少新的標準和建議。我國CNAS也曾發布技術報告CNAS
TRL-001“醫學實驗室—測量不確定度的評定與表達”,但缺乏國際公認的權威意見。最近國際權威組織,如ISO、ILAC等相繼發表一些標準和導則,肯定了不少建議和意見。現在再回頭看,似乎可以肯定當時的一些意見和建議。讀者有可能對此問題提出更進一步的看法,本文擬對此議題提出看法,希望大家提出批評和建議,繼續為醫學實驗室溯源和評定測量不確定度(以下簡稱不確定度)制定一個更實用的導則。
一、爭論的歷史發展
不僅在我國存在醫學實驗室應不應評定不確度的爭論,國際上存在已久。1993年七個國際學術團體公布評定測量不確度的國際標準GUM*時,就得到以歐洲學者為主導的國際臨床化學和檢驗醫學聯合會(IFCC)的大力支持。另一方面,美國臨床化學學會(AACC)對評定不確定度很冷淡,其學會雜志《臨床化學(Clinical
Chemistry)》在整個20世紀就沒有刊登過一篇有關不確定度的學術論文,直到2005年才在“觀點/反對觀點(point/counterpoint)”欄目中同時刊登正、反兩方面文章。正方是美國著名學者Krouwer的“Critique
of the Guide to the expression of Uncertainty in Measurement Method of
Estimating and Reporting Uncertainty in Diagnostic
Assays”認為商業性診斷檢測無需評定不確定度,反方是丹麥學者Kristiansen寫的一篇應評定測量不確定度論文:“The Guide to
expression of Uncertainty in Measurement Approach forEstimating
Uncertainty: An Appraisal ”,從主編安排可以看出美國學者不贊同醫學實驗室評定不確定度。
但同時美國檢驗界也開始轉變觀點。美國知名的標準制定機構——臨床和實驗室標準研究所(CLSI)與IFCC合作制定導則EP29-A“檢驗醫學中測量不確定度的表達”。從2005年開始,歷經歐美學者多年爭議和討論,2011年底終于正式頒布。2012年美國反對評定不確定度主要學者Westgard在其網站上指出美國臨床實驗室也應考慮評定不確定度,歐美學者取得初步共識。但這絕不是爭論的結束,在如何以及用什么辦法評定不確定度問題上,一直存在如下問題:
---醫學實驗室是否可以只評定測量過程,而不是GUM倡議的全測量過程的不確定度;
---能否不用GUM的“自下而上”,改用“自上而下”的辦法評定不確定度;
---能否用醫學實驗室實際工作數據,不需增加附加的試驗來評定不確定度。
在這些間題上,檢驗學與計量學專家之間存在嚴重分歧和爭論。計量學專家往往認為檢驗學家提出的意見有違GUM原則。直到最近幾年,才逐步取得共識。下面將逐個討論此三個爭論問題和初步共識。
二、醫學實驗室是否可以只評定測量過程的不確定度
實際上這不只是醫學實驗室的問題,而是檢測實驗室(ISO 17025將其稱為testing
laboratory),以區別校準(參考實驗室)普遍面對的困難。GUM介紹的“自下而上”評定不確定度辦法過于復雜、繁瑣,且很難比較采用此法評定的不確定度結果。但爭論雙方都公認參考實驗室在評定參考方法/參考物質的不確定度時不得不采用“自下而上”的辦法。
作為檢測實驗室類別之一的醫學實驗室如何評定不確定度不但是一個熱點,還是一個難點。早在20世紀初,ISO在公布ISO
15189的同時,就開始制定醫學實驗室評定不確定度標準的工作,即ISO25680,歷經九稿均未通過,原因估計為此稿主要由計量學家書寫,應用“自下而上”辦法,不為檢驗學家所接受。現改由澳大利亞檢驗專家White書寫。在其初稿中,認為2CV可以相當擴展不確定度。計量學家很難接受此類觀點。目前正在反復修改重寫中,恐怕不是短期就能制定好,并投票通過的。
從歷次國際認可醫學實驗室標準ISO
15189對不確定度要求的改變,可以看出專家們對醫學室驗室評定不確定隊識的變化和進步:2003年第一版和2007第2版在“保證檢測程序的質量”章節中對不確定度有如下2段簡短要求。第一段為“5.6.2
適用且可能時,實驗室應確定檢驗各種辦法結果的不確定度。應考慮所有重要的不確定度分量”,此段似為計量學家和檢驗學家爭論的妥協結果。“實驗室應確定檢驗各種辦法結果的不確定度。應考慮所有重要的不確定度分量”,很可能是計量學家的要求,可能因為檢驗學者提出眾多的困難,不得已在前面加上“適用且可能時,”但對什么是適用和可能,各人有各人理解。往往在認可時,實驗室只選少數幾個項目,按下一段敘述要求評定不確定度“不確定度來源可包括采樣、樣品制備、樣品部分的選擇、校準品、參考物質、輸入量、所用設備、環境條件、樣品狀態和操作人員的變更”,此要求涵蓋了整個檢驗過程(測量前、測量中和測量后三個過程)。據此,實驗室不得不按經典“測量不確定表達導則(GUM)”建議的“自下而上”辦法評定不確定度。
在認可工作中,要求醫學實驗室按此嚴格執行,幾乎是不可能或不現實的,檢驗科不得不采用一些變通辦法。本世紀初流行的做法就是以兩個標準偏差(s
)相當于擴展不確定度(U )。例如英國臨床病理認可組織(CPA)在2000年頒布了一個導則,敘述在評審實驗室時,評審員可以認同以2s 相當U
。其結果正如美國專家Westgard“醫學實驗室質量管理v
s測量不確定度”一文,用幽默語言將ISO15189:2007評定MU過程諷刺為“測量不確定度可能成為在實驗室進行的沒有意義的計算,把它展示給評審員,他再發證證明實驗室進行了無意義參數的計算,以符合全球(ISO)標準,如果在原理和實踐上,它們(ISO標準)都不正確的話,它就失去意義和價值。”確實是這樣,ISO
15189:2007中沒有說明評定不確定度目的,只是為通過實驗室認可不得不做的表面文章。
ISO 15189
2011年第3版作了明確修改,用一個完整章節“5.5.2.1測量不確定度評定”做了較完整的敘述:“實驗室應為檢驗過程中用于報告患者樣品被測量值的每個測量程序確定測量不確定度。..........”此段話對前二版做了顛覆性修改。不是按GUM要求應評定測量前、測量和測量后全過程的不確定度,改為“檢驗過程中...被測量值的..測量不確定度”,可能怕對什么是檢驗過程產生誤解,添加注1說明“與實際測量過程相關聯的不確定度分量從接收樣品啟動測量程序開始,至輸出測量結果終止”。如使用自動分析儀此過程應是開始于將樣本放入儀器樣品杯后,開啟自動分析儀,不是從實驗室接受樣品開始,為使用“自上而下”評定不確定度辦法提供可能。
將上兩版的“適用且可能時”修改上升為“每個測量程序確定測量不確定度”,此項修改可能反映了計量界希望醫學實驗室能重視評定不確定度工作。要求醫學實驗室能按計量學要求,探討如何結合醫學實驗室的實際工作,“報告患者樣品被測量值的……測量不確定度”。醫學實驗室不可能像既往認可時,從文獻找幾個實例報告評審員就可,不得不認真評定不確定度并“定期評審測量不確定度的評估結果”。
這是第一次在國際標準,而不是在地區或國家標準中明確規定醫學實驗室可以只評定測量過程的不確定度。這并不是說測量前、后影響量不重要,只是一些測量前后影響量與檢測實驗室關系不大,例如采樣是一個重要影響量,但常由送檢單位負責。檢測實驗室不得不在報告單聲明測量結果只與該送檢樣本相關。此觀點一開始不易為計量學家所接受,經過長期爭論最終才被國際標準接受。
這些要求的變化明確了醫學實驗室可以評定測量過程的不確定度,第一次在國際公認的ISO導則中肯定此點,為應用“自上而下”辦法評定不確定度提供了可能。
三、能否如采用“自上而下”辦法,取代經典“自下而上”評定不確定度辦法
確定了醫學實驗室可以只評定測量過程的不確定度,則不難使用所謂“自上而下”評定不確定度辦法,也就是不需尋找出每個影響量,而是根據經典誤差理論,認為測量結果的誤差主要來自系統誤差和隨機誤差,對于醫學實驗室而言,找出此二個誤差不是一件困難的事。系統誤差可以通過計算偏移求得,從實驗室室內質檢數據很容易了解測量結果的實際隨機誤差。
在GUM頒布后,檢測實驗室就提出了:是否有簡單易行的評定測量不確定度辦法?由檢測實驗室組成的歐洲學術團體——歐州國家測量聯合會(EuroLab)相繼在2002、2006和2007年公布了3個文件專門探討評估不確定度的各種辦法,提出了除GUM辦法外,檢測實驗室還可以用所謂“經驗辦法”評定測量過程的不確定度。EuroLab在其3個文件中,系統發展了根據偏移和室內質控數據評定不確定度辦法。2002年文件曾取名為“黑箱(blackbox)”辦法,說明與經典方法相比,人們并不了解影響偏移和不精密度的每個影響量,2007年標準將其改名為“經驗(empirical)”辦法。
著名的北歐標準制定機構“北歐檢測協作組織(Nordtest)”在1997年公布了標準TR
537《環境實驗室計算測量不確定度手冊》,不使用經典GUM“自下而上”,只使用偏移和精密度數據評定不確定度的辦法。在2003年和2012年分別頒布第二版和第三版標準,它將此類辦法命名為“自上而下”評定不確定度辦法,與目前學者習慣將經典GUM評定不確定度辦法稱為“自下而上”辦法相對應,非常形象地表達這兩類評定辦法的差異,為大多數檢測實驗室工作者接受。
“自上而下”評定不確定度辦法雖然已存在十余年,但未為計量學家廣為接受。它似乎違背GUM基本原則,沒有找出影響測量結果的每個影響量并評定它們對確定度的貢獻。因此盡管檢測實驗室已應用多年,直到2012年ISO頒布了只用“自上而下”評定不確定度國際標準,即ISO
11352“水質-基于有效性和質量控制數據的不確定性測量評估 ”,此文件由負責制定水質量標準ISO/TC147的技術委員會制定。
該文件引言中說:“ISO/IEC98-3*敘述了評定測量不確定度的基本原則。根據評定目的和可得到的數據,還有幾類評定測量不確定度的途徑;EuroLab的TR
1對主要辦法給出了綜述,本國際標準特定了一系列程序,實驗室可以使用基于質控結果和確證數據的辦法來評定它們測量結果的測量不確定度。此文件是專為不全面了解計量學或統計學的分析家而組織的,應用NEN7779和Nordtest
TR537作為制定此國際標準的基礎,采用的是“自上而下”的辦法,相對于ISO/IEC 98-3采用的“自下而上”的策略。
將評定的不精密度和與偏移相關的不確定度合并為一個測量不確定度在統計學上是可接受的,此辦法的數據來源是方法確認和分析質量控制,此國際標準確定的實驗辦法能較廣覆蓋常規使用分析方法時的變異來源。”
這段話明確將“自上而下”評定不確定度的辦法與GUM的“自下而上”評定方法并列,并特別提出“此文件是專為不全面了解計量學或統計學的分析家而組織的”。換言之,此國際標準的原則應也適用于醫學實驗室,為醫學實驗室應用此類簡單的評定不確定度辦法給于強有力的支持。
四、獲取什么數據來評定醫學測量結果的不確定度
ISO
11352在引言中稱“根據評定目的和可得到的數據,有多種評定測量不確定度的途徑”,此標準主要用于水質檢查。在評定不精密度方面,這些實驗室與醫學實驗室一致,都是使用室內質控數據,也就是都能得到實驗室內復現性數據。但在評定偏移時,2者情況不盡相同。此國際標準提出可從3個方面計算偏移的不確定度,即:
“--分析合適的參考物質;
--參加實驗室間比對;
--以合適樣本進行回收實驗”。
水質檢測實驗室由于基體簡單,容易得到各個級別的互換性參考物質,不難通過與參考物質比較求得偏移,此外,這些實驗室在一國或一個區域內,數量不多但都管理較嚴格,測量結果相當可靠。當缺乏參考物質時,還可考慮通過室間比對數據估算偏移。為了使此法得到比較可靠的偏移,規定了至少要通過6個或6個以上室間比對結果來評估偏移,還專門設立一個此辦法特有的術語,即實驗室和方法偏移以及特定的計算方法,水質檢測實驗室使用上述辦法都有困難時,最后還可以通過回收實驗來計算偏移。
但對醫學實驗室而言,使用此3方面數據都存在一定困難。首先醫學實驗室不易得到合適的具互換性的參考物質,主要因為醫學實驗室測量樣本來自生物體,基體含復雜成分,而水質測量樣本的基體簡單,不似生物測量所用參考物質必須具有互換性,才能用于正確度確認或驗證。為得到正確的偏移,需要判斷參考物質的互換性,這顯然不是大多數醫學實驗室所能做到的。其次醫學實驗室雖然幾乎都參加能力比對,但并不是所有能力比對計劃質量不錯,數據可靠。一些能力比對結果的平均值存在不一定真實可靠和前后不穩定等情況,由于必須至少6個能力比對結果才能評定,常需收集2年乃至更多時間的數據。至于最后一個辦法,使用加標樣本進行回收實驗由于基體效應,一般不認為適用于檢驗醫學。
那么醫學實驗室從哪兒可收集到可用于評定不確定度的偏移數據?偏移的不確定度與計量溯源密切相關,在整個校準等級中,每一層次的測量程序和校準品都應有與其相關的測量不確定度,而且下一層次的測量程序/校準品的不確定度應包含上一層次的不確定度。醫學實驗室是校準等級的終用戶,如果樣本測量結果是使用IVD企業提供的產品校準品進行校準后,按廠家規定的測量程序得到的,則知道產品校準品的不確定度以及醫學實驗室校準產生的不確定度,不難計算出偏移的合成不確定度。
誰可提供產品校準品賦值的不確定度?
ISO
17511:2003在第8章“體外診斷醫療器械使用說明中應給出的計量學溯源性信息”中,明確要求“EN273:2001適用,用戶需要,制造商也具備時,制造商應向專業用戶提供校準品和正確度控制品賦值的不確定度。”在2015年第二版修改稿中更明確為“8.2終用戶有要求,必需提供產品校準品和正確度質控物質賦值的不確定度”。對醫學實驗室而言,假如可以利用廠家提供的產品校準品的不確定度和實際工作中所得到的室內質控和校準數據,無需添加額外工作就可評定不確定度,無疑將極大推動醫學實驗室評定測量結果不確定度的工作,這將是醫學實驗室容易接受的評定不確定度的辦法。
五、小 結
通過長期的討論,國際上已認可醫學實驗室可以只評定測量過程的不確定度,已有使用“自上而下”的辦法評定測量過程不確定度的國際標準ISO
11352。我國檢驗界可考慮在這些目前國際上已達到共識標準的基礎上,制定一個根據醫學實驗室可得到的資料和數據,簡單而又實用的評定測量結果不確定度的標準。
參考文獻
1. Guide to the expression of Uncertainty in Measurement (GUM).BIPM,
IEC, IFCC, ISO, IUPAC, IUPAP, OIML. International
Organization?ofStandardization, Geneva Switzerland, 1 st Edition 1993,
Corrected?and reprinte.
2. Quantifying Uncertainty in Analytical Measurement. EURACHEM/CITACGuide, 2nd Edition, 20003.
3. Measurement Uncertainty in Testing, Eurolab Technical Report?No. 1/20023.