臨床性能研究,難啃的“硬骨頭”!
隨著IVD企業(yè)如火如荼地準備CE-IVDR及FDA審核,性能研究時常遭遇問題:無論是準確度、精密度、臨床評價,還是穩(wěn)定性評價,都孤立存在,前述評價在產品生命周期處于什么位置?在什么時間?應使用什么評價方案?需要評價至什么程度?研究需要多少患者、樣本、數據集?
其中,關于樣本量計算,制造商經常求助于統(tǒng)計學專家,卻得不到答案,因為統(tǒng)計學家之所以能計算樣本量的前提是已有研究結果。這種矛盾情況稱之為:樣本量悖論sample size paradox 。
樣本量統(tǒng)計矛盾難解,性能評價問題繁雜,臨床研究無從下手???......
不用愁,久順自有妙計!作為國內稀有的可開展IVDR性能研究服務的咨詢企業(yè),而能夠運用CLSI(國際通行IVD性能評價標準)的EP文件開展合規(guī)性能研究更是寥寥無幾!
本期,久順先為您解開:臨床研究樣本量計算6大焦點問題的答案,以期對您有效實施樣本量計劃提供助益。
樣本量的6要素
臨床研究中的樣本量規(guī)劃,受到以下6大因素影響↓
■ IVD臨床性能研究的終點可能是診斷敏感性和特異性;
■ 統(tǒng)計學測試是驗證研究收集數據的方法;
■ beta誤差(beta error)描述制造商面臨的風險,而alpha誤差(alpha error)則代表公眾承擔的風險;
■ 脫落率(dropout rate)用于測算無法評估的受試者/樣本的數量。
問題1:研究目標應該使用什么“終點”?
終點(endpoint)是用于衡量研究目標實現與否的統(tǒng)計指標,所選終點可能因被評估體外診斷器械、研究性質而有所差異。
在體外診斷器械的分析和臨床性能評估中,終點(endpoint)一定程度上由IVDR法規(guī)附錄I的通用安全和性能要求GSPR所決定。
當證明體外診斷器械的臨床表現時,終點(endpoint)通常表現為比例指標,可能為:真陽性檢測結果的比例(即診斷靈敏度或真陰性檢測結果的比例及診斷特異性),也可能為:在相同條件下重復進行測試的變異系數。
問題2:應當將哪種“統(tǒng)計測試”作為證據?
統(tǒng)計測試(statistical test)應表明:所收集的研究數據支持待證明的命題(實驗假設),例如:測試A的診斷靈敏度高于測試B。
所使用的統(tǒng)計檢驗,首選為先前選擇的終點,次選是研究的設計。例如:證明收入差異的統(tǒng)計測試、對比2個比例的測試、證明非劣效性的測試等。
然而,數值也可以被簡單地測量,統(tǒng)計學稱之為估計。制造商必須提供這樣的數值及不確定性,置信區(qū)間通常被用于此,例如:檢測SARS-CoV-2冠狀病毒的抗原檢測,世界衛(wèi)生組織發(fā)布指南對檢測統(tǒng)計程序和界限作出規(guī)定。
注意:置信區(qū)間的下限,在理想情況下應等于或大于目標值。
問題3:預期的“效果”如何?
描述預期效果及其可變性,無疑是最大的難題。而此時前述悖論再次出現:研究的結果必須在研究規(guī)劃期間確定。為實現該悖論,制造商必須在規(guī)劃階段對調查或研究結果的定量影響進行假設,例如↓
·根據不同體外診斷器械,可使用不同的方法以確定可實現的診斷質量、預期平均差異、并發(fā)癥發(fā)生率:
·研究文獻,并使用可比性研究的結果(如:系統(tǒng)文獻檢索);
·制訂市場或競爭的要求(如:最新技術);
·確定醫(yī)學背景下的最小興趣差異或最小相關差異(現有技術),如:對患者報告結果(PRO)問卷,最小興趣差異是由問卷創(chuàng)建人指定和驗證的屬性;
·在可用的情況下,使用指南中的規(guī)范。
問題4:預期“效果”的可變性是多少?
為指定研究人群中數據的預期變異性(標準差),制造商可使用文獻中類似研究的信息及統(tǒng)計估計。
制造商通常在內部初步測試期間獲得數據,以便得出有關標準偏差的結論。
對于初始近似,可以計算標準偏差,例如:基本測量范圍的標準偏差,為該范圍的四分之一或六分之一。
對于比例,可變性已由比例本身給出。
對于終點(例:并發(fā)癥發(fā)生率、診斷質量測量),關于變異性的信息已隱含可用。
問題5:alpha誤差和beta誤差的大小是多少?
alpha和beta誤差也稱為:類型1和類型2誤差,給出:假陽性或假陰性檢測結果的概率。
alpha誤差:代表公眾在研究中顯示出某種影響的風險,而事實上該影響并不存在;換言之,研究結果將顯示出比實際情況更佳的體外診斷器械效果或性能。
beta誤差:描述制造商的風險,即研究無法檢測到確實存在的影響,在此情況下研究結果會使體外診斷器械效果或性能看似比實際情況更糟。
以上兩個誤差均有“標準”值:beta誤差,通常在10%至20%之間;alpha誤差,通常約為5%。
問題6:預期的“掉落率”是多少?
制造商必須考慮:研究過程中是否會失去受試者或測試結果?
脫落率(dropout rate)被量化并被包括在樣本量計算中,以確保計算的樣本量能提供可靠和穩(wěn)定的研究結果。
那么,真正的問題來了!
# 臨床研究與評價,誰是個中高手?#
>>【久順企管集團】近30年全球合規(guī)技術專家\近20年資深歐代,中國\荷蘭\美國\英國均設公司,一站式快捷合規(guī)服務:CE注冊取證、MDR/IVDR技術文檔編寫、體系輔導、臨床研究與臨床評價、上市后監(jiān)督咨詢等。
√國內少有配備IVDR法規(guī)\IVD技術\數據分析領域IVD團隊的企業(yè),已與歐盟各大主流實驗室和醫(yī)院建立合作渠道,可提供 臨床性能研究(國內少有可勝任且使用EP文件研究)、可用性研究、上市后臨床跟蹤研究 等高質高效服務。
√久順技術團隊具備豐厚的法規(guī)、設計開發(fā)經驗,可為企業(yè)完成內部質量管理體系以符合IVDR法規(guī)升級、建立產品設計開發(fā)過程。