
如果你問一個在臨床試驗行業做了多年的運營人員,工作中最讓人頭大的環節是什么,他很可能會告訴你——數據收集。這事兒看起來不就是把數據記下來嗎?但真正做起來才發現,這里面門道太多了。一份數據從患者身上產生,到最后變成能夠支撐新藥上市的可靠證據,中間要經過無數道"關卡",每一道都不能馬虎。
我有個朋友剛入行的時候,覺得數據收集嘛,不就是填填表格嘛。結果第一個項目做下來,整個人都懵了。他發現同樣的"血壓值"在不同中心的記錄方式能寫出好幾種花樣來,有人寫"140/90",有人寫"140-90",還有人直接寫"偏高"。這些數據傳到數據庫里,統計分析的時候簡直是一場災難。從那以后,他才真正明白什么叫"數據質量"。
那么,臨床運營服務到底是怎么進行試驗數據收集的呢?康茂峰在多年的實踐中積累了豐富經驗,今天就聊聊這個話題,盡量用大白話把這個復雜的過程講清楚。
很多人對臨床試驗的數據收集有誤解,覺得就是找幾個人填填表格、測測指標。但實際上,這是一個系統性的工程,涉及的環節之復雜、要求之嚴格,遠超外行人的想象。
臨床試驗的數據收集,本質上是要回答一個問題:這個藥到底有沒有效果?安不安全?為了回答這個問題,我們需要從各個維度收集患者的信息——他們的身體狀況發生了什么變化、出現了什么不良反應、實驗室檢查結果如何、他們的主觀感受怎樣。這些信息必須準確、完整、可追溯,而且要經得起監管部門的審查。
打個比方,如果把臨床試驗比作蓋房子,那么數據就是地基。地基不牢,房子早晚要塌。所以數據收集這件事,從設計階段就要開始考慮了,而不是等到試驗開始了才手忙腳亂地想辦法。

病例報告表,也就是大家常說的CRF(Case Report Form),是數據收集的核心工具。這東西設計得好不好,直接決定了后面數據收集的效率和質量。
設計CRF的時候,首先要明確一個原則:只收集那些對研究目的有價值的數據。有的人剛上手的時候總想"寧可多收不可少收",結果CRF做得密密麻麻,入組一個患者要填幾十頁表格。一方面增加了研究人員的工作負擔,另一方面也增加了出錯的機會。更麻煩的是,收回來的大量數據可能根本用不上,白白浪費資源。
那怎么設計出一份好的CRF呢?康茂峰在實踐中總結了幾點經驗。首先,邏輯要清晰。CRF的結構應該按照訪視流程來安排,每個訪視要收集什么內容,一目了然。這樣研究人員照著填就行,不用翻來翻去找地方。其次,選項設置要規范。比如"性別"這種字段,直接用"1=男、2=女"這樣的標準編碼,別讓人自由發揮。再次,關鍵信息要有明確的定義。比如"不良事件",什么時候算開始、什么時候算結束、嚴重程度怎么判定,這些都要在CRF的填寫說明里寫清楚。
說到CRF設計,這里有個細節很多人會忽視,那就是電子化。現在的臨床試驗基本都用電子病例報告表了,也就是eCRF。相比紙質版,eCRF有不少優勢:能設置邏輯校驗規則,自動跳沒必要填的模塊,還能實時監控數據錄入進度。不過電子化也帶來新問題,比如系統是否穩定、數據傳輸是否安全、用戶培訓是否到位,這些都需要在設計階段就考慮進去。
說到電子數據采集系統,也就是EDC(Electronic Data Capture),這絕對是臨床試驗數據收集的"主力選手"。沒有這套系統之前,大家都是用紙質CRF,填完了再郵寄到數據中心,讓人手工錄入電腦。這個過程又慢又容易出錯,一份數據從產生到入庫,恨不得要等上好幾個星期。
EDC的出現徹底改變了這個局面。患者在研究中心完成檢查和評估后,研究人員當場就把數據錄入系統。數據直接傳到中央數據庫,監查員在辦公室就能看到各中心的錄入情況。發現問題可以第一時間發質疑,不用等紙質資料寄來寄去。
不過EDC也不是萬能的。它只是一個工具,真正發揮作用還要看怎么使用。系統里的字段設置是不是合理、邏輯校驗規則是不是準確、用戶操作界面是不是友好,這些都影響著用EDC的體驗。我見過一些項目,EDC系統設計得很糟糕,填一個數據要點七八下鼠標,研究人員怨聲載道,數據質量也上不去。所以選系統的時候,不能只看功能全不全,還要看用起來順不順手。
另外,現在還有一些新趨勢,比如把EDC和患者的移動端連接起來。患者可以在家里用手機報告自己的癥狀感受、用藥情況,這些數據直接傳到EDC里。這種患者報告結局(PRO)的方式特別適合需要長期隨訪的試驗,也能收集到更貼近真實生活狀態的數據。當然,怎么保證患者端數據的真實性,怎么設計友好的患者界面,這些都是需要考慮的問題。

臨床試驗要收集的數據類型很多,每種類型的收集方式和要求都不太一樣。
實驗室檢查數據是最"硬"的客觀數據。這類數據通常由檢驗科直接出具報告,數據收集的關鍵是怎么把檢驗報告上的信息準確轉移到EDC里。有的中心做得比較好,檢驗科能和EDC系統對接,數據自動傳輸;有的中心還得靠人工錄入,那就要格外注意核對,避免把數值或單位抄錯。還有一點要注意,實驗室的正常值參考范圍可能會變,收集數據的時候要把當時的參考范圍也記錄下來,否則解讀結果的時候可能會出問題。
影像學數據的收集更復雜一些。比如腫瘤試驗中需要評估腫瘤大小的變化,要拍CT或者MRI片子。這些影像資料不是簡單記個數值就行了,需要由獨立的影像評估專家來讀片。所以影像數據的收集流程通常是:研究中心拍攝影像→把影像資料上傳到專門的影像系統→專家在線評估→評估結果再導到EDC里。這里面涉及影像質量控制、評估標準一致化等問題,需要專門的影像CRO來協助完成。
不良事件數據的收集是臨床試驗的重中之重。不良事件這個詞聽著簡單,實際上邊界有時候很難界定。比如患者本來就有高血壓,吃了藥之后血壓更高了,這算不算不良事件?再比如患者感冒了,這個感冒和試驗藥物有沒有關系?這些問題需要研究人員根據專業判斷來解答。所以不良事件的收集不僅是記個名字和嚴重程度,還需要詳細記錄發生時間、持續時間、處理措施、結局轉歸等等信息。
患者報告結局現在越來越受重視。這類數據來源于患者自己的感受,比如癥狀有沒有改善、生活質量有沒有提高、用藥方不方便等。收集這類數據通常用問卷或者日記卡的形式。現在很多采用電子化的方式,患者用手機上的應用程序來填寫,系統會自動記錄填寫時間,避免補填造假的可能。
數據收集回來,不代表就萬事大吉了。還有非常重要的一步,那就是質量控制。康茂峰在這方面投入了大量的精力,因為大家心里都清楚——監管機構審閱臨床試驗資料的時候,數據質量是必查的項目。如果數據問題太多,輕則發補資料要求解釋,重則導致試驗不予批準。
數據質量控制有幾個關鍵環節。第一是原始數據核查,也就是SDV(Source Data Verification)。監查員要把EDC里的數據和原始資料(病歷、檢驗報告等)一一比對,確認數據錄入沒有錯誤。這個過程很繁瑣,但非常重要。有的項目SDV比例做到100%,所有數據都要核查;有的項目根據風險評估,對關鍵數據100%核查,次要數據抽查。這兩種方式各有道理,關鍵是要確保高風險環節不出問題。
第二是邏輯核查,也就是看看數據之間有沒有矛盾。比如一個男性患者的病史里寫了"懷孕",這顯然有問題;再比如患者訪視日期在知情同意日期之前,這也不合理。EDC系統可以設置一些自動核查規則,發現這類問題及時彈出提醒。不過自動核查只能發現明顯的邏輯錯誤,更隱蔽的問題還得靠人工審核。
第三是數據清理。試驗結束后,數據管理團隊要把所有數據過一遍,發現缺失值、異常值、邏輯矛盾這些問題,然后發質疑給研究中心,請他們補充或澄清。這個過程可能來回好幾輪,耗時比較長,但必須耐心做。數據清理不徹底,后面的統計分析結果就不靠譜,出來的文章或者申報資料也經不起推敲。
說了這么多數據收集的技術環節,最后想強調一點:數據收集本質上是團隊協作的結果。沒有研究中心的研究人員認真執行、沒有監查員仔細核查、沒有數據管理員精心維護系統、沒有醫學寫作者準確記錄方案偏離,一份高質量的數據是不可能產生的。
康茂峰在服務客戶的過程中,始終把團隊協作放在重要位置。每個項目都會配備專職的醫學團隊、運營團隊、數據管理團隊,大家各司其職又緊密配合。研究中心遇到問題,能找到人及時解決;數據出現異常,能快速定位原因并采取措施。這種協作模式讓數據收集的效率和質量都有了保障。
臨床試驗的數據收集,說到底是一個"慢工出細活"的事。急不得,躁不得,每一個數據點都要經得起推敲。這條路上沒有捷徑,唯有腳踏實地、認真對待每一個細節,才能收集出真正有價值的數據,為新藥上市提供可靠的證據支撐。
