
說實(shí)話剛?cè)胄心菚?huì)兒,我對(duì)臨床試驗(yàn)數(shù)據(jù)錄入的理解就是"往系統(tǒng)里填表"這么簡(jiǎn)單。后來才發(fā)現(xiàn),這事兒遠(yuǎn)比想象的要復(fù)雜得多。今天就想跟大伙兒聊聊,臨床運(yùn)營服務(wù)里試驗(yàn)數(shù)據(jù)錄入管理到底是怎么一回事,希望能用比較接地氣的方式把這個(gè)流程講清楚。
在真正開始錄入數(shù)據(jù)之前,有大量的準(zhǔn)備工作要做。這就好比蓋房子,地基不牢,后續(xù)全是隱患。
首先要說的是數(shù)據(jù)庫的設(shè)計(jì)與構(gòu)建。臨床試驗(yàn)的數(shù)據(jù)錄入不是隨便找個(gè)Excel表格就能應(yīng)付的,它需要專業(yè)的臨床數(shù)據(jù)管理系統(tǒng)(EDC系統(tǒng))。在這個(gè)階段,數(shù)據(jù)經(jīng)理需要和方案設(shè)計(jì)團(tuán)隊(duì)、醫(yī)學(xué)團(tuán)隊(duì)密切溝通,把研究方案中涉及的所有訪視點(diǎn)、評(píng)估指標(biāo)、檢查項(xiàng)目全部轉(zhuǎn)化成系統(tǒng)中的字段。這個(gè)過程叫做數(shù)據(jù)庫規(guī)格說明書制定,需要精確到每一個(gè)數(shù)據(jù)點(diǎn)的類型、長(zhǎng)度、校驗(yàn)規(guī)則。
舉個(gè)例子,比如血壓值這個(gè)字段,設(shè)定的時(shí)候就要考慮好單位是mmHg還是kPa,范圍應(yīng)該設(shè)置在什么區(qū)間,錄入時(shí)是否允許小數(shù)點(diǎn),缺失值怎么處理。這些細(xì)節(jié)看似瑣碎,但如果在設(shè)計(jì)階段沒考慮周全,等錄入開始了再修改,成本就高了去了。
接下來是病例報(bào)告表(CRF)的設(shè)計(jì)。CRF是數(shù)據(jù)錄入的載體,它的設(shè)計(jì)直接影響后續(xù)錄入的效率和數(shù)據(jù)的質(zhì)量。這里有個(gè)關(guān)鍵原則:CRF的布局要符合臨床常規(guī)操作流程,讓錄入人員能夠順著診療思路往下走,而不是一會(huì)兒翻到前面一會(huì)兒翻到后面。同時(shí),CRF中的每個(gè)數(shù)據(jù)點(diǎn)都要有明確的標(biāo)準(zhǔn)操作規(guī)程支撐,確保不同中心、不同錄入人員對(duì)同一數(shù)據(jù)的理解是一致的。
康茂峰在長(zhǎng)期的服務(wù)實(shí)踐中發(fā)現(xiàn),很多申辦方在前期準(zhǔn)備階段容易犯的一個(gè)錯(cuò)誤是過于追求CRF的"全面性",塞進(jìn)去很多與主要研究目的關(guān)聯(lián)不大的數(shù)據(jù)點(diǎn)。結(jié)果呢,錄入人員工作量增加,出錯(cuò)概率也上去了。所以建議在設(shè)計(jì)階段就做好溝通,明確哪些是核心數(shù)據(jù)、哪些是次要數(shù)據(jù),有的放矢才能保證質(zhì)量。
準(zhǔn)備工作完成之后,就進(jìn)入正式的數(shù)據(jù)錄入階段了。這個(gè)階段有幾個(gè)關(guān)鍵環(huán)節(jié)值得展開說說。
數(shù)據(jù)錄入的雙人錄入與核對(duì)機(jī)制
臨床試驗(yàn)領(lǐng)域有一個(gè)共識(shí):?jiǎn)稳虽浫牒茈y保證百分之百的準(zhǔn)確性。所以對(duì)于關(guān)鍵數(shù)據(jù),通常采用雙人獨(dú)立錄入的方式。也就是說,同一份原始數(shù)據(jù)由兩個(gè)錄入人員各自錄入一遍,然后系統(tǒng)自動(dòng)比對(duì)兩份錄入結(jié)果。如果有不一致的地方,會(huì)生成質(zhì)疑清單(Query),由第三方人員進(jìn)行核查和確認(rèn)。
這種機(jī)制的原理其實(shí)很簡(jiǎn)單,就是通過獨(dú)立操作來消除個(gè)體偶然錯(cuò)誤。但實(shí)施起來需要注意幾個(gè)問題:兩個(gè)錄入人員之間不能有交流,不能互相看對(duì)方的錄入結(jié)果;錄入用的原始數(shù)據(jù)必須是同一版本;如果發(fā)現(xiàn)大量不一致,需要分析是錄入人員培訓(xùn)不到位還是原始數(shù)據(jù)本身不清晰。
訪視數(shù)據(jù)的時(shí)序管理
臨床試驗(yàn)的數(shù)據(jù)是沿著時(shí)間軸展開的,每個(gè)受試者會(huì)經(jīng)歷篩選期、基線期、治療期、隨訪期等多個(gè)階段。每個(gè)階段對(duì)應(yīng)的數(shù)據(jù)點(diǎn)都有其特定的時(shí)間窗口要求。數(shù)據(jù)錄入管理的一個(gè)重要任務(wù)就是確保這些數(shù)據(jù)按時(shí)錄入系統(tǒng)。
比如某個(gè)訪視要求在治療后第4周±3天完成,那么對(duì)應(yīng)的數(shù)據(jù)錄入也應(yīng)該在這個(gè)時(shí)間窗口內(nèi)完成。如果超出了窗口期,需要記錄超窗原因,評(píng)估對(duì)數(shù)據(jù)分析的影響。系統(tǒng)通常會(huì)設(shè)置訪視提醒功能,在接近窗口期時(shí)自動(dòng)發(fā)通知,但運(yùn)營人員也不能完全依賴系統(tǒng),自己也要做好追蹤和提醒。
不良事件與合并用藥的錄入要點(diǎn)

這兩類數(shù)據(jù)在臨床試驗(yàn)中比較特殊,因?yàn)樗鼈冎苯雨P(guān)系到受試者的安全性評(píng)價(jià)。不良事件的錄入需要遵循"寧可多報(bào)不可漏報(bào)"的原則,錄入時(shí)除了記錄事件本身,還要記錄發(fā)生時(shí)間、嚴(yán)重程度、處理措施、轉(zhuǎn)歸等信息。合并用藥的錄入則要求記錄所有在試驗(yàn)期間使用的藥物,包括劑量、用法、用量、起止時(shí)間等。
這里有個(gè)常見的困惑:受試者自己買的感冒藥、保健品算不算合并用藥?按照GCP的要求,只要是在試驗(yàn)期間使用的藥物/保健品,都應(yīng)該記錄。所以錄入人員在詢問受試者時(shí),要把這個(gè)范圍講清楚,避免遺漏。
數(shù)據(jù)錄入不是錄完就完事了,更重要的是保證錄入的數(shù)據(jù)真實(shí)、準(zhǔn)確、完整。這就需要建立完善的質(zhì)量控制體系。
邏輯核查與范圍核查
現(xiàn)代的EDC系統(tǒng)都支持在錄入時(shí)自動(dòng)進(jìn)行邏輯核查和范圍核查。邏輯核查是檢查數(shù)據(jù)之間的邏輯關(guān)系是否合理,比如性別為男性的受試者就不應(yīng)該有月經(jīng)史相關(guān)的記錄。范圍核查是檢查數(shù)值是否在合理范圍內(nèi),比如年齡不應(yīng)該超過150歲,心率不可能是300次/分鐘。
這些核查規(guī)則是在數(shù)據(jù)庫設(shè)計(jì)階段就設(shè)定好的,但不是一成不變的。隨著試驗(yàn)推進(jìn),可能會(huì)發(fā)現(xiàn)一些規(guī)則需要調(diào)整或者補(bǔ)充。比如某個(gè)中心的受試者基線血壓普遍偏高,經(jīng)醫(yī)學(xué)監(jiān)查員確認(rèn)這是該中心的實(shí)際情況后,可能需要調(diào)整血壓的正常值范圍規(guī)則。
源數(shù)據(jù)核查與現(xiàn)場(chǎng)監(jiān)查
系統(tǒng)里的數(shù)據(jù)最終都要能夠溯源到原始文件。所以數(shù)據(jù)錄入管理的一個(gè)重要環(huán)節(jié)就是配合監(jiān)查員進(jìn)行源數(shù)據(jù)核查(SDV)。監(jiān)查員會(huì)抽取一定比例的病例,把系統(tǒng)錄入的數(shù)據(jù)和原始病歷、檢驗(yàn)報(bào)告等源文件進(jìn)行比對(duì),確認(rèn)兩者一致。
這個(gè)過程有時(shí)候會(huì)發(fā)現(xiàn)一些有意思的問題。比如錄入人員把日期抄錯(cuò)了,或者把檢驗(yàn)單的數(shù)值看錯(cuò)了行。這些錯(cuò)誤如果及時(shí)發(fā)現(xiàn)并糾正,就不會(huì)影響最終的數(shù)據(jù)質(zhì)量。但如果沒有做好SDV,讓這些錯(cuò)誤進(jìn)入統(tǒng)計(jì)分析階段,后果可能就很嚴(yán)重了。
數(shù)據(jù)質(zhì)疑的管理流程
前面提到過,當(dāng)系統(tǒng)發(fā)現(xiàn)錄入數(shù)據(jù)有問題時(shí)會(huì)生成質(zhì)疑。質(zhì)疑的來源有很多種:系統(tǒng)自動(dòng)核查發(fā)現(xiàn)的異常值、邏輯核查發(fā)現(xiàn)的前后矛盾、SDV發(fā)現(xiàn)的與源數(shù)據(jù)不符、數(shù)據(jù)審核時(shí)發(fā)現(xiàn)的離群值等。
質(zhì)疑管理需要遵循"及時(shí)響應(yīng)、閉環(huán)處理"的原則。錄入人員或研究者收到質(zhì)疑后,需要在規(guī)定時(shí)間內(nèi)完成回復(fù)或更正。如果是因?yàn)殇浫脲e(cuò)誤造成的,更正后即可關(guān)閉質(zhì)疑;如果是源數(shù)據(jù)本身的問題,可能需要修改源文件后再更正錄入數(shù)據(jù)。每個(gè)質(zhì)疑的處理過程都要有記錄,確保可追溯。
在多年的實(shí)踐中,我觀察到數(shù)據(jù)錄入管理有幾個(gè)難點(diǎn)是普遍存在的。
第一個(gè)難點(diǎn)是多中心數(shù)據(jù)的標(biāo)準(zhǔn)化問題。臨床試驗(yàn)通常在多個(gè)中心同時(shí)開展,不同中心的診療習(xí)慣、記錄方式可能存在差異。比如同樣是"發(fā)熱"這個(gè)不良事件,有的中心記錄最高體溫,有的中心記錄體溫峰值出現(xiàn)的時(shí)間,有的中心可能只記錄是否發(fā)熱及持續(xù)天數(shù)。這種差異在數(shù)據(jù)錄入時(shí)會(huì)造成一定困擾。
解決這個(gè)問題需要在錄入培訓(xùn)階段就做好統(tǒng)一化要求,同時(shí)在數(shù)據(jù)庫設(shè)計(jì)時(shí)考慮設(shè)置足夠的注釋字段,讓錄入人員能夠完整記錄相關(guān)細(xì)節(jié)。如果發(fā)現(xiàn)某些中心的記錄方式與其他中心差異過大,需要及時(shí)與醫(yī)學(xué)團(tuán)隊(duì)溝通,看是否需要調(diào)整錄入規(guī)范。
第二個(gè)難點(diǎn)是受試者脫落導(dǎo)致的數(shù)據(jù)不完整。臨床試驗(yàn)中不可避免會(huì)有受試者因?yàn)楦鞣N原因提前退出研究,這就會(huì)導(dǎo)致后面的訪視數(shù)據(jù)缺失。數(shù)據(jù)錄入管理需要做好脫落受試者數(shù)據(jù)的清理和歸檔工作,確保已錄入數(shù)據(jù)的完整性不受影響,同時(shí)也要如實(shí)記錄脫落原因,這對(duì)療效和安全性分析都很重要。
第三個(gè)難點(diǎn)是跨部門協(xié)作的溝通成本。數(shù)據(jù)錄入不是數(shù)據(jù)錄入人員自己的事兒,它涉及到申辦方、研究者、監(jiān)查員、數(shù)據(jù)管理、醫(yī)學(xué)監(jiān)查等多個(gè)角色。任何一個(gè)環(huán)節(jié)的信息傳遞不暢都可能影響數(shù)據(jù)質(zhì)量。建立清晰的溝通機(jī)制和責(zé)任分工,是保證錄入管理順暢進(jìn)行的基礎(chǔ)。

聊了這么多,其實(shí)臨床試驗(yàn)數(shù)據(jù)錄入管理的核心就是一個(gè)詞:嚴(yán)謹(jǐn)。每一個(gè)數(shù)據(jù)點(diǎn)背后都是一個(gè)生命個(gè)體的健康信息,容不得半點(diǎn)馬虎。從數(shù)據(jù)庫設(shè)計(jì)到錄入操作,從質(zhì)量控制到質(zhì)疑管理,每個(gè)環(huán)節(jié)都需要認(rèn)真對(duì)待。
當(dāng)然在實(shí)際工作中,完全不出錯(cuò)是不可能的。重要的是建立發(fā)現(xiàn)錯(cuò)誤、糾正錯(cuò)誤、預(yù)防錯(cuò)誤的機(jī)制,讓數(shù)據(jù)質(zhì)量始終處于可控狀態(tài)。這大概就是數(shù)據(jù)錄入管理的藝術(shù)所在吧。
