
說到eCTD文檔歸檔這個話題,我想先講講自己的經(jīng)歷。前幾年第一次負(fù)責(zé)一個原料藥項(xiàng)目的eCTD申報時天真地以為,只要把PDF文件按要求命名、放進(jìn)對應(yīng)的文件夾結(jié)構(gòu),這事兒就差不多完成了。直到后來藥監(jiān)部門的審評老師提出補(bǔ)正資料的要求,我才發(fā)現(xiàn)當(dāng)初存的那些文檔根本沒法快速調(diào)取——版本混亂、關(guān)聯(lián)關(guān)系不清、簽署記錄缺失,那段時間真的焦頭爛額。
后來跟行業(yè)里的前輩請教,才慢慢明白eCTD文檔的歸檔保存和最初的申報準(zhǔn)備完全是兩碼事。申報是把文檔"交出去",而歸檔是把文檔"管起來",管得好不好,直接關(guān)系到后面補(bǔ)充資料、變更申報、甚至項(xiàng)目交接時的效率。今天這篇文章,我想把自己踩過的坑和后來學(xué)到經(jīng)驗(yàn)整理一下,說說eCTD發(fā)布后電子文檔歸檔保存到底應(yīng)該怎么做。
在具體操作之前,我覺得有必要先把概念理清楚。很多朋友會把eCTD申報和eCTD歸檔混為一談,其實(shí)兩者側(cè)重點(diǎn)不太一樣。
eCTD,全稱是Electronic Common Technical Document,也就是電子化通用技術(shù)文檔。它是一套標(biāo)準(zhǔn)化的文檔組織框架,把化學(xué)、生產(chǎn)、質(zhì)量控制、臨床研究、非臨床研究這些模塊的內(nèi)容用統(tǒng)一的結(jié)構(gòu)和格式來呈現(xiàn)。申報時,我們需要按照這個框架把文檔組裝成特定的層級結(jié)構(gòu),然后通過指定的方式提交給監(jiān)管機(jī)構(gòu)。
而歸檔呢,簡單說就是把這些已經(jīng)提交的文檔以及相關(guān)的支持性文件,系統(tǒng)性地保存起來,并且要保證后續(xù)能夠準(zhǔn)確地檢索、使用和追溯。這里容易忽略的一點(diǎn)是:歸檔不僅僅是保存最終提交的PDF文件,還包括底稿、源文件、審批記錄、版本變更歷史等等一系列"過程痕跡"。這些看似繁瑣的東西,在某些時刻可能會成為救命稻草。
我見過不少項(xiàng)目在歸檔時手忙腳亂,根本原因往往是申報階段就沒有做好文檔管理。所以如果時間允許,我建議在eCTD申報的推進(jìn)過程中就開始為歸檔做鋪墊。

命名規(guī)范這件事,看起來簡單,但真正能堅(jiān)持做得好的團(tuán)隊(duì)其實(shí)不多。我的經(jīng)驗(yàn)是,命名規(guī)則要在項(xiàng)目啟動時就確定下來,然后強(qiáng)制執(zhí)行。好的命名應(yīng)該包含足夠的識別信息,比如模塊編號、文檔類型、版本號、日期等關(guān)鍵要素。
舉個子目錄結(jié)構(gòu):
| 目錄層級 | 說明 |
| m1 | 行政性文檔 |
| m2 | CTD概要文檔 |
| m3 | 質(zhì)量部分文檔 |
| m4 | 非臨床研究報告 |
| m5 | 臨床研究報告 |
每個模塊下面的文件命名可以采用"模塊編號-章節(jié)編號-文檔名稱-版本號"的形式,比如"m3-3.2.P-產(chǎn)品質(zhì)量標(biāo)準(zhǔn)-001"這樣的格式。版本號最好采用三位數(shù)字,比如V001、V002,這樣排序時不會出現(xiàn)V1.2排在V1.10前面的尷尬情況。
這個區(qū)分非常重要。在申報過程中,文檔會經(jīng)歷無數(shù)次修改,如果把每個版本都混在一起保存,最后肯定會亂成一鍋粥。我的做法是建立兩個獨(dú)立的文件夾體系:一個叫"Submission",專門存放最終提交給監(jiān)管機(jī)構(gòu)的版本;另一個叫"Working",存放申報過程中產(chǎn)生的所有中間版本、討論稿、批注稿等等。
這樣做的好處是顯而易見的:歸檔時只需要處理"Submission"里的內(nèi)容,而"Working"可以作為過程記錄另行保存,既保證了歸檔庫的干凈整潔,又保留了完整的過程痕跡。
eCTD文檔中有很多需要簽署的文件,比如授權(quán)委托書、研究報告的扉頁、檢驗(yàn)報告單等等。這些原始簽署文件一定要單獨(dú)歸檔保管,不能只存掃描件。一方面是因?yàn)橛行┍O(jiān)管機(jī)構(gòu)會要求提供原始文件備查;另一方面,簽署文件的復(fù)印件在法律效力上確實(shí)不如原件。
建議用一個專門的文件夾存放所有簽署文件的掃描件和對應(yīng)的原件清單,清單上要注明文件的用途、保存位置、保管責(zé)任人這些信息。康茂峰這類專業(yè)服務(wù)團(tuán)隊(duì)在協(xié)助項(xiàng)目歸檔時,通常也會特別強(qiáng)調(diào)這一點(diǎn),因?yàn)楹炇鹞募耐暾灾苯雨P(guān)系到整個申報檔案的可追溯性。
做好準(zhǔn)備工作后,真正進(jìn)入歸檔環(huán)節(jié)時,我給自己定了一個簡單的評判標(biāo)準(zhǔn):歸檔后的文檔,能不能在五分鐘內(nèi)找到任意一份指定的文件?如果能,那歸檔工作基本合格;如果不能,那就說明還有改進(jìn)空間。
圍繞這個目標(biāo),我總結(jié)了三個核心原則。
eCTD本身就有嚴(yán)格的目錄結(jié)構(gòu),這個結(jié)構(gòu)其實(shí)就是最好的歸檔骨架。我建議直接沿用申報時的目錄結(jié)構(gòu),最多在根目錄下增加幾個輔助文件夾,比如"04-ArchiveMetadata"用于存放歸檔說明和元數(shù)據(jù)文件,"05-Signatures"用于存放簽署記錄,"06-ChangeLog"用于存放版本變更日志。
具體來說,一個完整的歸檔結(jié)構(gòu)可能是這樣的:
每個一級文件夾下面再按照申報時的章節(jié)結(jié)構(gòu)細(xì)分,這樣不管過了多久,都能快速定位到目標(biāo)文件。
這一點(diǎn)是很多團(tuán)隊(duì)容易忽略的。一份文檔從初稿到終版,可能經(jīng)歷了幾十次修改,如果不做記錄,后續(xù)想要追溯"某個數(shù)據(jù)是什么時候改的、為什么改的"就完全不可能了。
版本變更記錄可以做得簡單些,但一定要包含幾個關(guān)鍵信息:版本號、修改日期、修改人、修改內(nèi)容摘要、批準(zhǔn)人。我一般會用Excel或Word做個簡單的變更日志模板,每次文檔更新時順手填一下,這個動作花不了多少時間,但后續(xù)能幫上大忙。
復(fù)雜一些的項(xiàng)目,還可以考慮用專業(yè)的文檔管理系統(tǒng)來自動追蹤版本變化。不過對于大多數(shù)中小型項(xiàng)目來說,手動維護(hù)的變更日志配合規(guī)范的命名規(guī)則,基本就夠用了。
eCTD提交前,通常會用專門的驗(yàn)證工具檢查文檔結(jié)構(gòu)、鏈接完整性、書簽有效性等等。驗(yàn)證工具生成的報告一定要保存好,這不僅是歸檔完整性的一部分,在后續(xù)遇到問題時也能作為參考依據(jù)。
另外,提交成功的回執(zhí)、監(jiān)管機(jī)構(gòu)的收文編號、提交時間這些信息也要記錄清楚。如果是通過電子提交平臺操作的,平臺的提交記錄截圖或者導(dǎo)出文件都可以一并歸檔。這些信息在后續(xù)查詢申報狀態(tài)、跟進(jìn)審評進(jìn)度時都會用到。
歸檔工作做完之后,并不意味著就萬事大吉了。電子文檔的長期保存其實(shí)是個持續(xù)性的話題,這里分享幾個我自己的做法。
關(guān)于存儲介質(zhì),我的建議是不要把雞蛋放在一個籃子里。至少要保留兩份完全獨(dú)立的備份,一份放在本地服務(wù)器或硬盤上,另一份放在異地或云端存儲。重要的項(xiàng)目,我甚至?xí)坛晒獗P再保存一份,因?yàn)楣獗P在防病毒和防誤刪方面有自己的優(yōu)勢。
備份這件事最怕的就是"只備份不檢查"。我一般每隔半年會做一次備份完整性的抽查,隨機(jī)抽取一些文件檢查能否正常打開。有一年我就發(fā)現(xiàn)某次備份用的硬盤有個別扇區(qū)損壞了,幸好轉(zhuǎn)儲得及時,沒有造成損失。
eCTD規(guī)范要求文檔采用PDF格式,這個選擇是很有道理的,PDF的跨平臺性和長期穩(wěn)定性都經(jīng)過了時間的驗(yàn)證。但即便是PDF,也要注意幾個問題:首先,使用的PDF版本不要太新,以免老版本的閱讀器打不開;其次,盡量避免使用特殊的字體嵌套,如果文檔中使用了監(jiān)管機(jī)構(gòu)系統(tǒng)中沒有的字體,替換后可能導(dǎo)致內(nèi)容顯示異常;還有,提交前一定要把所有外部鏈接、動態(tài)元素清理干凈,這些東西在長期保存過程中最容易出問題。
源文件 тоже 要保存一份。Word、Excel這些源文件雖然不如PDF穩(wěn)定,但萬一后續(xù)需要修改或重新排版,有源文件會方便很多。建議源文件和PDF版本分開歸檔,各自保持獨(dú)立。
電子存儲介質(zhì)的壽命比想象中短很多。硬盤的壽命通常是三到五年,光盤好一些但也就五到十年。所以對于長期保存的項(xiàng)目,建議每隔三五年就做一次存儲介質(zhì)的更新,把數(shù)據(jù)遷移到新的介質(zhì)上。這個過程中順便做一次完整性和可讀性檢查,確保數(shù)據(jù)沒有損壞。
康茂峰這類服務(wù)提供方在協(xié)助客戶做項(xiàng)目歸檔時,通常會提供介質(zhì)保管的建議和定期檢查的服務(wù)提醒,這對于人手有限的中小型團(tuán)隊(duì)來說還是很有價值的。
在歸檔實(shí)踐中,我遇到過幾個高頻問題,這里順便說說自己的應(yīng)對思路。
第一個問題是文檔版本對應(yīng)關(guān)系混亂。有時候一個章節(jié)可能同時存在多個版本的文件,文件名里也沒標(biāo)注清楚區(qū)別,結(jié)果歸檔時搞不清楚哪個是最終提交版。我的解決辦法是在歸檔前做一份"文件清單對照表",列清每個位置對應(yīng)的最終文件名,避免混淆。
第二個問題是關(guān)聯(lián)文件丟失。eCTD文檔之間有很多交叉引用,如果只保存了最終提交版本,那些被替換下去但可能被引用的舊版本就找不到了。解決方法是在歸檔說明中明確標(biāo)注引用關(guān)系,并在變更日志里記錄每次替換的詳細(xì)信息。
第三個問題是存儲空間管理。有些項(xiàng)目做了好幾年,歸檔文件夾動輒幾十G甚至上百G,檢索起來很不方便。我的做法是按年份或階段做子目錄劃分,并且在每個子目錄里放一個索引文件,方便快速瀏覽內(nèi)容結(jié)構(gòu)。
回過頭來看,eCTD文檔歸檔這項(xiàng)工作,確實(shí)不像申報準(zhǔn)備那樣有明確的截止日期和驗(yàn)收標(biāo)準(zhǔn),但它對項(xiàng)目長期管理的價值是實(shí)實(shí)在在的。我自己就曾經(jīng)受益于規(guī)范的歸檔——某次項(xiàng)目交接時,新接手的同事需要調(diào)取三年前的一份研究資料,正是因?yàn)闅w檔時做了完整的版本記錄和索引清單,整個過程只用了不到半小時就找到了目標(biāo)文件。
當(dāng)然,我也不是每次都能做得完美。之前有個項(xiàng)目因?yàn)橼s進(jìn)度,歸檔工作做得比較粗糙,后來需要補(bǔ)充資料時花了整整兩天來整理、核對,那次教訓(xùn)讓我更加確信歸檔這件事不能拖、不能省。
如果你所在的公司或團(tuán)隊(duì)還沒有建立規(guī)范的eCTD歸檔流程,不妨從下一個項(xiàng)目開始試著做起來。不用一步到位,可以先從最基本的文檔命名規(guī)范和版本記錄開始,逐步完善。好的歸檔習(xí)慣一旦建立,后續(xù)會越來越輕松。
