
說起eCTD電子提交從事藥品注冊(cè)的朋友應(yīng)該都不陌生,但每次聊到文件格式這個(gè)話題,大家都是一把辛酸淚。我自己當(dāng)年第一次提交的時(shí)候,光是PDF格式的問題就被退回來三次,當(dāng)時(shí)那個(gè)郁悶啊。后來慢慢摸索,也跟康茂峰的注冊(cè)團(tuán)隊(duì)取經(jīng)多了,才算真正把這里面的門道給摸透了。今天就想著把這些年積累的經(jīng)驗(yàn)整理一下,跟大家聊聊eCTD電子提交對(duì)文件格式的那些嚴(yán)格要求。
很多人可能會(huì)想,我Word里寫得漂漂亮亮的文檔,為什么非得轉(zhuǎn)成PDF?為什么文件命名必須那么死板?說實(shí)話,我一開始也有這種疑問。但后來想明白了,eCTD本質(zhì)上是一個(gè)全球通用的"電子檔案系統(tǒng)",它要解決的問題是:讓不同國家、不同審查機(jī)構(gòu)、不同審核人員,都能用統(tǒng)一的打開方式看到你的資料。
你想啊,如果每個(gè)人提交的格式都不一樣,有的用Word,有的用WPS,有的用Pages,審查員光是安裝軟件就得瘋。更別說字體顯示差異、版本兼容問題了。所以嚴(yán)格來說,這些格式要求不是什么故意刁難,而是整個(gè)行業(yè)為了提高效率而達(dá)成的共識(shí)。理解了這一點(diǎn),后面的很多規(guī)定你就覺得順理成章了。
eCTD對(duì)PDF的版本要求通常是1.4、1.5或者1.6這些比較穩(wěn)定的版本。我遇到過有人用最新版的PDF 2.0制作文檔,結(jié)果審查機(jī)構(gòu)的系統(tǒng)根本識(shí)別不了,只能重新轉(zhuǎn)格式。這里有個(gè)小建議:如果不確定對(duì)方系統(tǒng)支持什么版本,就用1.5或者1.6,這個(gè)版本區(qū)間是最保險(xiǎn)的,既不太老舊,也基本不會(huì)出現(xiàn)兼容性問題。
這點(diǎn)必須重點(diǎn)說說。PDF文檔里的字體必須全部嵌入,這個(gè)是硬性規(guī)定。為什么?因?yàn)槟愕碾娔X上可能裝著某種特殊字體,但審查員的電腦上可能沒有。如果字體沒有嵌入,他們的系統(tǒng)就會(huì)用默認(rèn)字體替代,結(jié)果就是排版錯(cuò)亂、內(nèi)容重疊,甚至出現(xiàn)亂碼。更麻煩的是,有些字體是受版權(quán)保護(hù)的,未授權(quán)嵌入可能會(huì)引發(fā)法律問題。
那什么樣的字體是安全的呢?一般來說,標(biāo)準(zhǔn)字體庫里的字體都沒問題,比如Times New Roman、Arial、Helvetica這些。但如果你用了什么特殊的裝飾字體或者藝術(shù)字體,一定要確保它們可以合法嵌入。康茂峰在協(xié)助客戶準(zhǔn)備材料的時(shí)候,都會(huì)專門檢查字體嵌入情況,這個(gè)環(huán)節(jié)真的不能偷懶。
單個(gè)PDF文件的大小通常限制在100MB以內(nèi),超過這個(gè)限制就得分拆。不過光大小合格還不行,頁面設(shè)置也有講究。A4幅面是主流標(biāo)準(zhǔn),但不同地區(qū)可能有細(xì)微差異,比如美國喜歡用Letter規(guī)格。雖然大多數(shù)eCTD系統(tǒng)對(duì)這兩種都能識(shí)別,但最好還是根據(jù)目標(biāo)地區(qū)的習(xí)慣來定。頁邊距、頁眉頁腳這些也需要統(tǒng)一,不然整個(gè)文檔看起來會(huì)非常混亂。
這可能是eCTD格式要求中最容易被低估的部分。一個(gè)完善的PDF文檔應(yīng)該包含詳細(xì)的書簽體系,就像Word里的目錄大綱一樣。每一級(jí)標(biāo)題都應(yīng)該有對(duì)應(yīng)的書簽,審核人員可以通過點(diǎn)擊書簽快速跳轉(zhuǎn)到相應(yīng)章節(jié)。
我見過很多提交材料,文檔內(nèi)容寫得挺好,但完全沒有書簽。審核員想看某個(gè)具體章節(jié),得手動(dòng)翻幾十頁,這體驗(yàn),換誰都會(huì)有意見。有些人可能會(huì)說,我可以加超鏈接啊。超鏈接確實(shí)有用,但書簽是更可靠的導(dǎo)航方式,兩者是互補(bǔ)的關(guān)系,不是替代關(guān)系。

文檔內(nèi)部的超鏈接也很重要。比如你提到"詳見第5.3.2節(jié)",這個(gè)"第5.3.2節(jié)"就應(yīng)該是一個(gè)可點(diǎn)擊的鏈接,點(diǎn)點(diǎn)就跳過去了。這不只是方便的問題,更是一種專業(yè)態(tài)度的體現(xiàn)。康茂峰的注冊(cè)團(tuán)隊(duì)在審核文檔的時(shí)候,都會(huì)逐一檢查這些鏈接能不能正常工作,有時(shí)候發(fā)現(xiàn)一些死鏈接,確實(shí)挺影響印象的。
還有一點(diǎn)需要注意:鏈接的目標(biāo)必須穩(wěn)定。如果后期修改文檔導(dǎo)致頁碼變動(dòng),鏈接可能就會(huì)失效。所以建議在文檔定稿之后再統(tǒng)一添加鏈接,或者使用相對(duì)穩(wěn)定的定位方式。
eCTD對(duì)文件命名有嚴(yán)格的規(guī)范,通常采用"模塊編號(hào)-章節(jié)編號(hào)-文件名"的格式,比如"m1-00-01-cover-letter"這樣。看起來簡單,但實(shí)際操作中容易出錯(cuò)的地方不少。
首先是字符限制。文件名通常不能超過一定長度,而且不能包含特殊字符、空格、中文甚至某些標(biāo)點(diǎn)符號(hào)。有些人喜歡用"臨床試驗(yàn)方案_V2.0_最終版.pdf"這樣的名字,在eCTD系統(tǒng)里是會(huì)被直接打回的。只能用字母、數(shù)字、連字符和下劃線,而且要全部小寫。
然后是版本管理。eCTD的版本控制不是靠文件名里的"V1.0""V2.0"來實(shí)現(xiàn)的,而是通過XML骨架文件來管理的。每個(gè)文件的版本都有對(duì)應(yīng)的校驗(yàn)和(Hash值),系統(tǒng)會(huì)自動(dòng)比對(duì)。所以文件名里不需要也不應(yīng)該標(biāo)注版本號(hào),那些版本標(biāo)記反而會(huì)讓系統(tǒng)混淆。
如果說PDF是eCTD的"血肉",那XML骨架文件就是它的"神經(jīng)中樞"。這個(gè)文件定義了整套提交材料的結(jié)構(gòu),包括有哪些模塊、每個(gè)模塊下有哪些文件、文件之間的邏輯關(guān)系是什么。XML的格式必須完全符合eCTD規(guī)范,包括標(biāo)簽使用、屬性設(shè)置、嵌套規(guī)則等等。
XML文件本身雖然不是審閱對(duì)象,但它要是出了問題,整個(gè)提交都會(huì)被拒絕。比如標(biāo)簽不匹配、屬性值非法、文件引用路徑錯(cuò)誤,這些都會(huì)導(dǎo)致系統(tǒng)驗(yàn)證失敗。我建議在正式提交之前,用專門的驗(yàn)證工具對(duì)XML文件進(jìn)行全方位檢查,不要只靠肉眼去看。
對(duì)了,XML文件對(duì)大小寫也是敏感的。"Module"和"module"在XML里會(huì)被認(rèn)為是不同的標(biāo)簽。這個(gè)細(xì)節(jié)很小,但出錯(cuò)的人不少。
eCTD對(duì)整個(gè)提交包的目錄結(jié)構(gòu)有嚴(yán)格要求,通常是"ectd"文件夾下包含"m1""m2""m3"等模塊文件夾,每個(gè)模塊下再按章節(jié)細(xì)分。這個(gè)結(jié)構(gòu)是國際通用的,擅自改動(dòng)的話,審查機(jī)構(gòu)的系統(tǒng)根本無法正確解析。
具體來說,目錄層級(jí)通常控制在三到四級(jí)。層級(jí)太少會(huì)導(dǎo)致文件混雜在一起,太多又會(huì)增加管理復(fù)雜度。每個(gè)文件夾里應(yīng)該有什么文件、文件應(yīng)該放在哪個(gè)位置,這些都有明確規(guī)定。比如研究標(biāo)簽文件(STF)必須放在特定的目錄下,PDF文件則根據(jù)所屬模塊和章節(jié)放置。
還有一點(diǎn)容易被忽視:空文件夾的問題。有些提交者為了保持結(jié)構(gòu)完整,會(huì)創(chuàng)建一些空文件夾,但在eCTD規(guī)范里,空文件夾通常是不允許的。如果某個(gè)章節(jié)確實(shí)沒有內(nèi)容,應(yīng)該在對(duì)應(yīng)的位置放一個(gè)說明文件,而不是留空。
雖然大家都在用PDF,但eCTD其實(shí)也支持其他格式的文件,比如XML、XSD、SPL等。每種格式都有對(duì)應(yīng)的MIME類型(媒體類型),系統(tǒng)會(huì)根據(jù)擴(kuò)展名自動(dòng)識(shí)別。如果你的文件擴(kuò)展名和實(shí)際格式不匹配,就會(huì)被判定為無效文件。
舉個(gè)例子,明明是一個(gè)XML文件,卻命名為"data.pdf",系統(tǒng)按PDF去解析,肯定會(huì)報(bào)錯(cuò)。這種低級(jí)錯(cuò)誤聽起來好笑,但實(shí)際工作中真的沒少見。還有就是文件擴(kuò)展名的大小寫問題,有些服務(wù)器系統(tǒng)對(duì)大小寫敏感,最好統(tǒng)一用小寫。

說幾個(gè)我自己的親身經(jīng)歷吧。有次提交一個(gè)臨床研究資料,文檔內(nèi)容檢查了無數(shù)遍沒問題,結(jié)果系統(tǒng)報(bào)錯(cuò),說某個(gè)文件找不到。后來排查半天發(fā)現(xiàn),是XML里引用的文件名和實(shí)際文件名有一個(gè)字母的大小寫不一樣。這就導(dǎo)致文件雖然在同一個(gè)目錄里,但系統(tǒng)認(rèn)為它們是兩個(gè)東西。
還有一次更冤。文檔提交之后被退回,理由是某個(gè)PDF文件沒有嵌入字體。我當(dāng)時(shí)特別自信地打開文檔檢查,發(fā)現(xiàn)字體明明都嵌入了啊。后來用專業(yè)工具一看,才發(fā)現(xiàn)文檔里有幾個(gè)隱藏的字體,編輯器里看不到,但PDF生成的時(shí)候確實(shí)沒有嵌入。從那以后,我每次都會(huì)用Acrobat的預(yù)檢功能完整掃描一遍,確保沒有任何遺漏。
第一,預(yù)留充足的時(shí)間檢查格式。別以為內(nèi)容寫完了就大功告成,格式檢查往往比寫內(nèi)容更耗時(shí)。康茂峰在服務(wù)客戶的時(shí)候,通常會(huì)安排多輪交叉檢查,就是為了讓格式問題無所遁形。
第二,使用專業(yè)的檢查工具。現(xiàn)在市面上有不少針對(duì)eCTD格式驗(yàn)證的軟件,能自動(dòng)檢查PDF的版本、字體、書簽,也能驗(yàn)證XML的格式是否規(guī)范。雖然這些工具不是萬能的,但至少能幫你發(fā)現(xiàn)大部分明顯問題。
第三,保持文檔和XML的同步更新。每次修改文檔內(nèi)容后,記得同步更新XML里的引用信息和校驗(yàn)和。文檔更新了但XML沒同步,這種問題很難自查出來,但系統(tǒng)一查一個(gè)準(zhǔn)。
第四,提前了解目標(biāo)地區(qū)的特殊要求。雖然eCTD是國際標(biāo)準(zhǔn),但不同地區(qū)可能會(huì)有一些額外的細(xì)則。比如歐盟對(duì)某些類型的文件有特別的大小限制,美國FDA對(duì)XML的版本要求可能和其他地區(qū)不一樣。這些差異需要在準(zhǔn)備階段就搞清楚。
eCTD電子提交這件事,說難不難,但要說簡單也確實(shí)不簡單。格式要求看起來繁瑣,但每一條規(guī)定背后都有它的道理。把這些要求吃透不只是為了通過審核,更是為了讓自己的工作更規(guī)范、更有效率。
如果你正在為eCTD提交發(fā)愁,建議找個(gè)有經(jīng)驗(yàn)的團(tuán)隊(duì)帶著走一遍流程。很多坑自己踩一遍印象是深刻,但能提前避開不是更好嗎?畢竟我們的目標(biāo)是讓藥品早日上市惠及患者,而不是在格式問題上反復(fù)糾纏。
