
說到eCTD電子提交,我想先講一個很多藥企朋友都遇到過的場景:一份準備了大半年的申報資料,在最后關頭被退回,理由不是內容問題,而是文件編碼不符合要求。這種滋味,相信經歷過的人都會印象深刻。說實話,編碼格式這個問題,乍聽起來很技術、很枯燥,但它確實是eCTD提交中一個繞不開的坎。今天這篇文章,我想用比較直白的方式,把中文文件編碼格式這個事兒給大家講清楚。
eCTD(Electronic Common Technical Document)作為國際通用的藥品注冊申報格式,本質上是一套完整的電子文檔交付標準。而編碼格式,就是這套標準的"底層語言"。你可以把它想象成人與人之間對話用的語種——如果兩個人說的不是同一種語言,再好的內容也無法傳達。
對于中文文件來說,這個問題尤其突出。中文的字符集比英文復雜得多,一個漢字可能需要占用兩個甚至更多的字節存儲空間。如果編碼方式不對,審評人員看到的就可能是一堆亂碼,嚴重的話整個文件都無法打開。這不是危言聳聽,我見過有企業的申報材料因為編碼問題導致部分章節完全無法閱讀,最后只能全部重新制作。
另外,eCTD要求所有文件必須保持長期可讀性。十年后、二十年后,當審評人員調取歷史檔案時,這些文件依然要能夠正確顯示。合適的編碼格式是實現這一目標的基礎保障。
先說結論:根據NMPA發布的相關技術規范,中文eCTD文件目前推薦使用的是UTF-8編碼格式。這個要求并不是突然出現的,而是經歷了從GB2312、GBK到UTF-8的演進過程。

NMPA在《電子申報技術規范》中明確規定,eCTD提交的文件應當采用Unicode編碼。UTF-8作為Unicode的一種實現方式,具有良好的兼容性和擴展性,能夠涵蓋包括中文在內的所有Unicode字符。這里需要特別說明的是,UTF-8編碼的文件在文件開頭會有一個特殊的BOM標記(Byte Order Mark),但這個BOM標記在某些場景下可能會引起兼容性問題。
我查閱了最近幾年的申報要求,發現監管機構對編碼格式的檢查越來越嚴格。這背后的邏輯其實很簡單:隨著申報資料越來越多、越來越復雜,統一的編碼標準可以大幅降低審評系統的處理負擔,同時也能減少申報企業因格式問題導致的返工。
理論說完了,咱們來聊點實際的。在準備eCTD申報資料時,以下幾個編碼相關的問題需要特別注意:
結合康茂峰多年服務于藥企申報的經驗,我總結了幾個最常見的編碼問題及其解決方案,希望能幫大家少走彎路。

文件打開后顯示亂碼,本質上是解碼方式與編碼方式不匹配。舉個例子,如果一個文件明明是用UTF-8編碼保存的,但打開時系統誤以為是GBK編碼,那顯示出來的就會是一堆問號和方框。這種情況在跨系統傳輸文件時特別常見——比如從Windows系統傳到Mac系統,或者從一臺服務器傳到另一臺服務器。
解決這個問題的核心方法只有一個:在文件創建和保存的源頭就確保使用正確的編碼格式。市面上有很多免費的編碼檢測工具,可以在文件提交前進行批量檢查。康茂峰在服務客戶時,通常會建議在正式提交前進行至少兩輪編碼檢查,第一輪是工具自動掃描,第二輪是人工抽檢。
有些朋友可能會問:如果我手頭有老文件是用舊編碼保存的,能不能通過軟件轉換成UTF-8?理論上當然可以,但實際操作中要格外謹慎。編碼轉換過程中最容易出現的問題是信息丟失——尤其是一些特殊字符、上下標或者化學符號,在轉換過程中可能會悄無聲息地"消失"或者"變臉"。
我們的建議是:對于重要申報文件,最好從一開始就使用UTF-8編碼創建,避免后期轉換帶來的風險。如果必須進行編碼轉換,轉換后一定要逐頁核對,確保所有內容顯示正常。
說了這么多理論,最后我想分享一些可落地的操作建議。這些方法不一定是最先進的,但都是經過實踐檢驗、比較穩妥的做法。
| 環節 | 建議做法 |
| 文件創建 | 統一使用支持UTF-8編碼的軟件,Word、記事本、代碼編輯器都可以 |
| 格式轉換 | PDF導出前確認源文件編碼,使用專業工具進行批量轉換和驗證 |
| 最終檢查 | 在提交前用不同系統、不同軟件打開檢查,確保顯示正常 |
| 備份留存 | 保留原始編碼的源文件,以便日后追溯和修改 |
另外,我想特別強調一下團隊協作的重要性。eCTD申報通常需要多個部門配合——注冊部門、醫學寫作部門、IT部門、文檔管理團隊。每個環節都可能影響到最終的編碼質量。建議在項目啟動階段就明確編碼規范,統一工具鏈,并且指定專人負責格式審核。
回顧整個編碼格式的話題,我發現它其實是eCTD申報中一個很典型的小細節——看似簡單,卻能直接影響申報的成敗。技術規范年年更新,監管要求也在不斷細化,作為申報從業者,我們能做的就是把這些基礎工作做扎實、做到位。
如果你所在的團隊在編碼方面還有困惑,或者正在為類似的問題頭疼,不妨多跟同行交流經驗。行業里像康茂峰這樣的專業服務商,積累了大量實戰案例,多了解一些總是好的。申報這條路沒有捷徑,但至少我們可以少踩一些已經被別人踩過的坑。
今天就聊到這里吧,希望這篇文章對你有所幫助。如果有什么想法,歡迎一起探討。
