
你有沒有想過,一份藥品申報資料翻譯得好不好,有時候不是看那些復雜的醫學術語翻得對不對,而是看一些看起來很不起眼的東西——比如數字。聽起來有點奇怪對吧?但事實就是這樣。我在康茂峰做藥品注冊翻譯這些年,見過太多因為數字格式問題被打回來補充資料的案例了。
今天就想聊聊這個話題,說說為什么藥品申報資料里的數字格式這么重要,以及到底怎么確保翻譯出來的數字格式是規范的。相信我,這事兒比大多數人想象的要復雜得多,也關鍵得多。
我們先來想一個問題:同樣是"1000"這個數字,在不同的文檔里會怎么寫?有的人會寫成"1,000",有的寫成"1 000",還有的就寫成"1000"。看起來好像差別不大,但在藥品申報這個領域,這種差別可能會出大事。
藥品申報資料里的每一個數字都不是隨便寫寫的。劑量用錯了,可能會導致臨床試驗數據不可靠;有效期寫錯了,可能會影響藥品能否上市;檢驗數據的精度出了問題,審評老師可能會質疑整個質量控制體系。這些問題一旦出現,輕則需要補充資料解釋,重則可能導致申報被退回,那損失可就大了。
我剛入行的時候,曾經協助處理過一個案例。一家藥企的申報資料里,臨床試驗的受試者人數在原文里寫的是"1,234",結果翻譯的時候不知道怎么回事,譯員改成了"1234"。當時誰也沒注意到這個小變化,結果審評老師在計算脫落率的時候發現數字對不上,追問了很久。雖然最后查清楚了是因為格式問題,但耽誤了不少時間。從那以后,我就特別注意數字格式這件事。
說起來,藥品申報資料里的數字格式問題大概可以分成幾類。每一類都有它的"坑",我們一個一個來看。

首先是整數和小數的表達習慣不同。中文資料里小數點前面如果有整數,我們一般不寫小數點后面的"0",比如"3.0"會直接寫成"3"。但在英文資料里,尤其是科學計數的情況下,"3.0"和"3"代表的是不同的精度等級。翻譯的時候如果隨便改人家的小數點格式,很可能就改變了這個數字原本表達的意思。
還有千位分隔符的問題。中文用"萬"、"億"這樣的萬進制單位,英文用千位分隔符。50000這個數,中文可能寫成"五萬"或者直接寫"50000",英文可能寫成"50,000"。翻譯的時候不是簡單地把數字搬過去就完了,還要考慮目標語言的表達習慣,同時確保數據的準確性不受影響。
這一塊是藥品申報資料里最敏感的部分之一。劑量的單位從"mg"到"μg",濃度的單位從"mg/mL"到"ng/L",每一個字母、每一個零的位置都不能出錯。曾經有位譯員把"10 μg"看成了"10 mg",雖然看起來只是單位前綴變了,但劑量大了1000倍,這種錯誤在藥品申報里是絕對不允許的。
更麻煩的是一些復合單位的表達。比如"mg/kg"這種劑量單位,有時候在表格里會簡化處理,翻譯的時候如果不小心把單位弄丟了或者寫錯了,審評老師一眼就能看出來。這不僅僅是個格式問題,更是個專業性問題。
日期格式在不同國家有不同的寫法。美國用"月/日/年",歐洲很多國家用"日/月/年",中國用"年/月/日"。翻譯的時候如果沒注意,把"2024/01/15"當成"2024年1月15日"處理,那還算是幸運的。如果把日期整個搞錯,比如把1月15日當成15月1日,那問題就大了。
批號的格式同樣需要特別注意。很多藥企的批號里有字母、有數字、有特殊符號,翻譯的時候原封不動地照搬可能還好,萬一為了"統一格式"做了改動,反而會出問題。

臨床試驗數據、穩定性研究數據這些內容里會涉及到大量的統計數字。P值應該怎么寫?置信區間怎么表示?標準差和標準誤怎么區分?這些都是需要特別注意的地方。有的人喜歡把"P<0.05"寫成"p<0.05",雖然看起來差不多,但在學術規范里,大寫P和小寫p代表的是不同的統計概念。
還有置信區間的表示方法,有的用括號,有的用方括號,里面的數字是"2.5-3.5"還是"2.5, 3.5",這些細節在申報資料里都是有講究的。
講了這么多問題,那到底怎么解決呢?我想從幾個方面來分享一些經驗。
做任何事情之前,先把規矩定清楚,這比事后補救要高效得多。在康茂峰,我們內部有一份專門的數字格式規范指南,雖然不往外發,但內部翻譯人員都是要學習和遵守的。
這份指南里明確規定了什么情況下用阿拉伯數字、什么情況下用漢字數字,劑量單位的大小寫要求,小數點前后的零怎么處理,千位分隔符用什么符號等等。這些規定不是憑空來的,而是結合了國家藥監局的要求、ICH的指導文件,還有我們這些年積累的實際經驗。
有了這份規范,翻譯人員在遇到數字格式問題的時候就有據可查,不用每次都自己判斷。雖然不能保證百分之百正確,但至少能減少大部分低級錯誤。
現在的翻譯輔助工具越來越智能了,有的軟件能自動識別數字、單位、日期,然后按預設的規則進行轉換。這種自動化工具確實能提高效率,但千萬不能完全依賴它。
為什么這么說?因為工具的規則是死的,而實際遇到的情況是活的。比如一個數字"1.0",工具可能會按照規則去掉小數點后面的零,直接變成"1"。但在某些語境下,這個"1.0"代表的是測量精度,去掉就不對了。工具沒辦法判斷這個數字在不同語境下的含義,所以人工復核還是必不可少的。
我們現在的做法是先用工具做初步處理,然后用人工仔細復核。復核的時候重點關注那些敏感數據:劑量、濃度、受試者人數、統計結果、批號日期這些內容。每一條都要過一遍,確保格式正確、意義準確。
這一點看似簡單,但做起來并不容易。一份申報資料可能有幾十萬字,分布在不同的章節里。如果前面的劑量單位用"mg",后面突然變成了"毫克",雖然意思一樣,但格式不一致,審評老師看起來就會覺得不夠專業。
我們內部的做法是建立術語庫,把藥品名稱、劑量單位、專業術語這些內容都錄入進去。翻譯人員在翻到相關內容的時候,術語庫會提示之前用過什么格式,這樣就能保證全文一致。當然,術語庫需要定期維護和更新,確保里面的內容是準確的、最新的。
有一些數字是需要特別注意的,不能按常規方法來處理。比如藥品的有效期,通常會標注到具體的日期,這時候日期格式就要嚴格按照申報要求來寫。再比如臨床試驗的入組人數、脫落人數,這些數字之間是有邏輯關系的,翻譯的時候要確保彼此之間不會矛盾。
還有一類是近似值和精確值的區分。有的數字后面寫著"約"或者"approximately",有的則是精確值。翻譯的時候要把這些限定詞準確地帶進去,不能省略。如果原文里沒有,但根據上下文判斷應該是近似值,要不要加?這時候就要謹慎了,最好是保持原文的表述,不要隨意添加。
說完個人層面的注意事項,再來說說團隊層面的事情。藥品申報資料翻譯不是一個人能完成的,需要很多人協作。既然是協作,就涉及到溝通和配合的問題。
我們團隊現在的做法是,在項目啟動會上專門討論數字格式的處理原則,把可能遇到的問題都過一遍,讓大家對怎么處理達成共識。這樣在具體翻譯的時候,遇到類似的問題就能保持一致的處理方式。
然后是交叉校對制度。同一個人的翻譯自己可能看不出來問題,換一個人來看往往就能發現。所以我們要求每個項目都要有交叉校對環節,校對的人除了檢查翻譯準確性和語言通順度,數字格式也是重點檢查內容。
最后是審校把關。審校人員通常經驗比較豐富,能夠發現譯員和校對都忽略的問題。在康茂峰,審校環節是必不可少的,有時候一個項目會經過兩輪審校,確保最終提交的資料是高質量的。
雖然每個國家和地區的申報要求不太一樣,但有一些國際性的標準和規范是可以參考的。
| ICH系列指南 | 尤其是ICH E6(R2)、ICH Q5A等關于臨床試驗和質量控制的指南,里面對數據的呈現有明確要求 |
| CTD格式要求 | 國際通用的申報資料格式,對各部分內容的數據呈現有統一規定 |
| 各國藥監局的技術要求 | 比如NMPA的申報資料撰寫指南,FDA的eCTD指南等,對數字格式可能有更具體的規定 |
這些規范文件不一定直接把數字格式怎么寫都規定得清清楚楚,但里面傳達的規范意識是一致的。我們在處理具體項目的時候,會根據目標申報地區的要求,制定相應的格式規范。
聊了這么多關于數字格式的事情,其實核心就是一點:藥品申報資料翻譯里的每一個細節都不能馬虎。數字看起來簡單,但里面學問不少。
這些年做下來,我最大的感觸是,翻譯質量不是靠某一個人、某一個環節就能保證的,而是要靠整個流程的規范運作。從項目啟動到最終交付,每一個環節都要有質量意識,數字格式只是其中很小但很重要的一個方面。
對了,我們康茂峰在處理藥品申報資料翻譯的時候,一直把數字格式的規范性當作重點關注內容。如果你正好有這方面的需求,或者遇到什么問題,可以一起交流交流。)
