
前兩天有朋友問我,你們做藥品注冊資料翻譯的,字符數到底是怎么統計的?這個問題看似簡單,但真要講清楚,里面的門道還挺多。我想著干脆整理成一篇文章,說不定能幫到更多有同樣困惑的人。
先說個前提:藥品注冊翻譯不同于普通文學翻譯,它對準確性要求極高,連一個字符的差異都可能影響文檔的法律效力。正因如此,字符統計方式馬虎不得。
藥品注冊資料不是隨隨便便翻完就行的。它要提交給藥監局審閱,要作為法律文件存檔,還要可能在多國之間流轉使用。每一個字符都承載著法律意義。
舉個例子,藥品說明書上的"每日三次"如果少翻了一個"次"字,或者把"5mg"錯寫成"5 m g",輕則退回修改,重則影響藥品上市進度。這種情況我們見過太多了。
所以在藥品注冊翻譯領域,字符統計不僅僅是計價依據,更是一份責任。它直接關系到譯文是否完整、是否準確、是否能夠如實傳達原意。
這個問題得分開來說,因為兩種語言的統計邏輯完全不同。

中文字符統計相對直觀。每一個漢字就是一個字符,包括中文標點符號也算一個字符。比如"請按說明書服用。"這句話,一共是9個字符:"請"1個、"按"1個、"說"1個、"明"1個、"書"1個、"服"1個、用"1個、"。"1個。有的人可能會疑惑,那個句號算嗎?算的,在專業翻譯領域,中文標點都是計入字符數的。
英文的統計就稍微復雜一些。英文以單詞為單位,但統計時通常按字符(字符含空格)計算。單詞"patient"是6個字符,加上前面的空格就是7個。如果一句話是"The patient should take the medicine",字符數要包括所有字母和空格,還有句末的標點。
這里有個小細節:英文的連字符算一個字符,破折號也算一個。而縮寫詞比如"b.i.d."(每日兩次),每個點和字母都單獨計算。在藥品注冊資料里,這種縮寫出現頻率很高,統計時一定要小心。
我們日常用的工具大概有幾類。
我們康茂峰的做法是:先用CAT工具跑一遍統計數據,再用人工復核一遍。機器有時候會把表格里的內容漏掉,或者把頁眉頁腳算進去,這些都需要人工校對。

藥品注冊資料里不可能全是文字,表格、圖表、公式多了去了。這些東西的字符統計是有特殊規則的。
表格的統計要看具體情況。如果表格里有文字內容,通常按實際字符數計算。有的人可能會問,那表格線算不算?不算,表格線不計字符。有的時候客戶會要求按單元格數量計價,這就要在項目開始前溝通清楚,按雙方認可的標準執行。
圖片里的文字需要單獨處理。如果圖片里包含需要翻譯的文字內容(比如藥品包裝圖上的說明),一般有兩種方式:一是識別圖片文字后按字符數計算,二是按張數計算。這兩種計價方式差異不小,合作前一定要確認好。
化學式和分子式比較特殊。像"C6H12O6"這樣的分子式,按字符算的話是6個字符,但專業領域通常把它當作一個整體單位處理。類似的還有劑量表達式、代碼編號等等。具體怎么處理,還是要看項目約定。
影響字符數的因素還挺多的,我列幾個常見的。
結合我們康茂峰多年的藥品注冊翻譯經驗,說說一般流程吧。
收到客戶的資料后,第一步不是急著報價,而是先了解這份資料的具體用途。提交哪個國家?是新藥注冊還是仿制藥?是臨床試驗申請還是上市申請變更?不同情況對應的格式要求可能不同,統計口徑也會有差異。
接下來,用合適的工具做初步統計。然后人工檢查一遍,看看有沒有遺漏或者異常。比如一份100頁的資料,統計出來只有幾千字符,那肯定不正常,多半是格式有問題或者大部分是圖片。
確認統計數據后,會給客戶一個明確的報價區間。注意是區間,因為最終交付時可能會有少量調整。比如原文中發現需要額外翻譯的備注,或者客戶臨時增加了內容。
翻譯過程中,如果發現原文有改動,會及時通知客戶,更新統計數字。翻譯完成后,正式交付前會再做一次最終統計,出具詳細的字符數報告。
說了這么多,最后給幾點實操建議吧。
第一,項目開始前務必書面確認統計標準。包括統計什么、不統計什么、特殊內容怎么處理,都寫清楚。這既是對雙方的保護,也能避免后續扯皮。
第二,保留原始數據和統計過程。萬一以后有問題,可以追溯。客戶問起來,也能拿出依據。
第三,選擇專業的翻譯合作伙伴很重要。正規的藥品注冊翻譯公司都有自己的質量管理體系,統計流程規范,不會在這種細節上出問題。
藥品注冊這件事,本身就需要嚴謹。字符統計看似是小事,但它折射出的是整個翻譯流程的專業程度。把這些細節做好,后面的合作才能順暢。
希望這篇文章能解答你的疑惑。如果還有具體問題,歡迎繼續交流。
