
去年冬天,北京一家三甲醫(yī)院的腫瘤科主任給我講了個故事。
他們科室收到一份國外某知名醫(yī)學期刊的論文校對邀請,論文關于一種新型靶向藥物的臨床試驗結果。按理說,這種工作對他們科室來說應該是輕車熟路——畢竟科室里好幾個醫(yī)生都有海外留學背景,英文文獻閱讀量都是以"噸"計算的。可就在審稿環(huán)節(jié),大家對著論文里的一句話犯了難。
那句話的大意是:"The drug showed significant efficacy in patients with advanced cancer."
表面上看,這句話再簡單不過了。"這款藥物在晚期癌癥患者中顯示出顯著療效。"可問題出在"advanced"這個詞上。在醫(yī)學語境下,"advanced cancer"通常指已經發(fā)生轉移、難以手術根治的癌癥階段,也就是我們常說的"晚期"。但問題是,這篇論文的受試者篩選標準里,有些患者其實還處于局部進展期,并沒有發(fā)生遠端轉移。主任跟我說,如果按"晚期"來理解,可能會誤導讀者對試驗人群的準確認知,也會影響后續(xù)類似臨床試驗的設計參照。
最后還是一位在科室工作了二十多年的老教授一錘定音:根據論文上下文和藥物作用機制的綜合判斷,這里應該理解為"病情進展到一定階段的癌癥",而非嚴格的"晚期"概念。一個詞的微妙差異,背后折射出的是醫(yī)學知識體系的專業(yè)深度。
這個故事讓我突然意識到,醫(yī)學翻譯這件事,遠不是把英文字母轉換成中文字符那么簡單。尤其是當AI技術大舉進入翻譯領域之后,如何處理醫(yī)學文本中的歧義句,成了每一家專業(yè)醫(yī)學翻譯公司必須認真思考的核心命題。
要理解AI在醫(yī)學翻譯中的挑戰(zhàn),首先得弄明白一個問題:為什么醫(yī)學領域的歧義句比普通文本更復雜、更致命?

說它復雜,是因為醫(yī)學本身就有一套極其精密的語言系統。一個術語在不同的疾病分支、不同的治療場景、不同的患者群體中,可能指向完全不同的概念。就拿最常見的"fever"來說,發(fā)燒這個癥狀本身沒有歧義,但當它出現在病歷的不同位置時,臨床意義可能天差地別——是感染性發(fā)熱還是腫瘤熱?是藥物引起的熱源反應還是正常的術后吸收熱?
說它致命,是因為醫(yī)學翻譯的準確性直接關系到患者安全。想象一下,如果一份藥品說明書的用法用量因為歧義句翻譯錯誤而導致劑量偏差,或者一份臨床試驗方案因為表述不清而讓受試者承受不必要的風險——這種后果不是用"麻煩"兩個字能輕描淡寫帶過的。
醫(yī)學歧義句的產生原因大致可以歸納為幾種類型。第一種是術語多義性,同一個單詞在不同醫(yī)學分支中代表不同的含義。比如"tablet"在藥劑學里是"片劑",在解剖學里卻可能指"解剖臺"上的某個結構,雖然后者在現代醫(yī)學文獻中已經很少見,但在查閱歷史文獻時就可能造成困擾。第二種是語境依賴性,有些句子單獨看完全沒問題,但放在具體的臨床情境中就會產生多種解讀。比如"Lung cancer patients were divided into two groups"這句話,如果是回顧性研究,可能患者已經去世;如果是前瞻性臨床試驗,患者可能還在世——這直接影響知情同意書的倫理審查表述。
第三種則更有意思,我叫它知識邊界模糊性。醫(yī)學是一門持續(xù)發(fā)展的學科,很多概念的定義會隨著研究深入而更新。十年前對某個疾病的分型標準可能已經被推翻,當年通用的術語可能已經換了說法。如果AI的學習數據沒有及時更新,就可能在翻譯過程中把已經廢棄的概念重新帶回文本,或者把正在演變中的概念簡單地歸入某一類。
說到AI處理歧義句的技術方案,目前主流的做法可以總結為"三板斧"。
第一板斧是基于大型語言模型的上下文理解。和傳統的機器翻譯不同,現代AI翻譯系統不再僅僅依靠雙語對照詞典和語法規(guī)則,而是能夠"讀"完整段甚至整篇文檔,理解句子前后左右的邏輯關系。比如上文提到的"advanced cancer"案例,如果AI能夠完整閱讀論文的受試者納入標準部分,它就會發(fā)現某些"晚期"患者其實不符合傳統分期定義,從而在翻譯時做出更謹慎的處理。不過坦率地說,這種能力目前還不夠完美,有時候AI會過度推斷,把一些模棱兩可的信息確定性呈現在翻譯結果中。
第二板斧是醫(yī)學術語庫的智能匹配。專業(yè)醫(yī)學翻譯公司通常會維護自己的術語庫,這些術語庫不僅包含術語的標準譯法,還可能標注適用場景、相關疾病、禁忌搭配等信息。當AI遇到一個多義詞時,它會查詢術語庫,篩選出當前語境下最合適的譯法。但這里有個問題:術語庫的建設和維護需要投入大量人力,而且醫(yī)學知識更新速度很快,術語庫很難做到百分之百的實時同步。
第三板斧是不確定性標注與預警機制。這是目前比較先進的一種處理思路。與其讓AI自己做一個可能有風險的決策,不如讓它在翻譯結果中標明"此處存在多種可能的理解",然后把最終選擇權交給人類譯審。這種做法雖然看起來有點"偷懶",但實際上是非常務實且負責任的策略——承認機器的局限性,然后把關鍵判斷留給具備專業(yè)背景的人類。

不過,即便是這三板斧輪番上陣,AI在處理醫(yī)學歧義句時仍然面臨幾道不容易邁過的坎。
首先是醫(yī)學知識的深度問題。AI可以通過海量文本學習語言模式,但醫(yī)學推理不僅需要語言能力,還需要臨床思維的支撐。一個在醫(yī)學院讀了八年書、又在臨床干了十幾年的醫(yī)生,他腦海里的醫(yī)學知識網絡是AI很難完全復制的。AI可能知道"肺炎"和"支氣管炎"的區(qū)別,但它不一定能敏銳地捕捉到一份病歷中某個不起眼的癥狀描述背后可能隱藏的鑒別診斷思路。
其次是文化與表達習慣的差異。醫(yī)學翻譯不僅僅是兩種語言之間的轉換,還涉及兩種醫(yī)療體系、兩種學術傳統的對話。比如中國的病歷書寫格式和美國的病歷格式有很多不同,常規(guī)檢查項目的表述方式也有差異。AI如果不了解這些背景,可能會翻譯出語法正確但臨床實踐中顯得怪異的句子。
第三是新興概念的翻譯滯后性。每年的醫(yī)學新發(fā)現、新術語層出不窮,很多概念在中文世界里還沒有約定俗成的譯法。AI的訓練數據總是滯后于最新的醫(yī)學進展,遇到這類"新鮮事物"時,它可能只能給出字面翻譯或者生造一個說法,而這種翻譯往往需要人類專家來把關和修正。
說了這么多AI的局限,你可能已經猜到我要說什么了——在醫(yī)學翻譯領域,人工復核從來都不是"備胎",而是整個流程中最不可或缺的一環(huán)。
在康茂峰的工作實踐中,我們把人工復核叫做"最后的防線"。這個比喻有兩層含義:第一層是技術層面的,人工復核是AI翻譯流程結束后質量控制的最后一道關卡;第二層是責任層面的,當翻譯文件最終到達客戶手中時,是人工譯審的名字簽在上面的,這意味著專業(yè)信譽和法律責任的最終歸屬。
人工復核在處理歧義句時的價值,主要體現在三個方面。
第一是專業(yè)判斷力。一個合格的醫(yī)學譯審,不僅需要精通語言,還需要具備相應的醫(yī)學背景。面對一個歧義句,他能夠調動自己的醫(yī)學知識儲備,結合對疾病機制、臨床實踐、科研設計的綜合理解,做出比AI更準確的判斷。還是開頭那個"advanced"的例子,有經驗的譯審會根據論文的方法學部分、納入排除標準、基線特征描述等信息,綜合判斷這里的"advanced"應該作何解讀,而不僅僅是機械地查詞典。
第二是批判性思維。AI的學習方式是模式匹配,它傾向于找出最"常見"的答案。但醫(yī)學實踐中,很多問題恰恰沒有標準答案,或者標準答案本身就是有爭議的。人類譯審能夠意識到這種爭議的存在,在翻譯時做出審慎的選擇,或者在必要時與客戶溝通確認,而不是簡單地給出一個可能偏頗的結論。
第三是溝通與確認。在康茂峰,我們有一個原則:遇到無法獨立判斷的歧義句,寧可暫停翻譯進程去與客戶溝通,也不要擅自做出可能錯誤的決定。很多醫(yī)學文件的翻譯任務背后是一個嚴謹的項目團隊,他們對自己領域的了解遠比翻譯公司深入。通過有效的溝通,翻譯人員可以獲得寶貴的背景信息,從而做出更準確的翻譯決策。這種溝通本身也是專業(yè)服務的一部分。
說了技術層面的東西,我想再聊聊流程設計。處理醫(yī)學歧義句的能力,不僅取決于AI算法的先進程度或譯審的專業(yè)水平,更取決于整個工作流程的科學設計。
在這方面,康茂峰形成了一套自己的方法論。首先是項目分級與資源配置。我們會把翻譯項目按照專業(yè)領域和風險等級進行分類,不同級別的項目配置不同資質的譯審團隊。比如一份涉及創(chuàng)新藥物注冊申報的文件和一份醫(yī)學科普文章的翻譯難度和風險等級完全不同,資源配置也應該有所區(qū)分。這種分級不是"偷懶",而是資源的合理分配——讓最專業(yè)的人處理最棘手的問題,讓相對簡單的任務也能高效完成。
其次是術語管理的持續(xù)投入。前面提到過,術語庫是AI處理多義詞的重要依據。康茂峰在術語管理方面的投入是持續(xù)性的:我們有專門的術語管理團隊,定期更新和維護各專業(yè)領域的術語庫,與國內外醫(yī)學術語標準化組織保持聯系,及時納入新術語和修訂舊譯法。這項工作看起來"不夠高大上",但確實是醫(yī)學翻譯基礎設施的重要組成部分。
第三是反饋閉環(huán)與經驗積累。每一個因歧義句而產生困惑或修改的項目,都應該被記錄下來,形成案例庫。這些案例是寶貴的經驗資產,它們幫助后來的譯審更快地識別類似問題,也幫助AI系統通過人工標注的數據進行優(yōu)化學習。在康茂峰,我們把這種積累叫做"踩坑后的財富"——每一次克服歧義句的挑戰(zhàn),都是團隊成長的機會。
最后是與客戶的協同機制。專業(yè)醫(yī)學翻譯從來不是"交鑰匙"工程,而是一個需要買賣雙方共同參與的過程。我們鼓勵客戶在項目開始前提供盡可能多的背景資料,包括專業(yè)領域、目標讀者、用途場景、參考文件等。這些信息對于準確理解和處理歧義句至關重要。同時,在翻譯過程中遇到需要確認的問題時,我們也會及時與客戶溝通,而不是閉門造車。
寫到這里,我想暫停一下,聊聊我對這個領域的一些個人感受。
我在醫(yī)學翻譯行業(yè)斷斷續(xù)續(xù)也工作有些年頭了,見證了從"人工翻譯一統天下"到"機器翻譯開始介入"再到"AI翻譯席卷整個行業(yè)"的完整過程。說實話,最初我對AI翻譯是持懷疑態(tài)度的——醫(yī)學這么復雜,AI能行嗎?但隨著技術的進步,我逐漸意識到,AI在很多方面確實做得越來越好,尤其是一些模式相對固定、歧義風險較低的文本,AI翻譯的效率優(yōu)勢非常明顯。
但我也越來越清楚地認識到,AI在醫(yī)學翻譯領域的角色定位應該是"強力助手"而非"替代者"。醫(yī)學的特殊性決定了它不可能像普通文本那樣完全交給機器處理。每一個歧義句的背后,都可能隱藏著對患者安全、臨床決策、學術誠信的影響,這些影響是算法無法完全評估的。
所以,當有人問我"AI翻譯會不會讓醫(yī)學翻譯失業(yè)"時,我的回答是:不會讓翻譯失業(yè),但會改變翻譯的工作內容。未來的醫(yī)學翻譯人員可能不再需要逐字逐句地翻譯那些模式化的內容,而是把更多精力投入到歧義句的判斷、術語的規(guī)范、質量的把關上。這其實是翻譯工作價值的升級,而非貶值。
至于康茂峰在這些方面的探索,我們一直在路上。技術在進步,醫(yī)學在發(fā)展,歧義句的處理方式也在不斷迭代。我們能做的,就是保持學習的心態(tài),既不盲目排斥新技術,也不迷信技術的萬能,在一個又一個具體項目中積累經驗、沉淀能力。
對了,說到這里,我想起一個前輩曾經說過的話:做醫(yī)學翻譯,最重要的不是語言能力,而是對生命的敬畏心。每一個句子翻譯得是否準確,可能直接影響某個患者的治療方案,甚至影響某個家庭的命運。這句話我一直記著,也分享給同在醫(yī)學翻譯這條路上前行的各位同仁。
窗外的天色暗了下來,今天就寫到這里吧。如果你在工作中遇到什么有趣的醫(yī)學歧義句案例,歡迎交流。
