
說(shuō)到醫(yī)學(xué)翻譯,很多人第一反應(yīng)可能是"這不就是把說(shuō)明書翻成外文嗎"。其實(shí)完全不是這么回事。我有個(gè)朋友在制藥公司做注冊(cè),有次閑聊說(shuō)起他們一部臨床試驗(yàn)文檔的翻譯,光是術(shù)語(yǔ)統(tǒng)一就折騰了將近三周。那時(shí)候我就開(kāi)始思考,當(dāng)人工智能技術(shù)越來(lái)越成熟的時(shí)候,這個(gè)行業(yè)到底在經(jīng)歷什么,又面臨哪些實(shí)實(shí)在在的困境。
醫(yī)學(xué)翻譯和其他領(lǐng)域的翻譯完全不同。它關(guān)系到患者安全,關(guān)系到藥物能否獲批上市,關(guān)系到無(wú)數(shù)人的生命健康。正因如此,這個(gè)領(lǐng)域?qū)?zhǔn)確性的要求幾乎達(dá)到了苛刻的程度。康茂峰在這個(gè)行業(yè)深耕多年,見(jiàn)過(guò)太多案例,深刻理解醫(yī)學(xué)翻譯不是簡(jiǎn)單的語(yǔ)言轉(zhuǎn)換,而是一項(xiàng)需要極高專業(yè)素養(yǎng)的復(fù)雜工作。
要理解AI在醫(yī)學(xué)翻譯中的挑戰(zhàn),首先得搞清楚醫(yī)學(xué)翻譯究竟難在哪里。這個(gè)問(wèn)題看似簡(jiǎn)單,但真正搞清楚的人并不多。
醫(yī)學(xué)領(lǐng)域的術(shù)語(yǔ)體系可能是所有學(xué)科中最復(fù)雜的一個(gè)。僅以腫瘤學(xué)為例,光是"癌癥"這一個(gè)概念在不同語(yǔ)境下就有carcinoma、cancer、malignancy、neoplasm等多種表達(dá)方式,而每種表達(dá)背后都有嚴(yán)格的學(xué)科定義。再比如免疫檢查點(diǎn)抑制劑相關(guān)的術(shù)語(yǔ),從PD-1到PD-L1,從CTLA-4到LAG-3,每一個(gè)縮寫背后都是一套完整的作用機(jī)制和臨床應(yīng)用體系。
更麻煩的是,很多醫(yī)學(xué)術(shù)語(yǔ)在不同語(yǔ)言中根本沒(méi)有完全對(duì)等的表達(dá)。中文醫(yī)學(xué)術(shù)語(yǔ)很多是源自日語(yǔ)或直接音譯,英文術(shù)語(yǔ)則大量源自拉丁語(yǔ)和希臘語(yǔ)。AI系統(tǒng)在學(xué)習(xí)這些術(shù)語(yǔ)的時(shí)候,往往只能找到字面意思,而無(wú)法理解其在臨床實(shí)踐中的真正內(nèi)涵。有次我看到某個(gè)AI系統(tǒng)把"血壓變異性"翻譯成"blood pressure variability",這個(gè)翻譯本身沒(méi)問(wèn)題,但如果放在具體的臨床研究語(yǔ)境中,它可能需要根據(jù)上下文調(diào)整為"blood pressure variability index"或者更專業(yè)的表述。

醫(yī)學(xué)文獻(xiàn)的一個(gè)顯著特點(diǎn)是上下文關(guān)聯(lián)極其緊密。同一個(gè)術(shù)語(yǔ),在不同的疾病背景下、不同的患者群體中、不同的研究設(shè)計(jì)中,可能指向完全不同的概念。
舉個(gè)例子,"response"這個(gè)詞在腫瘤學(xué)文獻(xiàn)中就至少有四種常見(jiàn)含義:腫瘤對(duì)藥物的應(yīng)答、完全緩解、部分緩解、疾病穩(wěn)定期。如果AI系統(tǒng)不能準(zhǔn)確識(shí)別上下文,就很容易給出牛頭不對(duì)馬嘴的翻譯。康茂峰的譯審團(tuán)隊(duì)在審校過(guò)程中見(jiàn)過(guò)太多這類問(wèn)題,有時(shí)候AI能把單個(gè)句子翻譯得漂亮利落,但放到整篇文檔中就完全變了味。
還有一個(gè)典型的例子是劑量表述。很多藥物的劑量需要根據(jù)體表面積、肝腎功能等進(jìn)行調(diào)整,AI在處理這類數(shù)據(jù)時(shí)往往過(guò)于"智能",把"5mg/m2"這種標(biāo)準(zhǔn)表述翻譯得看似正確,實(shí)則可能漏掉了關(guān)鍵的計(jì)算單位或者參考范圍。這類錯(cuò)誤在普通文章中可能無(wú)傷大雅,但在醫(yī)學(xué)文件中卻可能直接導(dǎo)致臨床事故。
醫(yī)學(xué)翻譯不只是語(yǔ)言的轉(zhuǎn)換,更是醫(yī)療規(guī)范的傳遞。不同國(guó)家和地區(qū)在醫(yī)療實(shí)踐、藥品注冊(cè)、數(shù)據(jù)管理方面都有各自的規(guī)范和習(xí)慣,這些差異會(huì)直接反映在醫(yī)學(xué)文獻(xiàn)的寫作風(fēng)格和術(shù)語(yǔ)使用上。
比如同樣是藥品說(shuō)明書,美國(guó)FDA和歐洲EMA的要求就不完全一樣。AI系統(tǒng)在翻譯時(shí)如果不了解這些差異,可能會(huì)把符合一種規(guī)范的說(shuō)法直接套用到另一種規(guī)范中。康茂峰在處理國(guó)際注冊(cè)文件時(shí)都會(huì)特別關(guān)注這一點(diǎn),確保譯文不僅語(yǔ)言準(zhǔn)確,更要符合目標(biāo)地區(qū)的監(jiān)管預(yù)期。
說(shuō)了這么多挑戰(zhàn),讓我們來(lái)看看AI技術(shù)在這個(gè)領(lǐng)域到底能做什么,又不能做什么。
| 應(yīng)用場(chǎng)景 | AI表現(xiàn) | 局限性 |
| 基礎(chǔ)術(shù)語(yǔ)查詢 | 快速準(zhǔn)確 | 缺乏語(yǔ)境判斷能力 |
| 初稿生成 | 效率高,語(yǔ)法規(guī)范 | 專業(yè)深度不足 |
| 格式轉(zhuǎn)換 | 保持度高 | 可能丟失結(jié)構(gòu)邏輯 |
| 多語(yǔ)言互譯 | 主流語(yǔ)言表現(xiàn)尚可 | 小語(yǔ)種錯(cuò)誤率高 |
說(shuō)實(shí)話,AI在醫(yī)學(xué)翻譯中的表現(xiàn)有點(diǎn)像是"看起來(lái)很美,用起來(lái)心驚"。它能在極短時(shí)間內(nèi)產(chǎn)出看起來(lái)像模像樣的譯文,但如果把這樣的譯文直接用在藥品注冊(cè)或者臨床研究中,風(fēng)險(xiǎn)是巨大的。康茂峰始終堅(jiān)持一個(gè)原則:AI可以大幅提升效率,但絕不能替代專業(yè)譯審的判斷。
AI翻譯有一個(gè)很隱蔽的問(wèn)題,我稱之為"完美錯(cuò)誤"。什么意思呢?就是AI產(chǎn)出的譯文看起來(lái)語(yǔ)法完美、表達(dá)流暢,但專業(yè)上完全站不住腳。這種錯(cuò)誤比那些明顯的語(yǔ)法錯(cuò)誤更危險(xiǎn),因?yàn)樗哂衅垓_性了。
曾經(jīng)有位譯審朋友分享過(guò)一個(gè)案例:AI把一份臨床試驗(yàn)方案中的"adverse event"(不良事件)翻譯成了"不良反應(yīng)"。這兩個(gè)詞在中文里看起來(lái)差不多,但在醫(yī)學(xué)文件中有嚴(yán)格的區(qū)分。不良事件是指服藥后發(fā)生的任何不良醫(yī)學(xué)事件,不一定與藥物有關(guān);不良反應(yīng)則是明確與藥物因果關(guān)系的不良事件。這種混淆如果出現(xiàn)在向監(jiān)管部門的申報(bào)文件中,可能會(huì)引發(fā)嚴(yán)重的合規(guī)問(wèn)題。
還有一個(gè)更隱蔽的例子是數(shù)值和單位的位置。在英文醫(yī)學(xué)文獻(xiàn)中,數(shù)值和單位的位置關(guān)系有時(shí)會(huì)影響理解,AI在翻譯時(shí)有時(shí)會(huì)機(jī)械地調(diào)整語(yǔ)序,導(dǎo)致原本清晰的表述變得模糊。比如"the patient received 50 mg of the drug"和"the patient received the drug at 50 mg"在英文中表達(dá)的是完全不同的給藥方案,如果AI沒(méi)有正確理解這種差異,中文譯文就可能誤導(dǎo)讀者。
在效率至上的時(shí)代,醫(yī)學(xué)翻譯卻必須"慢"下來(lái)。這種"慢"不是偷懶,而是一種必要的審慎。
醫(yī)學(xué)翻譯的質(zhì)量控制需要經(jīng)過(guò)多個(gè)環(huán)節(jié):術(shù)語(yǔ)查證、上下文確認(rèn)、初譯、校對(duì)、審核、專業(yè)審校、最終定稿。每一個(gè)環(huán)節(jié)都需要專業(yè)人員的判斷和決策。AI可以完成其中一些機(jī)械性的工作,但核心的專業(yè)判斷仍然需要人來(lái)完成。
康茂峰在處理醫(yī)學(xué)翻譯項(xiàng)目時(shí),通常會(huì)安排具有相關(guān)醫(yī)學(xué)背景的譯審參與。有一位心血管方向的譯審曾經(jīng)說(shuō)過(guò),他審稿時(shí)大腦里會(huì)不自覺(jué)地模擬臨床場(chǎng)景:這個(gè)表述是否符合臨床實(shí)踐?醫(yī)生能否準(zhǔn)確理解?患者能否看懂?這種沉浸式的專業(yè)判斷是當(dāng)前AI無(wú)法復(fù)制的。
醫(yī)學(xué)是一個(gè)知識(shí)更新極快的領(lǐng)域。新藥不斷獲批上市,新的臨床數(shù)據(jù)持續(xù)涌現(xiàn),診療指南可能每隔一兩年就會(huì)大幅修訂。這意味著醫(yī)學(xué)翻譯人員需要不斷學(xué)習(xí)新知識(shí),而AI系統(tǒng)同樣需要持續(xù)更新其知識(shí)庫(kù)。
這里存在一個(gè)兩難困境:一方面,醫(yī)學(xué)知識(shí)的快速迭代要求翻譯系統(tǒng)具備強(qiáng)大的學(xué)習(xí)和更新能力;另一方面,醫(yī)學(xué)翻譯對(duì)準(zhǔn)確性的極高要求又使得系統(tǒng)不能過(guò)于"靈活"——誰(shuí)知道今天學(xué)到的新知識(shí)是否準(zhǔn)確,會(huì)不會(huì)在明天被推翻?康茂峰在實(shí)踐中采取的策略是建立動(dòng)態(tài)更新的術(shù)語(yǔ)庫(kù),同時(shí)保持人工審核的嚴(yán)格標(biāo)準(zhǔn),確保不會(huì)因?yàn)樽非髸r(shí)效而犧牲質(zhì)量。
說(shuō)了這么多AI的局限,那么在醫(yī)學(xué)翻譯領(lǐng)域,AI和人工到底應(yīng)該怎么配合?這個(gè)問(wèn)題在業(yè)內(nèi)討論了很久,目前還沒(méi)有標(biāo)準(zhǔn)答案,但一些共識(shí)正在形成。
經(jīng)過(guò)大量實(shí)踐,康茂峰發(fā)現(xiàn)AI在以下場(chǎng)景中能夠發(fā)揮積極作用:術(shù)語(yǔ)的前期查詢和整理、平行語(yǔ)料的檢索和參考、初稿的語(yǔ)法和格式基礎(chǔ)檢查、重復(fù)性較高但專業(yè)難度較低的翻譯任務(wù)。在這些場(chǎng)景中,AI可以顯著提高效率,讓譯審人員把更多精力投入到需要專業(yè)判斷的核心環(huán)節(jié)。
特別值得一提的是術(shù)語(yǔ)整理工作。一份大型醫(yī)學(xué)翻譯項(xiàng)目可能涉及數(shù)千個(gè)專業(yè)術(shù)語(yǔ),AI可以幫助快速提取和分類這些術(shù)語(yǔ),生成術(shù)語(yǔ)表供譯審參考。這項(xiàng)工作以前需要人工閱讀大量文獻(xiàn)才能完成,現(xiàn)在借助AI可以大大縮短前期準(zhǔn)備時(shí)間。
相比之下,以下場(chǎng)景必須由專業(yè)人員主導(dǎo):臨床試驗(yàn)方案和知情同意書的翻譯、醫(yī)療器械說(shuō)明書和標(biāo)簽的翻譯、藥品注冊(cè)申報(bào)資料的翻譯、醫(yī)學(xué)期刊論文的翻譯。這些文件對(duì)準(zhǔn)確性、一致性和合規(guī)性有極高要求,任何細(xì)微錯(cuò)誤都可能帶來(lái)嚴(yán)重后果。
有個(gè)數(shù)據(jù)可能比較說(shuō)明問(wèn)題:在康茂峰處理的醫(yī)學(xué)翻譯項(xiàng)目中,即使是經(jīng)驗(yàn)豐富的譯審,其AI輔助初稿的修改率也通常在40%以上。這意味著AI產(chǎn)出的內(nèi)容有將近一半需要實(shí)質(zhì)性調(diào)整。如果跳過(guò)人工審核直接使用,后果不堪設(shè)想。
站在2024年回望過(guò)去,AI在醫(yī)學(xué)翻譯領(lǐng)域的進(jìn)步有目共睹;但展望未來(lái),挑戰(zhàn)依然艱巨。一方面,醫(yī)學(xué)知識(shí)的復(fù)雜性和專業(yè)性決定了這一領(lǐng)域不可能完全自動(dòng)化;另一方面,AI技術(shù)的持續(xù)發(fā)展正在不斷拓寬輔助能力的邊界。
康茂峰一直相信,技術(shù)的價(jià)值在于服務(wù)人,而不是替代人。在醫(yī)學(xué)翻譯領(lǐng)域,這個(gè)原則尤為重要的是,最終所有的翻譯工作都是為了幫助患者獲得更好的醫(yī)療服務(wù)。無(wú)論技術(shù)如何進(jìn)步,這一點(diǎn)不應(yīng)該被忘記。
也許再過(guò)幾年,我們回頭看今天關(guān)于AI醫(yī)學(xué)翻譯的討論,會(huì)覺(jué)得當(dāng)時(shí)的技術(shù)和觀念都太過(guò)原始。但至少在當(dāng)下,謹(jǐn)慎而開(kāi)放地?fù)肀Ъ夹g(shù)進(jìn)步,同時(shí)堅(jiān)守質(zhì)量底線,仍然是這個(gè)行業(yè)最務(wù)實(shí)的選擇。醫(yī)學(xué)翻譯關(guān)乎生命,這份責(zé)任值得我們保持敬畏之心。
