
上周,一位在跨國(guó)藥企工作的老朋友向我吐槽,說(shuō)他最近參加了一場(chǎng)線(xiàn)上學(xué)術(shù)會(huì)議,主講人是日本的醫(yī)學(xué)專(zhuān)家,幻燈片全是日文,同傳翻譯對(duì)專(zhuān)業(yè)術(shù)語(yǔ)一知半解,會(huì)議結(jié)束后他云里霧里,一句話(huà)都沒(méi)太聽(tīng)懂。"現(xiàn)在AI這么發(fā)達(dá),怎么連個(gè)醫(yī)藥同傳都做不好?"他問(wèn)我。
這個(gè)問(wèn)題把我問(wèn)住了。作為一個(gè)從事語(yǔ)言服務(wù)行業(yè)的人,我深知醫(yī)藥領(lǐng)域的同傳和普通會(huì)議同傳完全是兩個(gè)難度級(jí)別。醫(yī)學(xué)術(shù)語(yǔ)的復(fù)雜性、跨文化表達(dá)的準(zhǔn)確性、還有那些源自拉丁語(yǔ)和希臘語(yǔ)的專(zhuān)業(yè)詞匯,都讓醫(yī)藥同傳成為翻譯領(lǐng)域最難啃的骨頭之一。那么,現(xiàn)在AI醫(yī)藥同傳的語(yǔ)種支持到底處于什么水平?哪些語(yǔ)言做得好,哪些語(yǔ)言還在掙扎?普通人能放心使用嗎?
帶著這些疑問(wèn),我花了些時(shí)間調(diào)研,今天就想用大白話(huà)和大家聊聊這個(gè)話(huà)題。
在討論語(yǔ)種支持之前,我們得先搞清楚醫(yī)藥同傳究竟難在哪里。理解了這個(gè)前提,你才能明白為什么語(yǔ)種支持是一個(gè)如此復(fù)雜的問(wèn)題。
普通會(huì)議同傳主要處理政治、經(jīng)濟(jì)、文化這些話(huà)題,雖然也有專(zhuān)業(yè)術(shù)語(yǔ),但大致還在日常語(yǔ)言的框架內(nèi)。醫(yī)藥同傳不一樣,它面對(duì)的是一套完全獨(dú)立的語(yǔ)言體系。一個(gè)簡(jiǎn)單的例子,"高血壓"這個(gè)詞,中文四個(gè)字,英語(yǔ)是"hypertension",日語(yǔ)是"高血壓(高血壓)",韓語(yǔ)是"???"。表面看起來(lái)只是翻譯不同,但背后涉及的是完全不同的醫(yī)學(xué)術(shù)語(yǔ)命名體系。
更麻煩的是,醫(yī)學(xué)領(lǐng)域有大量源自拉丁語(yǔ)和希臘語(yǔ)的詞匯,這些詞匯在各語(yǔ)言中的借用程度和方式各不相同。比如"心肌梗死"這個(gè)詞,英語(yǔ)是"myocardial infarction",德語(yǔ)是"Myokardinfarkt",法語(yǔ)是"infarctus du myocarde",西班牙語(yǔ)是"infarto de miocardio"。如果你不懂這些語(yǔ)言的詞根構(gòu)成,根本無(wú)法在它們之間建立有效的對(duì)應(yīng)關(guān)系。
另外,醫(yī)藥行業(yè)的監(jiān)管要求極其嚴(yán)格。藥品說(shuō)明書(shū)、臨床試驗(yàn)報(bào)告、醫(yī)療器械說(shuō)明書(shū)這些文本的翻譯,準(zhǔn)確性直接關(guān)系到患者安全。翻錯(cuò)一個(gè)劑量單位,可能會(huì)鬧出人命。這種容錯(cuò)率極低的應(yīng)用場(chǎng)景,對(duì)AI同傳系統(tǒng)的專(zhuān)業(yè)性和準(zhǔn)確性提出了極高的要求。

說(shuō)到語(yǔ)種支持,我必須先潑一盆冷水:目前并不存在一種能夠完美支持所有語(yǔ)言的"全能型"AI醫(yī)藥同傳系統(tǒng)。不同語(yǔ)言的支持程度差異巨大,這種差異主要取決于三個(gè)因素:該語(yǔ)言的醫(yī)藥學(xué)術(shù)資源豐富程度、使用該語(yǔ)言的國(guó)家在醫(yī)學(xué)研究領(lǐng)域的活躍度、以及該語(yǔ)言與英語(yǔ)之間的語(yǔ)言學(xué)距離。
英語(yǔ)是醫(yī)學(xué)領(lǐng)域的絕對(duì)通用語(yǔ)言,全球大部分醫(yī)學(xué)文獻(xiàn)都是以英語(yǔ)發(fā)表,相關(guān)語(yǔ)料庫(kù)也最為豐富。因此,英語(yǔ)與主要?dú)W洲語(yǔ)言之間的AI醫(yī)藥同傳支持相對(duì)成熟。
德語(yǔ)是醫(yī)學(xué)領(lǐng)域除英語(yǔ)之外最重要的語(yǔ)言之一,德國(guó)在醫(yī)學(xué)研究領(lǐng)域?qū)嵙?qiáng)勁,AI系統(tǒng)對(duì)德語(yǔ)的支持主要體現(xiàn)在醫(yī)學(xué)文獻(xiàn)翻譯和學(xué)術(shù)會(huì)議同傳方面。德語(yǔ)的名詞復(fù)合詞特性(如"Herz-Kreislauf-Erkrankungen"心血管疾病)在處理上需要特殊策略,目前主流系統(tǒng)在這方面已經(jīng)積累了不少經(jīng)驗(yàn)。
法語(yǔ)和意大利語(yǔ)在醫(yī)學(xué)同傳領(lǐng)域的支持也相對(duì)完善。這兩種語(yǔ)言與英語(yǔ)的語(yǔ)言學(xué)距離適中,且法國(guó)和意大利都有發(fā)達(dá)的醫(yī)學(xué)教育體系,提供了充足的訓(xùn)練語(yǔ)料。需要注意的是,法語(yǔ)醫(yī)學(xué)文獻(xiàn)中有時(shí)會(huì)使用一些特殊的拉丁表達(dá)方式,AI系統(tǒng)需要專(zhuān)門(mén)處理這些"歷史遺留"問(wèn)題。
西班牙語(yǔ)的情況比較有意思。西班牙語(yǔ)是聯(lián)合國(guó)六種官方語(yǔ)言之一,使用人口眾多,在拉丁美洲也有廣泛分布。醫(yī)藥AI對(duì)西班牙語(yǔ)的支持主要分為歐式西語(yǔ)和拉美西語(yǔ)兩個(gè)方向,兩者在藥品名稱(chēng)和醫(yī)學(xué)術(shù)語(yǔ)的本地化表達(dá)上存在差異。總體而言,歐式西語(yǔ)的支持更成熟,拉美西語(yǔ)的支持還在不斷完善中。
日語(yǔ)和韓語(yǔ)的AI醫(yī)藥同傳支持處于中等水平。這兩種語(yǔ)言與英語(yǔ)的語(yǔ)言學(xué)距離較遠(yuǎn),在詞匯、語(yǔ)法、表達(dá)習(xí)慣上都存在顯著差異。日語(yǔ)的敬語(yǔ)系統(tǒng)、韓語(yǔ)的敬語(yǔ)階稱(chēng)在醫(yī)學(xué)場(chǎng)景中的使用也增加了翻譯的復(fù)雜性。

日語(yǔ)方面,由于日本醫(yī)學(xué)研究發(fā)達(dá),醫(yī)藥語(yǔ)料相對(duì)豐富,AI系統(tǒng)對(duì)常見(jiàn)醫(yī)學(xué)術(shù)語(yǔ)的處理已經(jīng)比較到位。但在一些專(zhuān)科領(lǐng)域,比如罕見(jiàn)病名稱(chēng)或新型治療技術(shù),日語(yǔ)醫(yī)學(xué)表達(dá)的專(zhuān)業(yè)性和精確度仍有提升空間。日語(yǔ)還有一個(gè)特點(diǎn):大量使用漢字術(shù)語(yǔ),這些術(shù)語(yǔ)與中文有交叉但不等同,AI系統(tǒng)需要能夠區(qū)分"同形異義"的情況。
韓語(yǔ)的支持情況與日語(yǔ)類(lèi)似。韓國(guó)在某些醫(yī)學(xué)領(lǐng)域(比如美容醫(yī)學(xué)、公共衛(wèi)生)有突出貢獻(xiàn),相關(guān)韓語(yǔ)語(yǔ)料被大量收錄。但韓語(yǔ)的黏著語(yǔ)特性使得句子結(jié)構(gòu)靈活多變,對(duì)AI系統(tǒng)的語(yǔ)法分析能力提出了較高要求。
中文的AI醫(yī)藥同傳支持需要單獨(dú)拿出來(lái)說(shuō)。中國(guó)醫(yī)藥市場(chǎng)規(guī)模龐大,本土醫(yī)學(xué)研究發(fā)展迅速,但中醫(yī)藥術(shù)語(yǔ)的翻譯仍然是世界性難題。中醫(yī)藥理論體系中的"氣"、"陰陽(yáng)"、"經(jīng)絡(luò)"等概念,在西醫(yī)主導(dǎo)的AI系統(tǒng)中很難找到對(duì)應(yīng)的表達(dá)方式。值得欣慰的是,專(zhuān)注于中醫(yī)藥翻譯的AI工具正在逐步涌現(xiàn),雖然還不成熟,但至少邁出了第一步。
這一梯隊(duì)的語(yǔ)言支持情況就不太樂(lè)觀(guān)了。北歐語(yǔ)言(瑞典語(yǔ)、丹麥語(yǔ)、挪威語(yǔ)、芬蘭語(yǔ))、東歐語(yǔ)言(波蘭語(yǔ)、捷克語(yǔ)、匈牙利語(yǔ)等)、中東語(yǔ)言(阿拉伯語(yǔ)、波斯語(yǔ))、南亞語(yǔ)言(印地語(yǔ)、烏爾都語(yǔ)、孟加拉語(yǔ))以及非洲語(yǔ)言,在醫(yī)藥AI同傳領(lǐng)域的支持都非常有限。
以阿拉伯語(yǔ)為例,雖然阿拉伯世界有眾多醫(yī)學(xué)院校和醫(yī)療機(jī)構(gòu),但醫(yī)學(xué)領(lǐng)域的阿拉伯語(yǔ)語(yǔ)料數(shù)字化程度不高,AI系統(tǒng)缺乏足夠的訓(xùn)練材料。更復(fù)雜的是,阿語(yǔ)從右到左的書(shū)寫(xiě)系統(tǒng)、與伊斯蘭醫(yī)學(xué)傳統(tǒng)相關(guān)的特殊術(shù)語(yǔ),都增加了技術(shù)實(shí)現(xiàn)的難度。
東南亞語(yǔ)言的情況則更加參差不齊。泰語(yǔ)在某些領(lǐng)域有一定支持,因?yàn)樘﹪?guó)醫(yī)療旅游發(fā)達(dá),相關(guān)語(yǔ)料積累相對(duì)較多。越南語(yǔ)、印尼語(yǔ)、馬來(lái)語(yǔ)的支持就很有限了,主要集中在旅游醫(yī)療等日常場(chǎng)景,深入到專(zhuān)科醫(yī)療的同傳服務(wù)仍然捉襟見(jiàn)肘。
聊到這里,我想強(qiáng)調(diào)一個(gè)關(guān)鍵點(diǎn):語(yǔ)種支持不能脫離具體應(yīng)用場(chǎng)景來(lái)討論。同樣是醫(yī)藥同傳,場(chǎng)景不同,語(yǔ)種需求和支持難度也大相徑庭。
國(guó)際學(xué)術(shù)會(huì)議是要求最高的場(chǎng)景。以世界心臟病學(xué)大會(huì)、腫瘤免疫學(xué)峰會(huì)這類(lèi)頂級(jí)學(xué)術(shù)會(huì)議為例,參會(huì)者來(lái)自全球各國(guó),會(huì)議通常提供英語(yǔ)、法語(yǔ)、西班牙語(yǔ)、中文、日語(yǔ)等主要語(yǔ)言的同傳服務(wù)。AI同傳在這種場(chǎng)景中的應(yīng)用主要局限于輔助角色,幫助沒(méi)有佩戴耳機(jī)的與會(huì)者理解主要內(nèi)容,或者用于會(huì)后的字幕生成和文字紀(jì)要整理。在這些主流語(yǔ)言上,AI的表現(xiàn)已經(jīng)相當(dāng)可用,但在小語(yǔ)種方面仍然需要依賴(lài)傳統(tǒng)人工同傳。
藥品注冊(cè)申報(bào)文件的翻譯則是另一個(gè)完全不同的場(chǎng)景。這類(lèi)文件的特點(diǎn)是專(zhuān)業(yè)性極強(qiáng)、容錯(cuò)率極低、格式高度標(biāo)準(zhǔn)化。目前,AI在這類(lèi)場(chǎng)景中的應(yīng)用主要體現(xiàn)在初譯和術(shù)語(yǔ)標(biāo)準(zhǔn)化上,最終仍需要專(zhuān)業(yè)醫(yī)藥譯審進(jìn)行校對(duì)和確認(rèn)。從語(yǔ)種角度看,英語(yǔ)與主要市場(chǎng)語(yǔ)言(歐盟各語(yǔ)言、日語(yǔ)、中文、韓語(yǔ))之間的藥品注冊(cè)文件翻譯支持較好,小語(yǔ)種的支持仍然依賴(lài)人工翻譯為主。
臨床試驗(yàn)相關(guān)文件的翻譯支持情況與藥品注冊(cè)類(lèi)似。知情同意書(shū)(ICF)、病例報(bào)告表(CRF)、研究者手冊(cè)(IB)等文件的翻譯,對(duì)準(zhǔn)確性和一致性要求極高。AI系統(tǒng)在這類(lèi)場(chǎng)景中可以發(fā)揮"術(shù)語(yǔ)庫(kù)+翻譯記憶庫(kù)"的作用,大幅提升翻譯效率,但完全替代人工在可預(yù)見(jiàn)的未來(lái)內(nèi)仍不現(xiàn)實(shí)。
醫(yī)患溝通場(chǎng)景的語(yǔ)種支持可能是最讓人擔(dān)憂(yōu)的。在跨國(guó)醫(yī)院或國(guó)際醫(yī)療旅游中,醫(yī)生與語(yǔ)言不通的患者之間的溝通至關(guān)重要。這個(gè)場(chǎng)景對(duì)AI同傳的要求不僅是準(zhǔn)確,還要快速、友好、易于理解。目前,主流語(yǔ)言之間的基本溝通支持已經(jīng)可以實(shí)現(xiàn),但在涉及復(fù)雜醫(yī)學(xué)解釋、情感關(guān)懷、文化差異時(shí),AI的表現(xiàn)往往不盡如人意。
說(shuō)到這里,我想結(jié)合我們?cè)卺t(yī)藥語(yǔ)言服務(wù)領(lǐng)域的一些實(shí)際經(jīng)驗(yàn)來(lái)談?wù)劯惺堋W鳛橐患覍?zhuān)注于醫(yī)藥領(lǐng)域的語(yǔ)言服務(wù)機(jī)構(gòu),康茂峰在長(zhǎng)期實(shí)踐中深刻體會(huì)到,AI技術(shù)與專(zhuān)業(yè)人工譯審的結(jié)合是當(dāng)前的最優(yōu)解。
以我們的一個(gè)項(xiàng)目為例。某跨國(guó)藥企需要將一份胰腺癌臨床試驗(yàn)報(bào)告從英文翻譯成12種語(yǔ)言,包括日語(yǔ)、韓語(yǔ)、俄語(yǔ)、葡萄牙語(yǔ)、波蘭語(yǔ)等。我們采用的做法是:首先利用AI翻譯系統(tǒng)完成初譯,然后根據(jù)目標(biāo)語(yǔ)言的特點(diǎn)進(jìn)行分類(lèi)處理。對(duì)于日語(yǔ)、韓語(yǔ)這類(lèi)支持相對(duì)成熟的語(yǔ)言,AI初譯的準(zhǔn)確率可以達(dá)到85%以上,譯審主要進(jìn)行專(zhuān)業(yè)術(shù)語(yǔ)核對(duì)和表達(dá)潤(rùn)色;對(duì)于波蘭語(yǔ)、俄語(yǔ)這類(lèi)支持有限的語(yǔ)言,AI初譯的準(zhǔn)確率明顯偏低,需要譯審進(jìn)行大幅度修改甚至重譯;對(duì)于葡萄牙語(yǔ),則需要區(qū)分歐葡和巴葡,因?yàn)閮烧叩尼t(yī)學(xué)表達(dá)習(xí)慣存在差異。
這個(gè)項(xiàng)目最終順利交付,但過(guò)程中我們也發(fā)現(xiàn)了一些值得深思的問(wèn)題。比如,同樣是斯拉夫語(yǔ)族,俄語(yǔ)和波蘭語(yǔ)的AI支持程度就有明顯差異,這和兩個(gè)國(guó)家醫(yī)藥數(shù)字化程度、醫(yī)學(xué)文獻(xiàn)的英譯數(shù)量都有關(guān)系。再比如,阿拉伯語(yǔ)醫(yī)學(xué)文獻(xiàn)的翻譯項(xiàng)目中,我們發(fā)現(xiàn)AI對(duì)海灣地區(qū)方言和標(biāo)準(zhǔn)阿拉伯語(yǔ)的處理策略需要分開(kāi)對(duì)待,同一個(gè)術(shù)語(yǔ)在埃及、沙特、約旦可能有不同的本地化表達(dá)。
這些經(jīng)驗(yàn)讓我們更加確信:AI醫(yī)藥同傳的語(yǔ)種支持不是一個(gè)簡(jiǎn)單的"支持"或"不支持"的問(wèn)題,而是一個(gè)漸進(jìn)的、場(chǎng)景依賴(lài)的、需要持續(xù)優(yōu)化的過(guò)程。每種語(yǔ)言的支持程度都受到多重因素影響,而且這些因素還在不斷變化。
基于以上分析,我想給需要醫(yī)藥翻譯服務(wù)的讀者一些實(shí)用建議。
首先,明確你的場(chǎng)景和需求。如果只是需要了解文獻(xiàn)大致內(nèi)容,AI初譯加快速校對(duì)即可滿(mǎn)足;如果用于正式提交或發(fā)表,必須人工校對(duì)確認(rèn);如果涉及患者溝通,建議使用人工同傳或至少有人工監(jiān)督的AI系統(tǒng)。
其次,了解目標(biāo)語(yǔ)言的支持情況。在啟動(dòng)翻譯項(xiàng)目前,可以先做一個(gè)小測(cè)試:找一段醫(yī)學(xué)文本(100-200字),用AI系統(tǒng)翻譯成目標(biāo)語(yǔ)言,然后請(qǐng)專(zhuān)業(yè)人士評(píng)估準(zhǔn)確率。如果準(zhǔn)確率在90%以上,可以考慮大量使用AI輔助;如果低于70%,建議以人工翻譯為主。
第三,重視術(shù)語(yǔ)管理。無(wú)論使用哪種語(yǔ)言,醫(yī)學(xué)術(shù)語(yǔ)的一致性都至關(guān)重要。建議在項(xiàng)目開(kāi)始前建立雙語(yǔ)術(shù)語(yǔ)表,并在翻譯過(guò)程中持續(xù)更新完善。這不僅能提升AI翻譯的質(zhì)量,也為人工校對(duì)提供重要參考。
第四,關(guān)注語(yǔ)言變體。很多語(yǔ)言都存在地區(qū)差異,如西班牙語(yǔ)有歐式和拉美之分,葡萄牙語(yǔ)有歐葡和巴葡之分,阿拉伯語(yǔ)有不同方言區(qū)。明確你的目標(biāo)受眾是哪個(gè)地區(qū),選擇對(duì)應(yīng)的語(yǔ)言變體非常重要。
站在現(xiàn)在這個(gè)時(shí)間點(diǎn)往前看,AI醫(yī)藥同傳的語(yǔ)種支持有幾個(gè)值得關(guān)注的發(fā)展趨勢(shì)。
多模態(tài)技術(shù)的進(jìn)步將顯著提升同傳體驗(yàn)。未來(lái)的AI同傳系統(tǒng)不僅能夠處理語(yǔ)音和文字,還將結(jié)合圖表、公式、影像等多種信息源,提供更加準(zhǔn)確的翻譯服務(wù)。這對(duì)于醫(yī)藥領(lǐng)域尤為重要,因?yàn)榇罅酷t(yī)學(xué)信息是以可視化方式呈現(xiàn)的。
專(zhuān)業(yè)化細(xì)分將不斷深化。除了通用型醫(yī)藥翻譯AI,針對(duì)特定專(zhuān)科(如腫瘤學(xué)、神經(jīng)科學(xué)、心血管病學(xué))、特定場(chǎng)景(如藥品注冊(cè)、臨床試驗(yàn)、患者教育)的專(zhuān)業(yè)化AI工具將越來(lái)越多。這些專(zhuān)業(yè)化工具在其專(zhuān)注領(lǐng)域的表現(xiàn)將顯著優(yōu)于通用型工具。
低資源語(yǔ)言的支持有望改善。隨著Transformer架構(gòu)的成熟和遷移學(xué)習(xí)技術(shù)的進(jìn)步,用較少語(yǔ)料訓(xùn)練高質(zhì)量翻譯模型正在成為可能。這對(duì)于小語(yǔ)種醫(yī)藥翻譯來(lái)說(shuō)是一個(gè)積極信號(hào)。雖然短期內(nèi)難以達(dá)到主流語(yǔ)言的支持水平,但至少可以看到改善的希望。
人機(jī)協(xié)作模式將持續(xù)優(yōu)化。完全依賴(lài)AI或完全依賴(lài)人工都不是最優(yōu)解,最佳實(shí)踐是根據(jù)具體需求靈活組合兩種方式。未來(lái)的翻譯工作流程將更加智能化,系統(tǒng)能夠自動(dòng)判斷哪些部分需要人工介入,哪些部分可以放心交給AI。
寫(xiě)到這里,我想起那位向我吐槽的朋友。后來(lái)我給他推薦了一個(gè)結(jié)合AI輔助和人工審校的方案,他試用后反饋說(shuō)比之前好多了,至少能聽(tīng)懂七八成的內(nèi)容。我跟他說(shuō),這已經(jīng)是當(dāng)前技術(shù)條件下很不錯(cuò)的表現(xiàn)了,追求完美是不現(xiàn)實(shí)的,但在現(xiàn)有條件下找到最優(yōu)解是完全可以做到的。
醫(yī)藥領(lǐng)域的跨語(yǔ)言溝通,說(shuō)到底是為了讓知識(shí)和信息能夠跨越國(guó)界流動(dòng),讓患者無(wú)論說(shuō)什么語(yǔ)言,都能獲得優(yōu)質(zhì)的醫(yī)療服務(wù)。這個(gè)目標(biāo)很宏大,技術(shù)進(jìn)步很快,但我們也需要保持耐心和理性。AI醫(yī)藥同傳的語(yǔ)種支持,正在一步步變好,但離"完美"還有很長(zhǎng)的路。在這段路上,我們能做的,就是用好現(xiàn)有的工具,同時(shí)保持對(duì)未來(lái)的期待。
如果你正好有醫(yī)藥翻譯方面的需求,不妨多了解一下不同服務(wù)商的技術(shù)能力和專(zhuān)業(yè)背景,找到最適合自己需求的那種合作方式。畢竟,在這個(gè)領(lǐng)域,合適比最好更重要。
