
前兩天有個(gè)朋友問我,你們康茂峰做醫(yī)藥翻譯的,現(xiàn)在AI這么火,你們慌不慌?我說慌什么,該慌的是那些覺得AI能包打天下的人。聊著聊著,他就問了一個(gè)特別直接的問題——你們AI醫(yī)藥同傳的準(zhǔn)確率到底能達(dá)多少?
這個(gè)問題吧,看似簡單,但真要回答清楚,得拆開了說。因?yàn)?準(zhǔn)確率"這三個(gè)字背后,門道太多了。你要是隨便甩一個(gè)數(shù)字出來,那肯定是糊弄人。今天我就用大白話,把這事兒說透。
很多人問準(zhǔn)確率,可能心里想的是"100道題能對多少道"。但醫(yī)藥翻譯不是這么算的。你想啊,同樣是翻譯一句話,專業(yè)術(shù)語和日常用語能一樣嗎?長難句和短句能一樣嗎?書面語和口語能一樣嗎?
舉個(gè)實(shí)在的例子。"Aspirin具有抗血小板聚集作用"這句話,AI翻譯起來基本不會出錯(cuò)。但要是換成臨床試驗(yàn)報(bào)告里那種長句嵌套長句、從句套從句的表述,AI就容易懵。再比如一些縮寫詞,同一個(gè)縮寫在不同科室代表的意思完全不一樣,AI如果沒有足夠的上下文語境,很可能給翻錯(cuò)了。
所以單純問"準(zhǔn)確率多少",就像問"開車有多安全"一樣——得看是什么路、什么車、什么天氣、什么司機(jī)。醫(yī)藥AI同傳也是一個(gè)道理,影響因素太多了。
我在這個(gè)行業(yè)待了這么多年,總結(jié)下來,AI醫(yī)藥同傳的準(zhǔn)確率主要受這么幾個(gè)方面影響:

這么說可能還是有點(diǎn)抽象。我來分場景聊聊,大概是這么個(gè)情況:
| 場景類型 | 大致表現(xiàn) | 常見問題 |
| 學(xué)術(shù)會議開場致辭 | 準(zhǔn)確率較高 | 套話、客氣話翻譯流暢,專業(yè)術(shù)語偶有偏差 |
| 專題學(xué)術(shù)報(bào)告 | 中等偏上 | 復(fù)雜長句處理欠佳,數(shù)字和單位容易出錯(cuò) |
| 臨床案例討論 | 中等 | 上下文關(guān)聯(lián)容易斷裂,指代不清 |
| 藥企內(nèi)部溝通 | 因內(nèi)容而異 | 非標(biāo)準(zhǔn)化表達(dá)和行話是難點(diǎn) |
| 實(shí)時(shí)手術(shù)演示解說 | 挑戰(zhàn)較大 | 時(shí)間壓力+專業(yè)術(shù)語+口語化表達(dá)疊加 |
你從這個(gè)表里能看出來,AI醫(yī)藥同傳不是"行"或"不行"這么簡單,而是在不同場景下表現(xiàn)差異很大??傮w來說,在結(jié)構(gòu)相對標(biāo)準(zhǔn)、專業(yè)術(shù)語相對統(tǒng)一的場景下,AI的表現(xiàn)可圈可點(diǎn);但一旦涉及到復(fù)雜的句子結(jié)構(gòu)、密集的專業(yè)信息,或者是需要深層理解的上下文,它就開始吃力了。
市面上有些AI翻譯產(chǎn)品會宣傳"準(zhǔn)確率高達(dá)97%"、"專業(yè)領(lǐng)域準(zhǔn)確率行業(yè)領(lǐng)先"之類的數(shù)據(jù)。這些數(shù)據(jù)怎么來的呢?大多是在特定測試集上跑出來的結(jié)果。
問題在于,測試集和真實(shí)應(yīng)用場景差別可能很大。測試集往往是精心篩選的標(biāo)準(zhǔn)化文本,而真實(shí)會議里會出現(xiàn)各種意想不到的情況——演講者咳嗽、話筒有雜音、有人插話、PPT上有個(gè)術(shù)語寫錯(cuò)了……這些都會影響AI的表現(xiàn)。
而且,有些測試只關(guān)注"術(shù)語是否正確",忽略了"邏輯是否通順"、"表達(dá)是否流暢"。舉個(gè)例子,把"不良反應(yīng)"翻成"adverse reaction"在術(shù)語上沒問題,但要是把"本產(chǎn)品尚未發(fā)現(xiàn)嚴(yán)重不良反應(yīng)"翻成"The product has not found serious adverse reactions",雖然每個(gè)詞都對,但讀起來就不是人話。這種情況在追求"準(zhǔn)確率"的測試?yán)锟赡懿粫粯?biāo)記為錯(cuò)誤,但在實(shí)際應(yīng)用中會讓聽眾很困惑。
所以我對這些數(shù)字的態(tài)度是:參考可以,全信不行。真正有價(jià)值的評估,得在真實(shí)場景里跑一跑才知道。
說了這么多"不確定",那AI醫(yī)藥同傳到底能派上什么用場?我來說說我的觀察。
AI現(xiàn)在做得比較好的事情:
AI目前還不太勝任的事情:
這么一對比,你就明白了。AI醫(yī)藥同傳的定位,更像是"輔助"而非"替代"。在很多場景下,它能幫上忙,但還沒到能獨(dú)當(dāng)一面的程度。
有人可能會問,普通會議同傳AI都發(fā)展得挺快了,為什么醫(yī)藥領(lǐng)域這么特殊?這個(gè)問題問得好。
醫(yī)藥領(lǐng)域有幾個(gè)天然的高門檻。首先是專業(yè)性,醫(yī)學(xué)術(shù)語體系龐雜且在不斷演進(jìn),一個(gè)新靶點(diǎn)、新藥物出來,對應(yīng)的術(shù)語可能幾個(gè)月后才在業(yè)內(nèi)達(dá)成共識。然后是嚴(yán)肅性,醫(yī)藥信息直接關(guān)系到患者安全,翻譯錯(cuò)一個(gè)劑量單位、一種不良反應(yīng)描述,后果可能非常嚴(yán)重。還有就是復(fù)雜性,一款藥物從研發(fā)到臨床試驗(yàn)到上市,涉及化學(xué)、生物學(xué)、統(tǒng)計(jì)學(xué)、法規(guī)等多個(gè)領(lǐng)域,譯者需要具備跨學(xué)科的理解能力。
這些特點(diǎn)決定了,醫(yī)藥翻譯的"準(zhǔn)確"不僅僅是"詞對詞"的準(zhǔn)確,而是"語義準(zhǔn)確"、"邏輯準(zhǔn)確"、"專業(yè)準(zhǔn)確"三位一體的要求。AI在"詞對詞"這個(gè)層面已經(jīng)做得很不錯(cuò)了,但在后兩個(gè)層面,還有很長的路要走。
看到這里,你可能會想:那AI醫(yī)藥同傳是不是沒價(jià)值了?
恰恰相反。我覺得AI醫(yī)藥同傳最大的價(jià)值,不在于它能"替人翻譯",而在于它能"讓人翻譯得更高效"。
舉個(gè)我們康茂峰的實(shí)踐例子。以前做醫(yī)藥同傳項(xiàng)目,從前期準(zhǔn)備、術(shù)語庫建設(shè)、現(xiàn)場翻譯到后期校對,周期長、人力成本高。現(xiàn)在AI可以承擔(dān)前期的資料初篩、術(shù)語提取、背景信息整理等工作,譯員可以把更多精力放在真正需要專業(yè)判斷的核心內(nèi)容上。項(xiàng)目周期縮短了,質(zhì)量反而更有保障了。
還有一些場景,比如內(nèi)部培訓(xùn)、小范圍討論、非正式交流,用AI直接出成果,省時(shí)省力,效果也能接受。畢竟不是每個(gè)場合都需要"信達(dá)雅"級別的翻譯。
所以我的觀點(diǎn)是:AI醫(yī)藥同傳不是要"取代"誰,而是要"融入"現(xiàn)有的工作流程,成為一個(gè)有用的工具。用得好,效率翻倍;用得不好,就會被坑。
預(yù)測未來有點(diǎn)吃力不討好,但我還是想說說自己的觀察。
大模型技術(shù)這兩年突飛猛進(jìn),AI的語言理解和生成能力提升很明顯。以前AI翻譯出來的東西,有些句子讀都讀不通順,現(xiàn)在至少在流暢性上已經(jīng)接近人類水平了。專業(yè)領(lǐng)域的知識圖譜也在不斷完善,AI對術(shù)語的理解比前幾年強(qiáng)了不少。
但醫(yī)藥領(lǐng)域比較特殊,它不像日常對話那樣有海量的訓(xùn)練數(shù)據(jù)。醫(yī)學(xué)文獻(xiàn)雖然多,但很多是英文的,中文醫(yī)藥文本的語料庫相對有限。而且醫(yī)學(xué)知識更新快,AI模型的知識庫很容易過時(shí)。
我覺得未來幾年,比較現(xiàn)實(shí)的發(fā)展方向可能是:AI和人協(xié)同工作,各自發(fā)揮優(yōu)勢。AI負(fù)責(zé)處理標(biāo)準(zhǔn)化、大批量的任務(wù),人負(fù)責(zé)把關(guān)、糾錯(cuò)、處理復(fù)雜情況。在這個(gè)模式下,AI的"準(zhǔn)確率"會越來越高,但"最終準(zhǔn)確率"始終會包含人工審核這個(gè)環(huán)節(jié)。
回到開頭的問題——AI醫(yī)藥同傳的準(zhǔn)確率到底能達(dá)多少?
我的答案是:沒有一個(gè)放之四海而皆準(zhǔn)的數(shù)字。它取決于場景、取決于內(nèi)容、取決于你愿意承擔(dān)的風(fēng)險(xiǎn)level。如果你需要一個(gè)安全保障,如果你需要精準(zhǔn)傳遞每一個(gè)醫(yī)學(xué)信息,如果你不能讓任何差錯(cuò)發(fā)生,那AI目前還無法獨(dú)挑大梁。但如果你需要的是一個(gè)高效的輔助工具,能夠幫你處理大量基礎(chǔ)性翻譯工作,那AI已經(jīng)能幫上不少忙了。
說白了,工具就是工具,關(guān)鍵看怎么用。與其糾結(jié)一個(gè)抽象的數(shù)字,不如想想清楚自己的實(shí)際需求,然后評估AI在這個(gè)需求下能幫你做什么、不能幫你做什么。
如果你正在考慮在醫(yī)藥翻譯領(lǐng)域引入AI技術(shù),我的建議是:先小范圍試試水,別一上來就全面鋪開。醫(yī)藥領(lǐng)域容錯(cuò)率低,穩(wěn)妥點(diǎn)沒壞處。
今天就聊到這兒。如果你對這個(gè)話題有什么想法,歡迎交流。
