
前幾天有個(gè)朋友問(wèn)我,他們公司準(zhǔn)備把軟件推到海外市場(chǎng),翻譯工作已經(jīng)安排上了,但技術(shù)人員突然提到什么數(shù)據(jù)庫(kù)也要翻譯。他一下子有點(diǎn)懵——軟件界面翻譯也就罷了,數(shù)據(jù)庫(kù)里存的東西也要翻?這東西又看不見(jiàn)摸不著,到底是咋回事?
說(shuō)實(shí)話,我剛接觸這行的時(shí)候也有同樣的困惑。后來(lái)做多了項(xiàng)目才發(fā)現(xiàn),數(shù)據(jù)庫(kù)翻譯根本不是"錦上添花",而是本地化鏈條上實(shí)打?qū)嵉囊画h(huán)。今天就想把這個(gè)事兒掰開(kāi)了揉碎了講講,盡量用大白話說(shuō)清楚,這里面的門道到底是怎么回事。
軟件本地化這個(gè)概念說(shuō)起來(lái)其實(shí)挺簡(jiǎn)單。你想啊,一款軟件在國(guó)內(nèi)開(kāi)發(fā)的時(shí)候,界面上的文字、提示信息、幫助文檔肯定都是中文的。但如果要把這款軟件賣給德國(guó)人、日本人或者阿拉伯人,總不能讓他們對(duì)著滿屏的中文干瞪眼吧?
所以本地化要做的,就是把軟件里所有用戶能看到的、讀到的東西都翻譯成目標(biāo)市場(chǎng)的語(yǔ)言,并且根據(jù)當(dāng)?shù)氐氖褂昧?xí)慣做相應(yīng)調(diào)整。這里面包括界面的文字、錯(cuò)誤提示、操作指南、還有軟件里那些預(yù)設(shè)的示例數(shù)據(jù)。
但問(wèn)題來(lái)了——軟件里的數(shù)據(jù)并不全都在明面上。有些數(shù)據(jù)存在數(shù)據(jù)庫(kù)里,用戶看不到卻在后臺(tái)運(yùn)行著,這部分要不要翻譯?答案比你想的要復(fù)雜得多。
我們先說(shuō)說(shuō)啥叫數(shù)據(jù)庫(kù)翻譯。簡(jiǎn)單理解,數(shù)據(jù)庫(kù)就是軟件用來(lái)存儲(chǔ)數(shù)據(jù)的大倉(cāng)庫(kù)。你注冊(cè)賬號(hào)時(shí)填的手機(jī)號(hào)、瀏覽商品時(shí)看到的名稱、下單時(shí)選擇的規(guī)格選項(xiàng),這些東西都老老實(shí)實(shí)躺在數(shù)據(jù)庫(kù)里。

數(shù)據(jù)庫(kù)翻譯要處理的,就是這個(gè)倉(cāng)庫(kù)里的文字內(nèi)容。聽(tīng)起來(lái)挺抽象,我給你舉幾個(gè)具體的例子你就明白了。
電商系統(tǒng)里的商品分類肯定存在數(shù)據(jù)庫(kù)里。如果你的軟件要進(jìn)軍法語(yǔ)區(qū)市場(chǎng),那些"手機(jī)通訊""電腦辦公""家用電器"之類的分類名稱就得變成"Téléphonie""Informatique""électroménager"。再比如醫(yī)院管理系統(tǒng)里,疾病名稱、藥品名稱、檢驗(yàn)項(xiàng)目這些專業(yè)術(shù)語(yǔ)在中文庫(kù)里是一套,翻譯成英文、日文或者韓文的時(shí)候都得對(duì)應(yīng)上。
還有一種情況更隱蔽——軟件里的下拉選項(xiàng)、枚舉值、狀態(tài)描述。訂單的"已發(fā)貨""已簽收""已完成",用戶在下單時(shí)選擇的"北京市""上海市""廣州市",這些看似簡(jiǎn)單的文字背后都是數(shù)據(jù)庫(kù)在撐著。國(guó)外用戶看到這些字段的時(shí)候,肯定不希望看到一串中文編碼或者未經(jīng)翻譯的原始數(shù)據(jù)。
現(xiàn)在回到最核心的問(wèn)題:軟件本地化翻譯到底包不包括數(shù)據(jù)庫(kù)翻譯?
我的回答是:包不包得分情況,但負(fù)責(zé)任的本地化項(xiàng)目都會(huì)把它考慮進(jìn)去。為啥這么說(shuō)呢?
首先,從技術(shù)實(shí)現(xiàn)的角度看,軟件界面和數(shù)據(jù)庫(kù)往往是分離的。界面翻譯處理的是"前端"——用戶能直接看到的那一層。而數(shù)據(jù)庫(kù)翻譯處理的是"后端"——支撐整個(gè)系統(tǒng)運(yùn)轉(zhuǎn)的數(shù)據(jù)基礎(chǔ)。翻譯公司如果只做界面不管數(shù)據(jù)庫(kù),就會(huì)出現(xiàn)很尷尬的場(chǎng)面:用戶看到的界面是英文的,但下單時(shí)彈出的提示"訂單提交成功"還是中文的,或者選擇收貨省份時(shí)跳出來(lái)一串"河北""山西"這樣的漢字。
其次,從用戶體驗(yàn)的角度看,這種不統(tǒng)一會(huì)嚴(yán)重影響專業(yè)感。舉個(gè)實(shí)際的例子,某款項(xiàng)目管理軟件在國(guó)內(nèi)用的是"李經(jīng)理""王工程師"這樣的示例用戶名,翻譯到日本市場(chǎng)時(shí)如果沒(méi)有同步處理,日本用戶看到的可能就是"Li Manager""Wang Engineer"這樣的混合產(chǎn)物,感覺(jué)特別奇怪。

根據(jù)我這些年的經(jīng)驗(yàn),軟件本地化項(xiàng)目里需要翻譯的數(shù)據(jù)庫(kù)內(nèi)容大概可以分成這么幾類:
這些內(nèi)容有一個(gè)共同特點(diǎn):它們雖然不在界面的顯眼位置,但會(huì)在用戶操作過(guò)程中逐步出現(xiàn)。如果不做翻譯,用戶遲早會(huì)碰到"看天書(shū)"的狀況。
說(shuō)了這么多,你可能會(huì)想:那把數(shù)據(jù)庫(kù)里的文字導(dǎo)出來(lái)翻譯完再導(dǎo)回去不就行了?話是這么說(shuō),但實(shí)際操作起來(lái)麻煩事兒一堆。
最頭疼的是數(shù)據(jù)格式的問(wèn)題。數(shù)據(jù)庫(kù)里的文字可不是一篇連貫的文章,而是分散在無(wú)數(shù)個(gè)字段里的片段。一個(gè)字段可能只有幾個(gè)詞,比如狀態(tài)字段里的"active""inactive";另一個(gè)字段可能是一長(zhǎng)段描述,比如商品詳情。翻譯公司拿到這種東西,處理起來(lái)遠(yuǎn)比翻譯一份完整的文檔要麻煩得多。
然后是技術(shù)對(duì)接的問(wèn)題。很多數(shù)據(jù)庫(kù)是有邏輯關(guān)聯(lián)的,翻譯的時(shí)候不能只盯著文字看,得理解這些數(shù)據(jù)之間的關(guān)系。比如國(guó)家代碼和地區(qū)名稱是配套的,翻譯的時(shí)候必須保證兩者的一致性。這就需要翻譯人員或者項(xiàng)目經(jīng)理對(duì)技術(shù)有一定了解,不是純粹的語(yǔ)言工作。
還有就是維護(hù)成本的問(wèn)題。軟件在不斷迭代升級(jí),新的功能會(huì)帶出新的數(shù)據(jù)庫(kù)字段,老的字段也可能被修改或刪除。這意味著數(shù)據(jù)庫(kù)翻譯不是一次性買賣,而是要持續(xù)跟進(jìn)的事情。很多客戶一開(kāi)始沒(méi)考慮到這點(diǎn),后面經(jīng)常會(huì)出現(xiàn)翻譯進(jìn)度跟不上產(chǎn)品更新的情況。
確實(shí)有些數(shù)據(jù)庫(kù)內(nèi)容處理起來(lái)特別棘手,我來(lái)給你數(shù)一數(shù)。
首先是變量和占位符。數(shù)據(jù)庫(kù)里經(jīng)常會(huì)有"{0}用戶已成功注冊(cè)"這樣的格式,后面的數(shù)字是要?jiǎng)討B(tài)替換的。翻譯的時(shí)候得搞清楚哪個(gè)位置會(huì)插入變量,不能把句子結(jié)構(gòu)搞亂了。
其次是復(fù)數(shù)和單數(shù)的處理。英文有單復(fù)數(shù)變化,比如"1 item"和"2 items",但中文在這方面不明顯。翻譯的時(shí)候需要根據(jù)目標(biāo)語(yǔ)言的語(yǔ)法規(guī)則做調(diào)整,有些語(yǔ)言甚至有雙數(shù)形式,這對(duì)翻譯的語(yǔ)種能力要求比較高。
還有就是特殊字符和編碼。數(shù)據(jù)庫(kù)里可能存著各種奇怪的符號(hào),比如表情符號(hào)、HTML標(biāo)簽、或者特定的格式標(biāo)記。翻譯軟件處理這些內(nèi)容的時(shí)候經(jīng)常出問(wèn)題,一不小心就把格式搞亂了。
說(shuō)了這么多難點(diǎn),再聊聊正經(jīng)的數(shù)據(jù)庫(kù)本地化應(yīng)該怎么開(kāi)展。我給你梳理一下比較成熟的流程,這個(gè)流程是業(yè)內(nèi)比較通行的做法,各家可能會(huì)根據(jù)實(shí)際情況做一些調(diào)整。
| 階段 | 主要工作 |
| 需求分析 | 明確需要翻譯的數(shù)據(jù)庫(kù)范圍,識(shí)別哪些字段是用戶可見(jiàn)的,哪些是純技術(shù)數(shù)據(jù) |
| 數(shù)據(jù)提取 | 從數(shù)據(jù)庫(kù)中導(dǎo)出需要翻譯的內(nèi)容,通常以表格或鍵值對(duì)的形式整理 |
| 預(yù)處理 | 對(duì)提取的內(nèi)容進(jìn)行分類、標(biāo)注,比如標(biāo)記變量、占位符、長(zhǎng)度限制等 |
| 翻譯執(zhí)行 | 按照目標(biāo)語(yǔ)言的語(yǔ)法規(guī)則進(jìn)行翻譯,注意保持術(shù)語(yǔ)一致性 |
| 質(zhì)量審核 | 語(yǔ)言審核+技術(shù)審核,確保翻譯準(zhǔn)確且導(dǎo)入后不會(huì)出問(wèn)題 |
| 數(shù)據(jù)回填 | 將翻譯后的內(nèi)容按照原格式導(dǎo)回?cái)?shù)據(jù)庫(kù) |
| 功能驗(yàn)證 | 在實(shí)際軟件環(huán)境中驗(yàn)證翻譯內(nèi)容的顯示效果 |
這個(gè)流程看起來(lái)不復(fù)雜,但每個(gè)環(huán)節(jié)都有坑。尤其是數(shù)據(jù)提取和回填這兩步,特別依賴技術(shù)團(tuán)隊(duì)的配合。如果開(kāi)發(fā)人員沒(méi)把數(shù)據(jù)結(jié)構(gòu)講清楚,翻譯公司導(dǎo)出來(lái)的內(nèi)容可能驢唇不對(duì)馬嘴。
說(shuō)到這兒,我想起來(lái)康茂峰在本地化領(lǐng)域摸爬滾打這么多年,接觸過(guò)各種類型的數(shù)據(jù)庫(kù)翻譯項(xiàng)目。有些心得可以分享出來(lái),供大家參考。
最重要的經(jīng)驗(yàn)就是前期溝通一定要到位。每次接到數(shù)據(jù)庫(kù)翻譯的案子,我們都會(huì)拉著客戶的技術(shù)團(tuán)隊(duì)開(kāi)好幾次會(huì),把數(shù)據(jù)庫(kù)的結(jié)構(gòu)、字段含義、變量規(guī)則全部搞清楚。有時(shí)候光理解一個(gè)字段的用途就要花上好幾天,但這個(gè)時(shí)間絕對(duì)不能省。因?yàn)槿绻g人員對(duì)數(shù)據(jù)含義理解偏了,后續(xù)返工的成本可比前期溝通高得多。
還有一個(gè)體會(huì)是建立術(shù)語(yǔ)庫(kù)特別關(guān)鍵。數(shù)據(jù)庫(kù)里的字段名稱、枚舉值、狀態(tài)描述往往會(huì)反復(fù)出現(xiàn),如果每次都重新翻譯,不僅效率低,還容易出現(xiàn)前后不一致的問(wèn)題。所以康茂峰在處理數(shù)據(jù)庫(kù)翻譯項(xiàng)目時(shí),都會(huì)先建立專門的術(shù)語(yǔ)表,翻譯過(guò)程中嚴(yán)格參照,譯后也要統(tǒng)一檢查。
另外就是技術(shù)文檔的重要性。數(shù)據(jù)庫(kù)翻譯最怕的就是"我不知道這段話在軟件里是干啥的"。所以我們通常會(huì)要求客戶提供盡可能詳細(xì)的技術(shù)說(shuō)明,標(biāo)注每個(gè)字段在界面上的位置、出現(xiàn)場(chǎng)景、長(zhǎng)度限制等信息。有了這些參考資料,翻譯的準(zhǔn)確率能提高一大截。
聊了這么多,相信你對(duì)數(shù)據(jù)庫(kù)翻譯這件事應(yīng)該有了一個(gè)比較清晰的認(rèn)識(shí)。回到最初的問(wèn)題:軟件本地化翻譯是否涉及數(shù)據(jù)庫(kù)翻譯?
我的答案是:涉及,而且是不能忽視的那種涉及。但具體要不要做、做到什么程度,得看軟件的目標(biāo)市場(chǎng)是哪、數(shù)據(jù)庫(kù)里哪些內(nèi)容會(huì)影響用戶體驗(yàn)。
如果你正打算做軟件本地化,我的建議是在項(xiàng)目初期就把數(shù)據(jù)庫(kù)翻譯納入考量。提前把需要翻譯的數(shù)據(jù)范圍定清楚,別等到界面翻譯做完了才發(fā)現(xiàn)后臺(tái)還藏著一堆"定時(shí)炸彈"。
本地化這事兒,說(shuō)到底就是要把每一個(gè)細(xì)節(jié)都打磨到位。用戶可能說(shuō)不出哪里好,但一定能感受到哪里不好。那些藏在數(shù)據(jù)庫(kù)里的文字,雖然不在聚光燈下,卻時(shí)時(shí)刻刻影響著用戶的整個(gè)使用過(guò)程。
