觀點機器人翻譯

「億級翻譯需求」存在嗎?

鄒劍宇:可預見的時間裏,機器翻譯一直都會不完美。這並非壞訊息,它給人類留了尊嚴和安全感,保留了翻譯職業,甚至爲譯員提供了更多的商業需求和工作崗位。

2013年底我和搭檔魏勇鵬創辦公司的時候,他說了兩件事:一是,谷歌機器翻譯幾乎不再聘請語言學專家了,由懂得統計、計算的電腦專家主理開發。二是,谷歌有世界上最豐富的多語言語料數據,但對這種基於數據統計訓練而成的翻譯引擎來說現狀有點尷尬,更多語料能帶來效果不再明顯了,儘管谷歌的語料、用戶量和使用量都在日益增多。

在我們運營公司的兩年多時間裏,遇到了很多客戶和投資人,他們問的第一句話是:「你們機器翻譯能達到什麼樣的準確度?」這個問題意味深長,我一般只能回答說:「在某些垂直領域,我們比谷歌翻譯要好。」這句帶有挑釁意味的話讓聽者將信將疑卻無從反駁,因爲Ta從未得到過無瑕的機器翻譯體驗——像科幻影視文學、類似《星際迷航》裏展現的,那邊阿凡達星語說出來,這邊火星人聽進去,毫無停頓卡帶的痕跡。

行內人用專業尺度評價機器翻譯的現實是這樣:美國商務部下屬的國家標準與技術研究所NIST舉辦的一項機器翻譯研究水準評測,採用BLEU(Bilingual Evaluation Understudy)標準。 其原理是比較機譯結果和人譯結果的相似度,完全一致得分爲1(當然不同的人的翻譯很難「完全一致」,所以得分1爲理想值)。2008年NIST的英文-中文的機器翻譯評測結果,谷歌翻譯得分0.4142,微軟亞洲研究院提交的測評是0.4099,廈門大學得分0.2502;谷歌和微軟亞洲的中文-英文機翻得分分別是0.2999和0.2901,中科院自動化所的得分是0.2407。

您已閱讀14%(626字),剩餘86%(3975字)包含更多重要資訊,訂閱以繼續探索完整內容,並享受更多專屬服務。
版權聲明:本文版權歸FT中文網所有,未經允許任何單位或個人不得轉載,複製或以任何其他方式使用本文全部或部分,侵權必究。
設置字型大小×
最小
較小
默認
較大
最大
分享×