2013年底我和搭檔魏勇鵬創辦公司的時候,他說了兩件事:一是,谷歌機器翻譯幾乎不再聘請語言學專家了,由懂得統計、計算的電腦專家主理開發。二是,谷歌有世界上最豐富的多語言語料數據,但對這種基於數據統計訓練而成的翻譯引擎來說現狀有點尷尬,更多語料能帶來效果不再明顯了,儘管谷歌的語料、用戶量和使用量都在日益增多。
在我們運營公司的兩年多時間裏,遇到了很多客戶和投資人,他們問的第一句話是:「你們機器翻譯能達到什麼樣的準確度?」這個問題意味深長,我一般只能回答說:「在某些垂直領域,我們比谷歌翻譯要好。」這句帶有挑釁意味的話讓聽者將信將疑卻無從反駁,因爲Ta從未得到過無瑕的機器翻譯體驗——像科幻影視文學、類似《星際迷航》裏展現的,那邊阿凡達星語說出來,這邊火星人聽進去,毫無停頓卡帶的痕跡。
行內人用專業尺度評價機器翻譯的現實是這樣:美國商務部下屬的國家標準與技術研究所NIST舉辦的一項機器翻譯研究水準評測,採用BLEU(Bilingual Evaluation Understudy)標準。 其原理是比較機譯結果和人譯結果的相似度,完全一致得分爲1(當然不同的人的翻譯很難「完全一致」,所以得分1爲理想值)。2008年NIST的英文-中文的機器翻譯評測結果,谷歌翻譯得分0.4142,微軟亞洲研究院提交的測評是0.4099,廈門大學得分0.2502;谷歌和微軟亞洲的中文-英文機翻得分分別是0.2999和0.2901,中科院自動化所的得分是0.2407。
您已閱讀14%(626字),剩餘86%(3975字)包含更多重要資訊,訂閱以繼續探索完整內容,並享受更多專屬服務。