前段時間,一則新聞幾乎刷遍了整個網(wǎng)絡(luò),。Google新發(fā)布了神經(jīng)機器翻譯(GNMT:Google Neural Machine Translation)系統(tǒng),,并稱該系統(tǒng)使用了當(dāng)前最先進的訓(xùn)練技術(shù),能夠?qū)崿F(xiàn)到當(dāng)下機器翻譯質(zhì)量上最大的提升,。 有從事翻譯職業(yè)的網(wǎng)友甚至這樣形容:
這種看法未免有點杞人憂天,。尤其是在業(yè)內(nèi)專家看來,,機器翻譯的效果還遠未達到取代人類專家翻譯的水平。實際上,,谷歌此次應(yīng)用的技術(shù)并非最新的“黑科技”,。早在2015年百度就已經(jīng)發(fā)布了基于深度神經(jīng)網(wǎng)絡(luò)的端到端翻譯系統(tǒng),微軟的必應(yīng)翻譯也同樣使用神經(jīng)網(wǎng)絡(luò)技術(shù)來改善自身的翻譯質(zhì)量,。 與傳統(tǒng)的基于短語的翻譯(PBMT)相比,,基于神經(jīng)網(wǎng)絡(luò)的翻譯系統(tǒng)對整個輸入句子進行編碼,能夠更充分的利用上下文信息,,生成較高質(zhì)量的譯文,。 最近大家熱議的Google神經(jīng)機器翻譯目前只是在應(yīng)用在中譯英中,所以以下測試都是在中譯英部分下進行,。分別從幾個角度來參看百度,、Google、必應(yīng)等幾個翻譯軟件的實際使用效果如何:
1. 定語從句(用一個句子修飾一個名詞短語):
從上至下依次為Google翻譯,、百度翻譯,、必應(yīng)翻譯 2. 多個修飾形容詞 從上至下依次為Google翻譯、百度翻譯,、必應(yīng)翻譯 3. 長短句翻譯 從上至下依次為Google翻譯,、百度翻譯、必應(yīng)翻譯 4. 俚語翻譯 從左至右依次為Google翻譯、百度翻譯,、必應(yīng)翻譯 可以看到,,在定語從句部分Google與百度的翻譯結(jié)果相差無幾,語句通順連貫,,兩者比較的話Google翻譯的結(jié)果更為接近標(biāo)準(zhǔn)答案一些,。另一方面,必應(yīng)翻譯的結(jié)果則與本意有所出入。 在多個形容詞部分,,三者翻譯出了大概意思,,但是遇到黃老板以及黃山這類在名詞與形容詞中易混淆的部分時,似乎百度翻譯要更為準(zhǔn)確一點,。 在長短句部分,,Google翻譯與必應(yīng)翻譯都出現(xiàn)了同時翻譯兩次時態(tài)及動詞“have seen'的情況,雖然百度翻譯并未出現(xiàn)這種情形,,但是其在兩個名詞之間并未翻出連接詞'and“,,對語句理解有一點影響。 涉及到俚語翻譯部分時,,Google翻譯幾乎完全是根據(jù)詞組翻譯出了字面的意思,,而必應(yīng)則出現(xiàn)了奇怪的省略情況,語義并不連貫,。相較之下,,百度翻譯將原句引申含義也翻譯了出來,并保持了語句連貫與準(zhǔn)確度,。
1. 修飾詞,如:的,、了,、好 2. 省略與重復(fù)疊加短語句子 在口語化翻譯部分中,涉及到修飾詞部分,,Google與百度翻譯大同小異,,必應(yīng)翻譯與本意出入較大。 但是在重復(fù)疊加短語部分,,從主觀上來看百度翻譯將”冒著“翻譯為”Take“,,相比Google與必應(yīng)的”Brave“,其在語義通暢易讀以及連貫度上表現(xiàn)要更好一些,。
1. 短段落 2. 長段落 在段落整體翻譯部分中,,三者對于段落基本語義都翻譯出來了,。其中Google翻譯在某些連接詞的翻譯上更為簡潔一些,而百度與必應(yīng)則會在某些位置增加一些連接詞匯。 但是在涉及到長短句,、語氣詞,、多重修飾詞部分,三者在某些地方都表現(xiàn)一般,。 例如:“父親是一個胖子,,走過去自然要費事些?!?/p>
三者從連貫性來看都不算太好,,但是從語義上來看Google翻譯更為優(yōu)秀一些。 再如:“于是撲撲衣上的泥土,,心里很輕松似的,,過一會說,“我走了,,到那邊來信,!”
此處三者的翻譯都不太好,從對應(yīng)詞組的翻譯來看,,必應(yīng)翻譯的效果要好一些,,但在缺少主語的情況下翻譯成“One”并不正確。Google翻譯直接理解將整個句子中的主體都默認(rèn)是一個人,,百度翻譯準(zhǔn)確識別出了講話的是父親,,即“He”,但其在從句部分結(jié)構(gòu)有錯誤,。
1. 離線翻譯 在離線翻譯部分,,從測試的語句來看,,Google翻譯的效果勉強能看懂,百度需要先購買離線包才能進行翻譯,,必應(yīng)則不提供離線翻譯功能,。 2. 圖片翻譯 圖像翻譯部分使用今日頭條的統(tǒng)一頁面 從左至右依次為Google翻譯,、百度翻譯、必應(yīng)翻譯 其中谷歌翻譯可以做到手機放在圖片前面,,不做任何操作開始實時翻譯,。按拍照按鈕后,涂抹想翻譯的部分,,然后翻譯出相應(yīng)的結(jié)果,。 相比谷歌翻譯,,百度沒有放在圖片前面不做任何操作開始實時翻譯的功能,。不過百度翻譯在按拍照按鈕后,也能涂抹想翻譯的部分翻譯出相應(yīng)的結(jié)果,。但百度翻譯的個性化功能最全,,有
四大類,且自定義功能最完善,。 另外,,百度翻譯提供的實物翻譯與菜單翻譯功能在某些場合也能派上用場,。 必應(yīng)翻譯只能先拍照再進行翻譯,,也無自定義功能選項。 3. 語音翻譯 在語音翻譯部分,正確的句子是:你好,,我想打死李某,。 Google和百度的翻譯效果差不多類似,必應(yīng)則不提供語音翻譯功能,。 此外,,Google翻譯提供多種語言的語音輸入功能,百度目前只提供中文,、英文,、粵語(Google翻譯中并未提供)語音輸入功能。兩者的語言識別輸入功能也都十分不錯,,準(zhǔn)確率很高且語句通順連貫,。并且兩者都能以對話模式呈現(xiàn),相信在商務(wù)或者旅行過程中會帶來不少便利,。 從上至下依次為Google翻譯,、百度翻譯 總結(jié)從上面的各項對比中可以看到,采用了神經(jīng)機器系統(tǒng)的翻譯相比之前基于短語的翻譯確實要進步了許多,。再也不是之前那種讀起來總感覺哪里不對的感覺,,甚至有些翻譯結(jié)果已經(jīng)到了稍加修改勉強能用的地步。 但是具體到使用過程中,,比如需要對復(fù)雜語句以及口語化表達進行翻譯時,,大部分時候Google翻譯與百度翻譯的表現(xiàn)相對優(yōu)秀一些。不僅在流暢度,、語義保持上效果相對優(yōu)秀,,而且在句子錯誤率以及單詞錯誤率上也要相對少一些。 另外,,在圖片翻譯部分,,Google翻譯能做到實時翻譯的效果,且準(zhǔn)確度不錯,。百度翻譯雖然沒有實時翻譯的功能,,但是其自定義功能最完善,且能選擇四大類個性化功能,,針對性更強,。 綜上所述,添加了神經(jīng)網(wǎng)絡(luò)的機器翻譯相較于往日的確不可同日而語了,。在某些方面已經(jīng)隱隱約約接近人類翻譯的水準(zhǔn),,所以有相關(guān)翻譯人員擔(dān)心也不算夸張。不過對于普通人而言,,在有相關(guān)翻譯需求時,,綜合詞語、段落準(zhǔn)確率以及語義流暢度來看,,百度翻譯目前是一個不錯的選擇,。 |
|