久久国产成人av_抖音国产毛片_a片网站免费观看_A片无码播放手机在线观看,色五月在线观看,亚洲精品m在线观看,女人自慰的免费网址,悠悠在线观看精品视频,一级日本片免费的,亚洲精品久,国产精品成人久久久久久久

分享

從ATM到CAT:自動翻譯機是如何發(fā)展的,?

 譯品譯味 2022-04-27

從即時反應(yīng)的翻譯軟件,,到所謂的AI同傳,機器翻譯技術(shù)越來越普及,,但機器翻譯是如何發(fā)展的,?機器翻譯真的能夠取代人工翻譯嗎?本期共讀,,讓我們跟隨David Bellos教授,,一起探索自動翻譯機奇幻的發(fā)展歷程。

ATM的起源

注意,,此ATM非彼ATM,,不是指自動取款機(Automated Teller Machine),而是自動翻譯機(Automatic Translation Machine),。

最初,,ATM的發(fā)明并非為了語言交流,而是為了探測敵國信息,,滿足軍事需要,。

冷戰(zhàn)初期,美蘇雙方展開軍備競賽,。為防止蘇聯(lián)趕超,,了解其原子彈的研究進展,美國需快速閱讀蘇聯(lián)最新研究期刊,。由于俄語在美國的普及率很低,,組建一支熟悉科學知識的俄語人工翻譯團隊顯然不現(xiàn)實,于是美國就發(fā)明了自動翻譯機,。

自動翻譯機的發(fā)展與密碼學也有不小關(guān)系,。

二戰(zhàn)期間,密碼學飛速發(fā)展,,這門關(guān)于編碼和解碼的學科也引發(fā)了關(guān)于語言和翻譯的思考,。

二戰(zhàn)時期的解密機器

代碼或密碼是呈現(xiàn)信息的一種方式,使用鑰匙就能解鎖信息。而語言本身也是一種編碼,,只不過不同的語言使用的密碼不同,。

語言加密的又是什么呢?按照西方對語言的認識,,語言解碼后呈現(xiàn)的是其意義和思想,。正如一句古諺所說,語言是思想的外衣,。

因此,,翻譯機器的運作邏輯便是首先脫離A語言的文字限制,解碼輸出文字背后所表達的真實含義,,再用B語言組織語句,表達思想,。

那么,,該如何設(shè)計翻譯機器的運作流程呢?

自古以來學習語言都有兩個基本任務(wù):背誦詞匯,,掌握語法,。

通過詞典可以認識詞匯,通過學習語法則可以掌握詞匯之間如何發(fā)生邏輯關(guān)系,,構(gòu)成有意義的句子,。

最初的翻譯機器就是這樣設(shè)計的,既可以存儲單詞,,又可以按照一定的語法規(guī)則分類,。但在組織句子這一步,瓶頸出現(xiàn)了:

①雖然機器可以掌握某種語言大部分的語法規(guī)則,,但實際運用中會出現(xiàn)很多特例,。

②真正表達出原文的含義,還需要了解語言背后的世界文化背景知識(點擊這里了解「世界知識」在翻譯中的作用),。

比如,,機器如果不了解原文所指代的真實事物,就無法判斷pen到底應(yīng)該取哪個含義:

The pen is in the box

(筆在盒子里)

The box is in the pen

(盒子在圍欄里)

邏輯學家巴爾·希勒爾受雇于麻省理工學院期間,,專門研究「全自動高質(zhì)量翻譯」,,即FAHQT (fully automated high-quality translation)。他發(fā)現(xiàn),,即使電腦能儲存一定量的單詞和語法,,也難以實現(xiàn)真正的全自動高質(zhì)量翻譯,原因正是上面提到的兩點,。

從ATM到CAT

1957年,,歐盟成立,各種語言之間的翻譯需求大增,。

快速發(fā)展的各大公司亟需一種工具提升翻譯廣告文案,、說明書的效率,,助其產(chǎn)品廣銷全球。這種與冷戰(zhàn)時期不同的政治因素和強大的資金支持再次推動了自動翻譯機的研究,。

但這時,,人們不再追求完美的自動翻譯,而是依靠計算機輔助,,存儲大量的術(shù)語和語料,,實現(xiàn)非全自動翻譯,又稱計算機輔助翻譯,,CAT (computer-aided translation),。

常用CAT軟件

進行CAT操作時,首先需要輸入A語言相關(guān)文本,,由計算機程序操作后,,再由譯員進行人工審校,確保以B語言輸出的語句準確表達了原文含義,。

今天,,我們輸入A語言的某個句子或單詞到任何一款字典軟件,點擊「雙語例句」,,就可以看到至少數(shù)十條語料庫里的相關(guān)例句,。這一切始于20世紀90年代互聯(lián)網(wǎng)的普及和谷歌的出現(xiàn)。

谷歌的出現(xiàn)是自動翻譯機發(fā)展歷程的一大轉(zhuǎn)折點,。

谷歌的自動翻譯器不再專注于如何解碼語法,,而是通過強大的計算能力,實現(xiàn)兩種語言互譯文本的輸入,、搜索與匹配,。谷歌翻譯器會先大量存儲之前已經(jīng)翻譯過的文件,形成語料庫,,再在短時間內(nèi)計算搜尋類似用法,,得出最匹配的句子。

谷歌翻譯器的「翻譯」,,其實是在無數(shù)人工翻譯形成的語料庫基礎(chǔ)上實現(xiàn)的,。谷歌翻譯輸出的內(nèi)容也會留在網(wǎng)絡(luò)上,成為新一批語料庫,,形成反饋環(huán),。

有趣的是,谷歌翻譯從某種程度上也與真人譯者類似,。譯者需要長期的翻譯實踐和經(jīng)驗,,谷歌翻譯也同樣是在自己長期積累的記憶庫里進行搜索和匹配,然后迅速得出答案。

所以,,比起早期承載著全自動化翻譯使命的翻譯機器,,如今谷歌翻譯的模式更像專業(yè)翻譯。

那么,,谷歌翻譯是如何發(fā)展到如今近乎專業(yè)的模式的呢,?專業(yè)譯員又該以怎樣的心態(tài)應(yīng)對越來越「人工智能」的機器翻譯?

歡迎大家在評論區(qū)留言,,說說自己的看法,。下期共讀,我們將與大家一起探討谷歌的神經(jīng)網(wǎng)絡(luò)翻譯與AI潮流下的機器翻譯,,敬請期待~

文案:李澤慧

排版:李澤慧

審定:朱玲 劉俐雅 馬欣悅

    轉(zhuǎn)藏 分享 獻花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多