來源 | 雷鋒網(wǎng) 5月29日~30日,,2018第六屆TopDigital創(chuàng)新發(fā)布盛典暨創(chuàng)新獎頒獎典禮在上海舉行,。TopDigital追蹤數(shù)字技術(shù)浪潮下的創(chuàng)新發(fā)展,覆蓋TMT(Technology/Media/Telecom),、ABC(AI/Big Data/Cloud Computing),、大文創(chuàng)、泛金融等行業(yè)領(lǐng)域,,吸引了來自國內(nèi)外數(shù)百家企業(yè)和上千名專業(yè)人士參與,。 作為國際大會,如何讓不同語言文化的參會者實(shí)現(xiàn)無障礙溝通是大會的基本,。雷鋒網(wǎng)了解到,,作為此次峰會的合作伙伴,搜狗將全程提供人工智能同傳展示,。 國際會議“御用”的搜狗同傳在國內(nèi)外專家和企業(yè)的高端對話中,,搜狗的人工智能同傳提供了強(qiáng)力的支持,讓與會者無需擔(dān)心語言問題,。會場兩側(cè)屏幕上以中英雙語實(shí)時展示嘉賓發(fā)言內(nèi)容,,翻譯速度幾乎與嘉賓發(fā)言速度一致。雙語字幕不僅能讓與會者高效直觀的獲取演講內(nèi)容,,實(shí)時文字記錄也能為會后的資料整理節(jié)省大量的時間,。 自2016年誕生以來,搜狗同傳已經(jīng)支持了數(shù)百場國內(nèi)外會議,,多次應(yīng)用于GMIC,、中國車聯(lián)網(wǎng)博覽會、世界電信和信息大會、全球人工智能技術(shù)大會等前沿國際科技大會,,成為國際頂端會議的標(biāo)配,。 2017年,由中國計(jì)算機(jī)學(xué)會(CCF)主辦,,雷鋒網(wǎng)(公眾號:雷鋒網(wǎng)),、香港中文大學(xué)(深圳)承辦的全球人工智能與機(jī)器人峰會(CCF-GAIR)上,搜狗同傳也作為合作伙伴為大會提供同傳支持,。 據(jù)了解,,搜狗同傳不僅能流暢地記錄、翻譯內(nèi)容,,還能很好地識別詞語和句子的停頓,。這種復(fù)雜的同傳工作難度極大,需要覆蓋語音斷句,、語音識別,、文本斷句、機(jī)器翻譯等多個技術(shù)維度,,才能構(gòu)成穩(wěn)定可靠的臨場表現(xiàn),。 不同于傳統(tǒng)的機(jī)器翻譯,,實(shí)時翻譯技術(shù)包括語音識別,、機(jī)器翻譯兩個大方向,還有一些細(xì)節(jié)優(yōu)化與系統(tǒng)調(diào)優(yōu),。搜狗同傳將語音識別與機(jī)器翻譯技術(shù)結(jié)合在了一起,,希望提供從聽到說、能理解會思考的能力,。 揭秘搜狗同傳四大黑科技搜狗的翻譯團(tuán)隊(duì)在自然語言處理和深度學(xué)習(xí)方面有非常深厚的積累,,與谷歌GNMT的八層結(jié)構(gòu)相比,搜狗同傳的神經(jīng)網(wǎng)絡(luò)精簡為五層,,在效率上可獲得不小的提高,。 在搜狗同傳的技術(shù)框架中,語音斷句算法通過能量檢測和基于深度學(xué)習(xí)模型的方式,,對語音信號進(jìn)行語音和靜音的判斷,,這樣可以跳過對靜音片段的處理以提升解碼效率,同時語音片斷可以分割成多句并行識別,,大大提高語音識別的效率,。 語音識別部分,搜狗同傳使用了CLDNN CTC結(jié)合的聲學(xué)模型和RNNLM語言模型,,把經(jīng)過語音斷句后的片段,,通過聲學(xué)模型和語言模型轉(zhuǎn)化成文本,保證識別輸出結(jié)果更加通順,、流暢,,符合正常的發(fā)言習(xí)慣,。 而在語音識別和翻譯之間,最關(guān)鍵的橋梁則是文本斷句,,這個模塊是搜狗的語音同傳技術(shù)可以應(yīng)用的重要原因,。文本斷句通過內(nèi)容平滑技術(shù)去掉無意義詞語,使句子變得通順,,然后通過規(guī)則和模型兩種方法進(jìn)行語句劃分并加標(biāo)點(diǎn),。 搜狗用到了雙向 GRU 技術(shù)構(gòu)建編碼端的結(jié)構(gòu)。通過 attention 機(jī)制在源端和目標(biāo)端文本間進(jìn)行對齊并生成當(dāng)前時刻的句子級向量表示,,并送至解碼端,,解碼端逐詞解碼輸出翻譯結(jié)果。 搜狗同傳將語音識別與機(jī)器翻譯技術(shù)結(jié)合在了一起,,采用端到端的神經(jīng)網(wǎng)絡(luò)翻譯技術(shù),,通過編碼端獲取源端句子的分布式表示,利用注意力模型聚焦源端,,使用循環(huán)神經(jīng)網(wǎng)絡(luò)生成翻譯結(jié)果,,翻譯的結(jié)果相比傳統(tǒng)機(jī)器翻譯大約能高出30%~40%。 搜狗同傳還創(chuàng)新性地將許多自然語言處理門類中非翻譯任務(wù)的方法用于機(jī)器翻譯中,,通過向神經(jīng)網(wǎng)絡(luò)添加額外的機(jī)器學(xué)習(xí)模塊來提升質(zhì)量,,點(diǎn)對點(diǎn)解決神經(jīng)機(jī)器翻譯中的具體問題。 例如,,搜狗同傳使用了如下四類技巧來提升模型質(zhì)量:
除此之外,,機(jī)器翻譯的最終效果不僅和算法相關(guān),還和數(shù)據(jù)密不可分,。對同傳來說,,人們希望以更加自然、接近人和人交互的方式來進(jìn)行,,同時也希望翻譯引擎能更多的理解人的語言需求,,在合成時的語言表達(dá)更加自然。 搜狗作為一家搜索公司積累的龐大語料庫,,對機(jī)器翻譯效果的提升有很大幫助,。根據(jù)搜狗方面給出的預(yù)測數(shù)據(jù),目前搜狗語音識別的準(zhǔn)確率為97%,支持最快每秒400字的高速聽寫,,語音輸入日頻次高達(dá)3.4億次,,搜狗語音翻譯的準(zhǔn)確率則可以達(dá)到90%。 AI將助力同傳服務(wù)普及實(shí)現(xiàn)全人類之間的順暢交流一直是人類的夢想,,如今人工智能讓人們看到了實(shí)現(xiàn)這一夢想的希望,,這也是AI翻譯讓大眾持續(xù)興奮、讓技術(shù)公司和研究人員保持動力的最大原因,。 回想一年之前,,人們還自信地認(rèn)為AI取代傳統(tǒng)人工同聲傳譯“為時尚早”,但在短短一年時間里,,搜狗同傳就已經(jīng)支持了數(shù)百場國內(nèi)外會議,,多次應(yīng)用于前沿國際科技大會,成為國際頂端會議的標(biāo)配,,充分展示了國內(nèi)企業(yè)在人工智能技術(shù)領(lǐng)域的發(fā)展和實(shí)力,。 搜狗同傳是AI技術(shù)落地實(shí)際應(yīng)用的優(yōu)秀案例,在本次大會的亮相更是反映出AI技術(shù)在應(yīng)對全球跨語言交流,、提高人類工作效率方面所具有的巨大潛力,,為與會的各界人士對未來人工智能技術(shù)的普遍應(yīng)用帶來信心和期待。 相信在未來,,搜狗同傳會在更多領(lǐng)域大展身手,,帶動翻譯行業(yè)產(chǎn)生新的質(zhì)變。 |
|