百度稱開發(fā)出新語音識(shí)別系統(tǒng) 準(zhǔn)確率超蘋果谷歌|百度|語音識(shí)別

青山流水505 2014-12-19

展開全文

鳳凰科技訊北京時(shí)間12月19日消息,，據(jù)《福布斯》雜志網(wǎng)絡(luò)版報(bào)道,，百度近日在美國康奈爾大學(xué)圖書館的arXiv.org網(wǎng)站上發(fā)表論文稱,，已開發(fā)出了一種新的語音識(shí)別系統(tǒng)Deep Speech,，準(zhǔn)確率超過了蘋果,、谷歌的產(chǎn)品,。

百度首席科學(xué)家吳恩達(dá)以及由Awni Hannun領(lǐng)導(dǎo)的10人研究團(tuán)隊(duì)在arXiv.org網(wǎng)站上稱,，他們已經(jīng)開發(fā)出了一種新的,，更為準(zhǔn)確的語音識(shí)別系統(tǒng)Deep Speech，該系統(tǒng)使用了端對端的深度學(xué)習(xí)技術(shù),。語音識(shí)別是一項(xiàng)越來越重要的技術(shù),，已經(jīng)被用于蘋果語音助手Siri、語音輸入功能Dictation以及谷歌語音搜索中,。

吳恩達(dá)稱,，按照衡量語音識(shí)別系統(tǒng)出錯(cuò)率的標(biāo)準(zhǔn)基準(zhǔn)，Deep Speech的準(zhǔn)確性已經(jīng)超越了蘋果,、谷歌的語音識(shí)別系統(tǒng),。特別是在汽車或人群等噪音環(huán)境下，Deep Speech的表現(xiàn)更為出色,。

吳恩達(dá)稱,，測試顯示，在噪音環(huán)境下,，Deep Speech語音識(shí)別出錯(cuò)率比谷歌語音識(shí)別引擎(Google Speech API),、語音識(shí)別公司wit.ai、微軟必應(yīng)語音搜索,、蘋果Dictation的語音系統(tǒng)低10%以上,。

百度團(tuán)隊(duì)收集了9600人的7000個(gè)小時(shí)的語音，但多數(shù)是在安靜環(huán)境下,。為了提升噪音環(huán)境下的語音識(shí)別能力,，百度向語音樣本中添加了大約15種類型的噪音，比如酒店,、汽車和地鐵內(nèi)的環(huán)境噪音,，從而將語音樣本中的數(shù)據(jù)擴(kuò)充到10萬個(gè)小時(shí)。然后,，百度讓系統(tǒng)在噪音環(huán)境下學(xué)習(xí)識(shí)別語音,。(編譯/簫雨)

本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間，所有內(nèi)容均由用戶發(fā)布,，不代表本站觀點(diǎn),。請注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息,，謹(jǐn)防詐騙,。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容，請點(diǎn)擊一鍵舉報(bào),。

轉(zhuǎn)藏 分享

QQ空間 QQ好友新浪微博微信

獻(xiàn)花（0） +1

來自：青山流水505 > 《科技前沿》

舉報(bào)/認(rèn)領(lǐng)