作為技術(shù)創(chuàng)新堅(jiān)定的擁篤,,李彥宏在今年的聯(lián)盟峰會(huì)上給大家來了一次人工智能藝術(shù)展,,把百度人工智能的現(xiàn)在或未來的各項(xiàng)應(yīng)用場(chǎng)景以可聽、可視,、可觸的方式呈現(xiàn)在了聯(lián)盟伙伴們面前,,不少參會(huì)者表示大開眼界,“奇妙的體驗(yàn)”,。 語音與圖像,,人機(jī)交互的未來
前幾天, “互聯(lián)網(wǎng)女皇”瑪麗·米克爾發(fā)布了 2016 年互聯(lián)網(wǎng)趨勢(shì)報(bào)告,,其中首度用近1/4的篇幅,,論述了語音技術(shù)帶來的改變,,將其贊譽(yù)為“人機(jī)交互的新范式”,,并以全球API調(diào)用百度語音識(shí)別,、百度文本轉(zhuǎn)語音(TTS)的每日使用量增長(zhǎng)數(shù)據(jù)為例,展示了語音識(shí)別在人機(jī)交流中的重要性,。語音交互在未來互聯(lián)網(wǎng)發(fā)展中的關(guān)鍵地位,,已經(jīng)呼之欲出。 英雄所見略同,,對(duì)語音交互的顛覆性意義,,李彥宏長(zhǎng)久以來也是深信不疑。峰會(huì)演講開始,,他便祭出了百度獲得MIT科技評(píng)論“2016十大科技突破”之一的深度語音識(shí)別系統(tǒng),。他播放了三句方言語音,濃重的口音,、嘈雜的發(fā)聲環(huán)境,,讓現(xiàn)場(chǎng)觀眾聽起來都無可奈何,但經(jīng)過學(xué)習(xí)的百度語音系統(tǒng)卻可以準(zhǔn)確識(shí)別,。去年,,百度語音識(shí)別的準(zhǔn)確率是95%,今天已達(dá)到97%,?!?7%是什么概念?它比正常人的聽力都要好一些了,?!?/p>
李彥宏今天所展示的三句話,背后其實(shí)是百度深度語音識(shí)別科技的飛躍,,百度通過CNN(卷積神經(jīng)網(wǎng)絡(luò))與LSTM(長(zhǎng)短時(shí)記憶模型)的混合建模,,連接時(shí)序分類(CTC)訓(xùn)練,已經(jīng)做到了真實(shí)環(huán)境,、日常非標(biāo)準(zhǔn)語言的精確識(shí)別,,目前準(zhǔn)確率達(dá)97%?!爱?dāng)做到99%準(zhǔn)確時(shí),,將徹底改變?nèi)伺c設(shè)備交互的方式?!卑俣仁紫茖W(xué)家吳恩達(dá)曾表示,。 隨后,李彥宏還展示了一個(gè)技術(shù)小花絮:百度個(gè)性化語音合成系統(tǒng)合成了一段麥兜的問候,。它基于網(wǎng)上的語料,,合成出有個(gè)性與情感的聲音,與麥兜配音演員的真聲相似度極高,。在語音交互的使用越來越頻繁的今天,,這項(xiàng)技術(shù)對(duì)于提升用戶與機(jī)器對(duì)話的體驗(yàn)非常有實(shí)用價(jià)值,。
除了語音技術(shù)之外,人機(jī)互動(dòng)的另一個(gè)重要方式就是圖像,。李彥宏去年在聯(lián)想Techworld大會(huì)上曾展示過驚艷全場(chǎng)的Image QA,,它通過機(jī)器視覺識(shí)別圖片信息、人工智能理解圖片信息,、語音識(shí)別理解問題,再通過人工智能回答問題,,最后以語音合成輸出答案,。如今一年過去,李彥宏今天展示的新版本Image QA 也更進(jìn)一步,,不僅能識(shí)別靜態(tài)高質(zhì)量圖片,,還能準(zhǔn)確識(shí)別隨手拍攝的低質(zhì)量圖片。Image QA背后是越來越進(jìn)步的機(jī)器視覺和對(duì)圖像的理解能力,,這種技術(shù)的應(yīng)用不僅是完成幾輪人機(jī)對(duì)話,,還有替代人類視覺性工作的潛力,在工業(yè)上,、軍事上前景都難以估量,。 無人駕駛和機(jī)器人侍者已從電影走進(jìn)現(xiàn)實(shí)
李彥宏要秀黑科技,,當(dāng)然少不了無人駕駛,。這半年來,他多次談起百度無人車“三年商用五年量產(chǎn)”的計(jì)劃,,百度無人車也確實(shí)以驚人的速度在全面進(jìn)步中,。“現(xiàn)在我們能做到的是在路況不是特別復(fù)雜,、非上下班高峰期的時(shí)候,,無人車不需要人工干預(yù)就可以上上下下、做各種動(dòng)作,,但如果路況特別復(fù)雜的話,,現(xiàn)在我們技術(shù)還達(dá)不到?!钡顝┖晖瑫r(shí)充滿信心地說:“我們相信,,三五年之內(nèi),無人駕駛一定可以成為現(xiàn)實(shí),?!?/p> 百度無人駕駛車早就走出實(shí)驗(yàn)室,在不斷進(jìn)行路測(cè),,最近又與蕪湖市達(dá)成協(xié)議,,獲得了一塊無人駕駛汽車的實(shí)驗(yàn)區(qū)域,,一方面通過大量真實(shí)道路駕駛獲取深度學(xué)習(xí)所需的數(shù)據(jù),一方面可以嘗試無人駕駛的初步商用——《少數(shù)派報(bào)告》中炫酷的無人駕駛科幻場(chǎng)景似乎一下子近在咫尺,。 人工智能不僅讓司機(jī)成為過去的職業(yè),,取代餐廳侍者也已成為現(xiàn)實(shí)。李彥宏在會(huì)上展示了一段度秘機(jī)器人在肯德基為顧客點(diǎn)餐的視頻,,從打招呼,、點(diǎn)餐、追問顧客需求,,度秘機(jī)器人的服務(wù)滴水不漏,,不知KFC服務(wù)員們看到這一場(chǎng)景會(huì)作何感想。 度秘進(jìn)入KFC也是百度黑科技走出實(shí)驗(yàn)室的重要嘗試,,通過真實(shí)商用來驗(yàn)證百度語音識(shí)別與多輪對(duì)話技術(shù),,承擔(dān)簡(jiǎn)單的人類工作,再通過深度學(xué)習(xí)能力不斷優(yōu)化,,最后實(shí)現(xiàn)的,,不僅僅是替代KFC的點(diǎn)餐員,很可能是替代所有商業(yè)前臺(tái)的工作,。 “技術(shù)實(shí)用派”李彥宏的人工智能理想
在李彥宏眼中,,人工智能不僅是促進(jìn)互聯(lián)網(wǎng)行業(yè)下一幕發(fā)展的重要?jiǎng)恿?,更將把人類從?jiǎn)單勞動(dòng)中解放出來,構(gòu)建一個(gè)更加便捷,、美好的未來社會(huì),。 今天他在聯(lián)盟峰會(huì)上展示的黑科技,,僅僅是一個(gè)起點(diǎn)。也許三五年之后,,我們就可以看到百度的無人駕駛出租車出現(xiàn)在中國城市的街頭,;成批的擁有機(jī)器視覺的百度機(jī)器人在工廠車間工作;度秘點(diǎn)餐員出現(xiàn)在不同的快餐店,;在各個(gè)行業(yè)的客服電話中聽到人工智能客服甜美的聲音,;在金融服務(wù)業(yè)感受到人工智能征信系統(tǒng)的超高效率…… 這個(gè)未來很美好,讓我們共同期待,。
|
|