不久前,,科大訊飛在北京舉辦了2016年的新品發(fā)布會(huì),,融合了人工智能語音的多項(xiàng)前沿產(chǎn)品集中亮相,瞬間震爆了整個(gè)互聯(lián)網(wǎng)行業(yè),。 演講現(xiàn)場實(shí)時(shí)將語音轉(zhuǎn)換文字,、同聲語音翻譯、智能語音指令識別,、語音車載系統(tǒng),、智能家居、機(jī)器人等多項(xiàng)融合了智能語音的高技術(shù)產(chǎn)品,,已經(jīng)讓人人揭開了未來生活的一角,。 作為面向未來的前沿技術(shù)之一,,人工智能在2016年的年末駛?cè)肓烁咚俾贰?/p> 從智能家居到車載系統(tǒng)的不同硬件載體,,從教育醫(yī)療到傳媒金融等不同行業(yè)領(lǐng)域,,智能語音不僅是媒體人的“高效文秘”,還是老師們的“隨身百科全書”,,既是智能化家居的“總遙控器”,,又是隨時(shí)可以為你服務(wù)的“專屬咨詢員”,隨著相應(yīng)技術(shù)的不斷成熟,,智能語音還將開拓出更多的應(yīng)用場景,。 通過對不同功能App的操控,智能語音可以提供給人們?nèi)徊煌奈磥硎讲倏伢w驗(yàn),。除了在發(fā)布會(huì)上演示的應(yīng)用領(lǐng)域外,,以下幾個(gè)場景在未來十年內(nèi)也將成為現(xiàn)實(shí)。 場景一:語音智能放技能 A君在體驗(yàn)一款最新上線MMORPG手機(jī)游戲,,這款游戲的操控方式以虛擬觸屏為主,,手機(jī)左下方是虛擬方向鍵,右下方則為4個(gè)技能控制鍵,。 由于4個(gè)技能鍵無法滿足8個(gè)主動(dòng)釋放技能的需求,,因此游戲提供了4個(gè)可以自定義語音的釋放技能的功能來解決這一問題。 A君將“火球”,、“雷暴”,、“狂化”和“冰晶”4個(gè)技能設(shè)置為與技能相同的語音釋放,在Boss活動(dòng)中通過智能語音,,游戲人物自動(dòng)向Boss釋放了“火球”和“雷暴”技能,,并向人物自身增加了“狂化”Buff,以獲得了更高的攻擊力,。 解析: 目前游戲中已經(jīng)能夠?qū)崿F(xiàn)真人語音即時(shí)交流,,以往在手游中比較操作麻煩的信息發(fā)送已經(jīng)得到解決,而智能語音技術(shù)的成熟,,使用自然語音操控游戲也將成為現(xiàn)實(shí),。 場景二:語音操控VR應(yīng)用 C君是一名VR設(shè)備應(yīng)用的重度使用者,只要一有空就會(huì)玩一個(gè)小時(shí) HTC Vive頭顯上的射擊游戲《Kill Bill》(虛構(gòu)的射擊游戲名),,由于VR游戲需要調(diào)動(dòng)全身的部位活動(dòng),,在短短一個(gè)月內(nèi)的C君就減掉了20斤贅肉。 唯一令他不滿的是,,玩一個(gè)簡單的射擊游戲,,自己需要穿戴上厚重的物理觸感背心、配有游戲電腦的雙肩背包,、特制游戲手套和一把重量媲美真槍的XM8型模型槍,,操控總重量超過了15斤,同時(shí)武器切換,、裝彈,、投擲不同類型手雷等常規(guī)功能需要在仿真槍上按下不同位置的功能鍵才能實(shí)現(xiàn),,尤其是換彈操作,非常不適合左手持槍的人操控,,游戲操作極為麻煩,。 在游戲加入智能語音操控功能后,C君將CS中常用的“Fire in the hole”設(shè)定為高爆手榴彈投擲指令,,將“Flash”設(shè)定為閃光彈,,“Reload”設(shè)定為裝彈,槍械操作專注于開火和不同武器切換,,VR游戲體驗(yàn)瞬間提升了幾個(gè)境界,。 解析: 除了手機(jī)游戲外,方興未艾但已成型的VR領(lǐng)域也是智能語音可以大展神威之處,,語音與手勢的組合將成為VR/AR終端設(shè)備上所支持的標(biāo)準(zhǔn)操控方式,,這將極大緩解目前終端外設(shè)種類繁雜、操作學(xué)習(xí)成本太高的弊端,。 場景三:語音閱讀交互圖書 B君在圖書館閱讀一本由語音和視頻內(nèi)容構(gòu)成的交互式歷史圖書,,但他忘了上次所閱讀的內(nèi)容片斷,于是B君向圖書說“我需要看公元690年的所有內(nèi)容”,,系統(tǒng)立即為B君搜索出所有與帶有“公元690年”關(guān)鍵字節(jié)信息的內(nèi)容,,并自動(dòng)開始朗讀時(shí)間最靠前的事件內(nèi)容。 查閱完歷史資料后,,B君需要找尋關(guān)于一位知名新聞攝影師的生平事跡,,于是向系統(tǒng)說出“幫我搜索所有關(guān)于攝影師凱文卡特的資料”,系統(tǒng)也迅速搜索出帶有關(guān)鍵字“凱文卡特”“攝影師”的相關(guān)文章,。但是關(guān)于攝影師的文章太多,,B君又發(fā)出語音指令“我不需要攝影師的文章,我需要的是凱文卡特的資料”,,系統(tǒng)又再次進(jìn)行了搜索,,最終B君找齊了自己所需的資料。 解析: 日漸成熟的語音閱讀催生了聽書這一新興需求,,并且開始對傳統(tǒng)的圖書出版形成了一定的逆影響效果,。目前語音閱讀已經(jīng)開始應(yīng)用于聽書和百度新聞等App上,取得了非常不錯(cuò)的體驗(yàn),,但仍然缺乏對應(yīng)的交互功能,。 通過訊飛在發(fā)布會(huì)上的現(xiàn)場演示可以看出,智能語音已經(jīng)能夠理解自然語言中對既有內(nèi)容的修改和翻譯的含義,,而通過對關(guān)鍵字節(jié)的掌控完全能夠?qū)崿F(xiàn)針對特定內(nèi)容的快速定位,,實(shí)現(xiàn)更個(gè)性化智能化聽書的目的。 對于閱讀來說,,這是一種革新式的體驗(yàn),。 智能語音操控,,代替功能應(yīng)用的自然菜單界面指日可待。 |
|