前幾天谷歌舉行了2018年的開發(fā)者大會(huì),展示了很多黑科技,,其中最亮眼的就是AI(人工智能)技術(shù),。 沒有太多虛頭巴腦的“愿景”、“未來”,,也沒有吸引眼球的VR/AR特效玩具,,谷歌直接掏出了非常貼近生活的東西:谷歌語音助手! 谷歌CEO“劈柴哥” 局座在《局座講風(fēng)云人物》節(jié)目中聊過他 “Pichai”正好和漢語拼音對(duì)應(yīng) 所以有了這個(gè)外號(hào) 你可能會(huì)說,,不就是語音助手嘛,,隨便一部手機(jī)都有啊,蘋果有Siri,,微軟有小娜,,安卓陣營的語音助手就更多了,有什么稀奇的…… 語音助手嘛,,平平無奇…… 這個(gè)很常見,,但谷歌用新一代的人工智能系統(tǒng)開發(fā)出了讓人細(xì)思極恐的功能:谷歌AI助手用模擬真人的聲音給理發(fā)店打電話預(yù)約,竟然成功欺騙了接電話的前臺(tái)小姐姐,,成功預(yù)約理發(fā),,小姐姐絲毫沒有察覺給她打電話的是AI! 現(xiàn)場(chǎng)直播打電話 語音通過大音響現(xiàn)場(chǎng)播報(bào) 文字在大屏幕上實(shí)時(shí)展示 這是谷歌AI助手現(xiàn)場(chǎng)打電話給一個(gè)理發(fā)店的真實(shí)場(chǎng)景,,接電話的是真人,。 在通話中,谷歌AI助手不像以往的語音合成那樣發(fā)音機(jī)械而生硬,,谷歌采用了一項(xiàng)名為speech Disfluencies的技術(shù)來讓這些聲音顯得更加自然,,和真實(shí)的人聲幾乎沒有差別,有轉(zhuǎn)折有銜接,,聽起來和人類說話沒有區(qū)別,。 AI詢問店員下周二上午10點(diǎn)到12.00什么時(shí)候有空啊,小姐姐說讓“它”稍后,,要查一下,。 這時(shí)候谷歌AI助手甚至還皮了一下,發(fā)出“嗯哼”這樣的口語詞來回應(yīng),。 AI對(duì)于“唔”,,“嗯”,這樣的不太容易辨識(shí)的模糊音也能夠輕松區(qū)別出來,,而且它還能立刻進(jìn)行邏輯思考,店員反饋10點(diǎn)到12點(diǎn)預(yù)約滿了,,并詢問AI下午有沒有時(shí)間,。 AI沒有接受店員的建議,反而問到:“能給我預(yù)約更早一點(diǎn)的時(shí)段嗎?” 谷歌能做到這一點(diǎn)非常厲害,,簡(jiǎn)簡(jiǎn)單單的一句提問背后是強(qiáng)大的自然語言邏輯處理系統(tǒng),。 舉個(gè)例子:我們生活中常見的聊天、購物等軟件都自帶一些機(jī)器人AI客服,,能回答一些簡(jiǎn)單的問題,,但只限于一個(gè)單一的問題,而且這些低級(jí)AI“智商還不夠”,,無法理解往復(fù)的對(duì)話和支線問題,。 現(xiàn)階段很多打著“人工智能”旗號(hào)的應(yīng)用 其實(shí)還處在“人工智障”(調(diào)侃)階段 圖片來自Kizuna AI,花Q~ 先不談?wù)Z音,、語氣詞和轉(zhuǎn)折銜接等語氣詞都非常像真人,,很多科技公司也能在特定情況下做到這一點(diǎn)。 谷歌AI真正厲害在自然語言邏輯這一塊,,他已經(jīng)可以理解一些簡(jiǎn)單的線性問題,,通俗說就是它和人交流時(shí)候能“記得之前說過的話,記錄信息,,并聯(lián)系上下文提出新的問題或者進(jìn)行回答”,。 就算你在一個(gè)問句里一口氣提兩個(gè)問題,它也能明白你表達(dá)的意思,。店員問AI的名字是什么,,它直接報(bào)上了手機(jī)主人的名字“Lisa”。 整個(gè)過程沒有一點(diǎn)停頓非常流暢,,中間店員小姐姐給了AI很多選擇性的問題以及支線的問題,,但AI全都應(yīng)對(duì)自如,表現(xiàn)與真人無二,。 小姐姐不會(huì)想到她在和機(jī)器人打電話 谷歌的人工智能系統(tǒng)在語音合成,,自然語言邏輯處理方面進(jìn)步實(shí)在太驚人了。 也許你會(huì)質(zhì)疑,,這個(gè)谷歌開發(fā)者大會(huì)展示的AI這么牛,,現(xiàn)場(chǎng)打電話預(yù)約理發(fā),該不會(huì)是提前買通演員造假吧,?安排好劇本提前導(dǎo)演這么一出,。 這樣的擔(dān)心是多余的,現(xiàn)場(chǎng)不光有這次預(yù)約理發(fā),,谷歌AI助理給一些企業(yè)工作人員打了多輪電話,,還給一些中餐館打電話訂餐。 打電話時(shí)候谷歌AI可以熟練自如的使用“aha(啊哈)”這樣的語氣助詞,,電話另一端的客服小哥哥小姐姐絲毫沒有懷疑和他們對(duì)話的是一個(gè)機(jī)器人,。 機(jī)器人先使用語音識(shí)別技術(shù)將語音轉(zhuǎn)文字 看懂文字就懂了你說的是什么 然后邏輯分析怎么回應(yīng)你 最后才是TTS語音合成技術(shù) 成功實(shí)現(xiàn)AI與人類的交互對(duì)話 最有說服力的一點(diǎn)是:谷歌的母公司Alphabet 的新任董事長 John Hennessy 正式宣布,,在商務(wù)預(yù)約領(lǐng)域,Google 的 AI 已經(jīng)通過了圖靈測(cè)試,! 著名的圖靈測(cè)試(The Turing test)由計(jì)算機(jī)科學(xué)之父,、人工智能之父、數(shù)學(xué)家,、邏輯學(xué)家,、艾倫·麥席森·圖靈提出。 測(cè)試者與被測(cè)試者(一個(gè)人和一臺(tái)機(jī)器)相互隔開,,通過一些裝置(如鍵盤,,麥克風(fēng))向被測(cè)試者隨意提問。進(jìn)行多次測(cè)試后,,如果有超過30%的測(cè)試者不能確定出被測(cè)試者是人還是機(jī)器,,那么這臺(tái)機(jī)器就通過了測(cè)試,并被認(rèn)為具有人類智能,。 人類需要做出判斷 回答問題的究竟是AI還是人類 AI的目的就是盡可能迷惑人類 才能通過“圖靈測(cè)試” 一句話概括就是:這個(gè)實(shí)驗(yàn)是用來判斷AI能不能“以假亂真”,,“欺騙人類”。 這也是人類首次在如此商業(yè)化的,,貼近生活的領(lǐng)域通過“圖靈測(cè)試”,,意義重大,堪稱一座里程碑,,人工智能商業(yè)化落地的場(chǎng)景更加清晰,。 雖說人工智能早已滲透進(jìn)生活的方方面面,但技術(shù)不夠成熟,,短板很明顯,,很多領(lǐng)域表現(xiàn)的與真人相差甚遠(yuǎn),甚至還有“人工智障”這樣的笑料,。 新技術(shù),、新概念的發(fā)展歷程如下 從提出理論到重大突破 接著被資本、輿論炒作起泡沫 技術(shù)發(fā)展遇到瓶頸,,支撐不起泡沫 泡沫破裂,,人們被區(qū)塊鏈等“新名詞”吸引走 新技術(shù)回歸理性,被用在更加實(shí)用的的場(chǎng)景 技術(shù)再次出現(xiàn)重大突破,,概念逐漸走向成熟 市場(chǎng)化,、規(guī)模化,、白菜價(jià),,變成老技術(shù) 之前大火的VR/AR技術(shù)也是這樣,還處在低谷期,,而人工智能技術(shù)已經(jīng)走到復(fù)蘇期,,慢慢走向成熟,,至于最近比較火的區(qū)塊鏈技術(shù),算是處在過熱泡沫期~ 谷歌最新的AI技術(shù)展示放出大招,,在科技界扔下一枚重磅炸彈,也給我們敲響警鐘:人工智能技術(shù)上美國的先發(fā)優(yōu)勢(shì)非常明顯,,那么中美差距有多大,? 之前牛津大學(xué)發(fā)布了一份AI領(lǐng)域的報(bào)告,首次提出了“國家AI潛力指數(shù)(AIPI)”這一概念,,主要考察四個(gè)領(lǐng)域:硬件,、數(shù)據(jù)、算法和商業(yè),,以此來衡量一個(gè)國家在AI方面的綜合實(shí)力,。 在這份報(bào)告中,中國目前的總體AI實(shí)力實(shí)際僅約為美國的一半,,我們還有很長的路要走,。 圖片來自經(jīng)濟(jì)學(xué)人 美國對(duì)中國AI實(shí)力的高速增長憂心忡忡,生怕失去領(lǐng)先地位,。就在上周,,白宮宣布成立一個(gè)人工智能特別委員會(huì),負(fù)責(zé)就人工智能問題向總統(tǒng)和聯(lián)邦政府提出建議,。 對(duì)于中美來說,,發(fā)展AI都已經(jīng)上升到戰(zhàn)略高度,AI在國防領(lǐng)域發(fā)揮的作用也越來越明顯,,成為兵家必爭(zhēng)之地,。我們既要看到和美國的差距,更要下定決心迎頭趕上,,這一領(lǐng)域也是彎道超車的絕佳賽道之一,,讓我們拭目以待。 |
|