在微軟位于華盛頓州雷德蒙德的總部,,薩蒂亞·納德拉(Satya Nadella)風(fēng)風(fēng)火火地走進(jìn)會議室,,急切地想要跟筆者聊一聊智能技術(shù)話題。這位首席執(zhí)行官正滔滔不絕地介紹微軟在開發(fā)智能應(yīng)用和服務(wù)方面的進(jìn)展,。納德拉告訴我,,他每天早晨都會戴上自家的HoloLens全息眼鏡,查看投射在墻壁上的虛擬交互式日程表,。這套系統(tǒng)智能化,、高效率,而且充滿未來感,。納德拉希望微軟在他的領(lǐng)導(dǎo)下也能具備這些特點(diǎn),。納德拉說,不管我們未來在哪里工作,,微軟都將在其中占據(jù)一席之地,。該公司今年3月發(fā)布的“對話即平臺”戰(zhàn)略就代表了一種押注,,那就是以會話為基礎(chǔ)的界面將取代應(yīng)用程序,,成為我們主要的網(wǎng)絡(luò)交互方式,從查詢信息,、購物,,到訪問一系列服務(wù),莫不如是,。另外,,得益于微軟開發(fā)的認(rèn)知型應(yīng)用程序界面(API),應(yīng)用程序?qū)⒆兊酶又悄?,它們將能理解照片和視頻中的面孔,、情緒和其他信息。微軟認(rèn)為,它擁有最聰明的“大腦”來創(chuàng)建一個(gè)由人工智能驅(qū)動(dòng)的未來,,這源于近20年來它在機(jī)器學(xué)習(xí)和自然語言處理領(lǐng)域所取得的進(jìn)步,。得益于在中國進(jìn)行的一項(xiàng)早期實(shí)驗(yàn),微軟率先打造了能夠與用戶產(chǎn)生情感共鳴的軟件機(jī)器人,。它還發(fā)布了第一個(gè)基于文本的聊天界面平臺——對這家在很大程度上錯(cuò)過智能手機(jī)革命的公司來說,,這是一件值得驕傲的事情。在移動(dòng)戰(zhàn)場失利后,,微軟能打贏下一場戰(zhàn)爭嗎,?今年上半年,大大小小的科技公司都加大了對軟件機(jī)器人的研發(fā),。Facebook開放了自家的一個(gè)軟件機(jī)器人開發(fā)平臺,,它可以在該公司的聊天應(yīng)用Messenger上運(yùn)行。谷歌則發(fā)布了運(yùn)行在通訊類應(yīng)用程序Allo內(nèi)部的新智能助理,,同時(shí),,它還發(fā)布了名為Home的智能硬件,試圖與亞馬遜智能音箱Echo一較高下,。與此同時(shí),,Echo的語音輸入技術(shù)令開發(fā)者癡迷不已,據(jù)稱Echo已入駐300萬戶家庭 ,,并通過自己的API習(xí)得1200項(xiàng)新“技能”,。微軟對其在人工智能方面的成績感到自豪,并希望對外傳遞一種信號:從歷史上看,微軟對技術(shù)發(fā)展方向的判斷一向很準(zhǔn)確,。舉例來說,,它很早就看到了智能手機(jī)和平板電腦的潛力,,遠(yuǎn)在競爭對手之前。對于微軟在人工智能方面的努力,一個(gè)揮之不去的問題是:憑什么這一次就能成,?微軟人工智能首次成為中國電視臺的天氣預(yù)報(bào)員在開發(fā)軟件機(jī)器人方面,,微軟取得的成功可能已超過了其他任何一家美國公司。 2016年1月,,微軟的人工智能產(chǎn)品出現(xiàn)在了中國東方衛(wèi)視的早間新聞節(jié)目中,,當(dāng)時(shí)新聞主持人把電視畫面切給了氣象預(yù)報(bào)員“小冰”。只見在一個(gè)虛擬講臺前漂浮著一個(gè)跳動(dòng)的圓圈,,圓圈中的面孔變成了一個(gè)麥克風(fēng)圖像,,小冰用溫柔的女聲播報(bào)了天氣,甚至回答了主持人的一個(gè)問題,。 我們找到了一種有著全新工作方式的軟件機(jī)器人,,這種工作方式能夠充分激發(fā)對話的潛能。如果你想知道微軟為何如此看好軟件機(jī)器人,,看看小冰就清楚了,。“不敢說我們已經(jīng)開發(fā)出“殺手級”的軟件機(jī)器人,但至少我們做出了一種有著全新工作方式的軟件機(jī)器人,,這種工作方式能夠充分激發(fā)對話的潛能,。”德里克·康奈爾(Derrick Connell)說道,,他是微軟搜索引擎必應(yīng)的搜索技術(shù)負(fù)責(zé)人,。2014年,微軟在微信平臺上推出了小冰,,它能夠回答簡單的問題,,和微軟的虛擬助理Cortana很像。它被設(shè)定為對情緒敏感,而且能夠記住以前的聊天記錄,。分手了,?小冰可能會主動(dòng)過來關(guān)心你。上線三天后,,小冰在微信上被添加到了150萬個(gè)聊天當(dāng)中,。之后,小冰登陸新浪微博,,在那里成為最具人氣的名人賬號之一,。如今,這個(gè)軟件機(jī)器人的使用者已經(jīng)超過4000萬,,而平均算下來,,使用者與機(jī)器人之間的對話達(dá)到了26個(gè)回合,,著實(shí)表現(xiàn)不俗,。對康奈爾來說,小冰指明了通向下一代搜索界面的道路,。傳統(tǒng)的網(wǎng)頁搜索會呈現(xiàn)出列表式的藍(lán)色超鏈結(jié)果頁面,;而完美的對話機(jī)器人可以直接給出正確答案,。當(dāng)然,微軟在中國的成功可能無法復(fù)制到美國,。小冰誕生兩年后,,我們?nèi)匀粵]有看到一個(gè)能講英語的“小冰”,而且近期也不會有這樣的軟件機(jī)器人問世,。但微軟高管們表示,,小冰背后的基礎(chǔ)設(shè)施代表著微軟的巨大機(jī)遇。 我們希望它成為一個(gè)生態(tài)系統(tǒng),。“這就是現(xiàn)代化的時(shí)代——你不需要成為語言理解方面的專家,。”康奈爾說,,“使用我們的工具就行了,。你可以利用我們的工具創(chuàng)建自己的軟件機(jī)器人,然后把它置于任何平臺——可能是Slack,,也可能是Facebook Messenger,。我們希望是Skype或Windows,但選擇權(quán)在你,?!?/span>如今開發(fā)者越來越擔(dān)心,圍繞軟件機(jī)器人的不同標(biāo)準(zhǔn),,各公司之間可能變得火藥味十足,,然而微軟卻一反常態(tài),玩起了外交手腕,。今年6月,,該公司在舊金山舉辦了Botness大會,旨在促進(jìn)軟件機(jī)器人開發(fā)者之間的合作,。“我們真心希望它能夠具有互操作性——我們希望它成為一個(gè)生態(tài)系統(tǒng),。”微軟高級工程師程麗麗(音)說道,,她參與組織了這場為期兩天的活動(dòng),。“它更像是,,在我們發(fā)現(xiàn)的問題和挑戰(zhàn)中,,有哪些是可以合作解決的?”但是,,通過舉辦這樣的活動(dòng),,微軟希望自己能在軟件機(jī)器人浪潮中占據(jù)核心位置。如果成功了,,它就能能夠在移動(dòng)時(shí)代擁有一個(gè)新的開始,。由微軟提供支持的軟件機(jī)器人可能出現(xiàn)在全球各個(gè)熱門通訊類應(yīng)用中,,從而幫助微軟在新世界中占據(jù)優(yōu)勢。當(dāng)然,,試圖為下一代計(jì)算技術(shù)打造主導(dǎo)性平臺的并非只有微軟一家,。每一家大型科技公司和許多初創(chuàng)企業(yè)都設(shè)立了人工智能部門,并取得了驕人的成果,。不過值得一提的是,,在各公司之間橫向比較人工智能是非常困難的,甚至可以說,,是不可能的,。像谷歌、Facebook,、亞馬遜這樣的公司,,它們的大部分工作并未公開。當(dāng)這些公司的高管被問到各自的人工智能有何獨(dú)門絕招時(shí),,他們往往都是顧左右而言他,,比如谷歌首席執(zhí)行官桑德爾·皮查伊(Sundar Pichai)只是簡單地表示,谷歌在這個(gè)領(lǐng)域已經(jīng)做了“很長時(shí)間”,。風(fēng)投公司安德森-霍洛維茨基金(Andreessen Horowitz)的未來學(xué)家本尼迪克特·埃文斯(Benedict Evans)在最近的一篇博客文章中表示,,人工智能的未來仍然不明朗。“這個(gè)領(lǐng)域的發(fā)展是如此之快,,以至于我們無法輕易斷言哪些技術(shù)必將成為最明顯的優(yōu)勢,,也說不清哪些東西將實(shí)現(xiàn)商品化,以及最大的不同之處是什么,?!八麑懙溃半m然關(guān)于這些技術(shù)的主要研究正在穩(wěn)步推進(jìn),,并實(shí)現(xiàn)開源,,但應(yīng)用起來并不簡單——這些技術(shù)還不一定能實(shí)現(xiàn)商品化?!?/span>每一家大型科技公司都在為這場戰(zhàn)役做準(zhǔn)備陸奇很愿意為微軟的競爭優(yōu)勢提供依據(jù),。作為微軟的高管,他負(fù)責(zé)公司的應(yīng)用程序和服務(wù)工程部,。陸奇也是一位計(jì)算機(jī)科學(xué)博士,,名下?lián)碛?0項(xiàng)技術(shù)專利。陸奇盤點(diǎn)了移動(dòng)互聯(lián)網(wǎng)第一波浪潮呈現(xiàn)的不利局面,,以此開啟了話頭,。他說,到現(xiàn)在為止,,移動(dòng)設(shè)備在網(wǎng)絡(luò)流量中的占比還沒有超過桌面設(shè)備,,這說明移動(dòng)設(shè)備的用戶體驗(yàn)并不好?!拔覀冎?,網(wǎng)絡(luò)并沒有真正在手機(jī)上發(fā)揮好?!标懫嬲f,。除了少數(shù)幾大類應(yīng)用之外,用戶并不樂意在手機(jī)上下載各種雜七雜八的應(yīng)用,。比如他們并不會為了一年也坐不上幾次的輪渡而去專門下載一個(gè)票價(jià)查詢app,。毫無疑問,肯定存在一種更好的模式,。 業(yè)界還沒有找到一個(gè)能充分釋放移動(dòng)和云計(jì)算全部價(jià)值的體驗(yàn)平臺,。”陸奇說,,“從根本上說,,應(yīng)用程序并不是正確的模式。應(yīng)用程序是作為替代HTML網(wǎng)頁的界面而興起,,因?yàn)樗鼈兪俏覀冊谀莻€(gè)時(shí)候所能想出的最好方案,。在過去技術(shù)條件下,對著手機(jī)呼喊并不能夠讓它為你呈現(xiàn)出想要的互聯(lián)網(wǎng)內(nèi)容,,所以開發(fā)者構(gòu)建了復(fù)雜的隱秘管道系統(tǒng),,讓你可以通過豆腐塊一般的圖形按鈕與之交互。而且,,這些按鈕仍然是解決很多問題的最有效途徑,。不過,得益于自然語言處理技術(shù)的進(jìn)步,,現(xiàn)在你真的可以通過大聲呼喊,,讓手機(jī)呈現(xiàn)你想要的網(wǎng)絡(luò)內(nèi)容。陸奇表示,,下一代“體驗(yàn)平臺”將以對話的形式起步,,因?yàn)樗N近人類的行為方式。如果操作成功,,你可以隨時(shí)退回去使用那些按鈕,。“我們看到,,有很多解決方案都使用語言作為基礎(chǔ),,但同時(shí)也會以一種周到和有意義的方式對圖形交互加以利用,以此來提升用戶體驗(yàn),?!彼f,。把所有資產(chǎn)拼合在一起,你就能看到微軟為何會如此樂觀但陸奇表示,,若要取勝,,一家公司需要五大“關(guān)鍵資產(chǎn)”。第一個(gè)是所謂的“對話平臺”——人們大量交談和收發(fā)大量信息的地方,。在這方面,,微軟擁有Office、Outlook,、Skype,、Cortana。第二個(gè)就是人工智能“大腦”——一個(gè)復(fù)雜的心理模型,。微軟表示,,他們的人工智能研究可以追溯到近20年前。第三個(gè)是對社交圖譜的訪問權(quán)限——人們在互聯(lián)網(wǎng)上的活動(dòng)往往涉及他們的朋友和同事,。就在筆者采訪陸奇幾天后,,微軟宣布斥資262億美元收購擁有4.33億用戶的LinkedIn。第四個(gè)是可供人工智能運(yùn)行的平臺,。對此,,微軟有Windows和一系列家用設(shè)備(尤其是Xbox)。最后一個(gè)是開發(fā)者網(wǎng)絡(luò),,他們急切地想在你的平臺上開發(fā),,并愿意為特殊權(quán)限向你付費(fèi)。單獨(dú)來看,,微軟的各項(xiàng)資產(chǎn)都面臨著強(qiáng)大的競爭對手,。比如,憑借一系列通訊類應(yīng)用,,F(xiàn)acebook可以說掌握著更強(qiáng)大的對話平臺,;當(dāng)然該公司的社交圖譜也是最大的。谷歌的“大腦”可能更加智能,,而且該公司可以接入數(shù)以億計(jì)的安卓設(shè)備,。但把所有資產(chǎn)拼合在一起,你就能看到微軟為何會如此樂觀,。陸奇說,,“把這些資產(chǎn)結(jié)合起來看,我認(rèn)為,,我們掌握著引領(lǐng)未來的條件,。”在兩年前的首屆Code大會上,微軟對人工智能的重視開始變得明顯,。當(dāng)時(shí),,擔(dān)任首席執(zhí)行官才剛剛?cè)齻€(gè)月的納德拉登上講臺,談?wù)撈鹞④浀奈磥怼?/span>講話結(jié)束前,,他展示了Skype的一項(xiàng)新功能,。兩名微軟員工在臺上講話——一個(gè)講英語,另一個(gè)講德語——Skype為他們進(jìn)行了實(shí)時(shí)翻譯,,讓他們繞開語言障礙進(jìn)行交流,。那是一段令人印象深刻的演示——納德拉宣布,,到年底時(shí),,它將正式投入使用。對Skype團(tuán)隊(duì)來說,,納德拉給出的時(shí)間表不啻為一顆重磅炸彈,。“我完全沒有想到?!蔽④浹芯吭浩髽I(yè)事務(wù)副總裁彼得·李(Peter Lee)說,,“薩蒂亞真的用Skype Translator把我們套牢了?!?/span>最初,,這支團(tuán)隊(duì)面臨著兩大問題。第一,,微軟研究院從未肩負(fù)過把產(chǎn)品推向市場的任務(wù),,研究人員擔(dān)心,他們追求科研突破的自由突然之間變少了,。 薩蒂亞真的用Skype Translator把我們套牢了,。第二,在進(jìn)行那段演示時(shí),,Skype Translator并不十分出色,。微軟的語言模型是基于大量正式語言開發(fā)的——比如聯(lián)合國的聲明。然而,,Skype需要翻譯的那種雙向交流有著很大的不同,。這種交流中會有更多的“不流利”,說話人出口忘詞,,或者把話重頭說一遍,。另外還有“代碼混合”的問題,也就是說話人在一句話中使用多種語言,,這在英語之外是非常普遍的現(xiàn)象,。再有就是唱歌,人們喜歡用歌聲來表達(dá)情感,而事實(shí)證明,,計(jì)算機(jī)很難對歌聲進(jìn)行解析,。“基本上,哪一樣都不行,?!崩钫f,“我們不得不重新訓(xùn)練所有的模型,?!?/span>不過,在納德拉的動(dòng)員下,,李的團(tuán)隊(duì)也是拼了,。他們在當(dāng)年12月發(fā)布了一個(gè)預(yù)覽版。次年,,這款產(chǎn)品變得普及,,并且免費(fèi)使用。李贊許地把納德拉稱為“激進(jìn)分子”,,他說這個(gè)項(xiàng)目是令人振奮的——最終的確如此,。“想象一下,當(dāng)你意識到這東西一無是處時(shí),,那種士氣的低沉和害怕——你必須帶領(lǐng)團(tuán)隊(duì)挺過去,。”李說,,“一旦你做到了,,你會看到一些了不起的新東西?!?/span>微軟現(xiàn)在可以在8種不同語言之間互譯,也就是有56種不同的組合,,其基礎(chǔ)技術(shù)的影響已經(jīng)超越了翻譯,。你知道微軟正在開發(fā)一款極其實(shí)用、甚至堪稱神奇的軟件機(jī)器人嗎,?這款軟件已經(jīng)在進(jìn)行測試,,它能記錄商業(yè)會議并實(shí)時(shí)生成文稿,還能記錄兩人之間的音頻采訪,,并在生成文稿時(shí)區(qū)分不同的講話者——這可能是所有新聞?dòng)浾叨甲钕胍囊豁?xiàng)技術(shù),。“當(dāng)我們開始著手卻發(fā)現(xiàn)Skype Translator無法正常工作時(shí),當(dāng)時(shí)的沮喪之情溢于言表,?!崩钫f,,“但我們克服了困難,我們已經(jīng)掌握了這些語言和翻譯模型,,尤其是語言模型,,它們棒極了?!?/span>與此同時(shí),,微軟正把人工智能資源注入到旗艦產(chǎn)品Windows和Office中。人工智能的一項(xiàng)潛力就是,,它能夠預(yù)測你的需求——這正是Google Now的基本理念,,它可以在你解鎖手機(jī)時(shí)向你呈現(xiàn)交通、天氣和體育比賽賽況,。Cortana的研發(fā)負(fù)責(zé)人馬庫斯·阿什(Marcus Ash)向我展示了一個(gè)仿制版的Windows,它對大量基于云端的推測(即用戶可能想要知道的東西)加以利用,。當(dāng)阿什訪問“開始”菜單時(shí),,Cortana提供了一系列操作建議:對用戶有意義的名字,,最近使用過的文檔,,以及常見法語單詞翻譯(演示假定的用戶即將進(jìn)行一趟旅行)。經(jīng)過你的授權(quán)之后,,Cortana可以把你的聯(lián)系人,、網(wǎng)絡(luò)搜索歷史以及應(yīng)用程序使用情況整合到它的建議中。 論性感程度,,它比不上那種可以預(yù)測你每一種需求的通用型人工智能——但它現(xiàn)在就觸手可得而且,,它可以根據(jù)一天中的不同時(shí)間段做出調(diào)整,比如,,應(yīng)用開發(fā)者可以示意自己的應(yīng)用在早晨或飯點(diǎn)很有用,。“利用對話以及關(guān)于用戶的語境信息,在用戶的授權(quán)之下,,讓用戶變得更有效率以及更有控制感,,這種想法是真正讓我們感到興奮的東西?!卑⑹舱f,,“我們在改善用戶體驗(yàn)上的很多工作都是圍繞簡化、消除摩擦以及展現(xiàn)智能力量來進(jìn)行的,?!?/span>在得到你的授權(quán)后,,Outlook可以記下老板要求你在周末前向她發(fā)送某件東西的事情——如果你沒有做出回應(yīng),,它會向你發(fā)出提醒。阿什說,“我的生活十分繁雜,,所以常常忘事,,尤其是電子郵件里的事?!彼f,,自己最近就忘了回復(fù)上司的工作要求,還好Cortana及時(shí)提醒了他,。當(dāng)我見到負(fù)責(zé)Office企業(yè)市場營銷的副總裁柯克·柯尼斯鮑爾(Kirk Koenigsbauer)時(shí),,我了解到更多這樣的事情。他向我展示了很多例子,,讓我看到人工智能可以讓Office變得更好用,。2014年9月,微軟推出了Delve,,并將其整合到Office 365中,。這款應(yīng)用可以分析你在處理電郵和開會上花了多長時(shí)間,并在日歷上突出顯示你延長了哪些時(shí)間段來從事更復(fù)雜和更有意義的工作,。它還可以告訴你,,在你發(fā)出的郵件中,有多少收件人真正閱讀了郵件,,以及他們的閱讀速度如何,。當(dāng)你跟某些同事有段時(shí)間沒聯(lián)系時(shí),它會建議你聯(lián)絡(luò)感情,。要找到這種有用的信息,,你不必成為精通數(shù)字的大神。如果你是一位管理人士,,Delve可以一目了然地顯示,,你在過去一周和每名下屬各自待了多長時(shí)間。說到吸引眼的球程度,,這種類型的智能或許比不上那種可以預(yù)測你每一種需求的通用型人工智能,,但它現(xiàn)在就觸手可得,并且效果還不錯(cuò),。 在花了六個(gè)月搜尋“殺手級”軟件機(jī)器人之后,,我仍然看好這一概念。 它們所實(shí)現(xiàn)的交互要比客服電話和無人問津的小企業(yè)網(wǎng)站豐富得多,,而且也必將取代它們,。但是,對于在Facebook Messenger和Telegram這些平臺看到的大部分東西,,我感到失望:有時(shí)候,,它們感覺就像是使用互聯(lián)網(wǎng)的最慢方式,。它們大多數(shù)的功能都比AOL Instant Messenger上的SmarterChild聊天機(jī)器人強(qiáng)不到哪兒去,而它們所要求的手動(dòng)輸入更是常常把我逼回到滿是按鈕的圖形界面,。眼下,,推動(dòng)人們對軟件機(jī)器人和人工智能進(jìn)行討論的,并不是消費(fèi)者對業(yè)界的期望,,而是業(yè)界想要打造出新平臺來賺錢的迫切心態(tài),。當(dāng)軟件機(jī)器人置身后臺,它們的表現(xiàn)或許會讓你感到不可思議迄今為止,,各公司對這個(gè)問題的反應(yīng)基本上都是:他們正在努力解決,。“就像很多先進(jìn)技術(shù)一樣,人們以為它們?nèi)缃穸家褜?shí)現(xiàn),?!盕acebook首席技術(shù)官麥克·斯科洛普夫(Mike Schroepfer)說,“還有大量技術(shù)有待開發(fā),,大量工作有待去做,,我認(rèn)為這會逐年逐月得到改進(jìn)?!?/span>然而,,造訪微軟讓我不禁想問,我會不會一直以錯(cuò)誤的方式在思考這個(gè)問題,。基于對話的界面通常是乏味的,,但為它們提供支持,、已被用于日常工具的機(jī)器學(xué)習(xí)技術(shù)卻是異常強(qiáng)大,。如果微軟可以把類似于Delve的智能融入到更廣泛的服務(wù)中,我們就可以有理有據(jù)地說,,它提供的生產(chǎn)力工具組合是世界上最強(qiáng)大的,。那里將蘊(yùn)藏著巨大的價(jià)值,即便微軟構(gòu)建大型平臺為聊天機(jī)器人提供支持的愿景沒有實(shí)現(xiàn),。這可能真的無法實(shí)現(xiàn)——在尚處于技術(shù)早期的現(xiàn)階段,,位于前臺的軟件機(jī)器人往往給人一種愚不可及的感覺。但是,,當(dāng)軟件機(jī)器人置身后臺,,它們的表現(xiàn)或許會讓你感到不可思議。
|