一文讀懂蘋果和Google的人工智能理念、布局和預期 趙賽坡 | 2016-07-29 08:45 微軟,、亞馬遜,、Facebook 的人工智能計劃都與 Google 類似;而堅守「隱私價值觀」與「設備智能」 的蘋果,,似乎并沒有同盟者,。 在科技及互聯網領域,蘋果和 Google 是兩家絕對繞不開的話題公司,。我曾經不止一次說過,,中國科技(自)媒體常年不斷地唱衰蘋果、意淫 Google( Google 回歸中國)。 前者長期以來由神一般的喬布斯掌舵,,用一次次的「 One more thing」讓整個世界不斷尖叫,;而后者,則在本世紀的前 15 年里,,不僅改寫了互聯網和移動互聯網的發(fā)展軌跡,,也正在為不遠的將來描繪了一幅「美麗新世界」的愿景。 如今,,兩家公司正邁入一個新戰(zhàn)場:人工智能,。本文將從兩家公司現有的商業(yè)模式和產品線的角度出發(fā),探討現階段以及未來可預見的時間內,,蘋果與 Google 在人工智能——這個熱門詞匯背后的理念,、布局以及預期。 智能手機時代:蘋果與 Google 的路線之爭如果沒有 2007 年 1月份喬布斯拿出 iPhone 時的驚艷亮相,,由智能手機引領的移動互聯網又會是個什么模樣呢?答案或許有很多,,但有一個主角或許不會缺席,,這就是 Google。 當喬布斯站在 Mac World 大會上展示這個重新定義了手機,、音樂播放器與互聯網設備的時候,,時任 Google Android 部門負責人的安迪魯賓正在前往拉斯維加斯的路上。在他看完喬布斯的發(fā)布會后,,他甚至對車里的一個同事說:「 我們可以不必發(fā)布自己的手機了,。」 蘋果用天才般的設計和強大的制造能力讓第一臺 iPhone 更像是一個工藝品,,而不是一臺像他們早期宣揚的「跨時代的計算設備」,。第一代iPhone 不支持 3G 網絡,沒有多任務運行機制,,甚至無法復制粘貼文字,。對很多人來說,這僅僅是臺炫酷的設備,,絕不是一臺好用的設備,。 在 Android 之父魯賓看來,iPhone 還不夠酷,,他的夢想是讓全球各國不同運營商,、不同品牌的手機上運行自己的系統?;谶@個理念,,Google 在 2007年 建立「Android手機聯盟」,將多個運營商和手機廠商拉攏在一起,,他們分工很明確,,Google 負責操作系統,,手機商制造手機,運營商負責銷售,。 過去的七八年時間里,,蘋果與Google 走上了兩條不同的發(fā)展路徑,一個以一部部 iPhone 征服了世界,,另一個則通過Android 系統,、Google Mobile Service 和日益壯大的手機廠商不斷搶占智能手機的份額。下面是截止到 2016 年 5,、6月的統計數據,,Gartner 的數據顯示 Android 和 iOS 瓜分了當下的移動互聯網操作系統市場份額,兩家的比例大概是 7:3: 另一份來自調研公司 Kantar Worldpanel ComTech 的數據,,在截至今年4月底的前3個月,,Android在歐洲五個最大市場(英國、德國,、法國,、意大利和西班牙)的智能手機銷量市場份額為76%,與去年同期的70.2%相比增長5.8個百分點,。 操作系統市場份額當然無法完全說明問題,。蘋果借助 iPhone 的銷量,成為世界上最賺錢的公司之一,,有媒體曾將蘋果比喻成「數字時代的石油公司」,,其市值曾一度接近一萬億美元。 在最新一季蘋果 13 年來最差的財報里,,來自 iPhone的收入支撐了本財季蘋果總收入的半壁江山(季度總收入為 424 億美元,,iPhone 收入超過 210 億美元)。蘋果的官方數字還顯示,,自 2007 年到現在的 9 年時間,,蘋果已經累計賣出了 10 億臺 iPhone 手機。 Google 從未透露過在Android 上賺取了多少錢,,不過根據甲骨文律師在 Java 侵權訴訟中的估計,,Android 已經為Google 帶來 310億 美元的收入,利潤則高達 220億美元,。 無論是技術還是產業(yè)趨勢來看,,智能手機都是「計算」的進化,從人人一臺 PC 演進到人人一部手機甚至多部手機,,硅谷風險投資 a16z 合伙人Benedict Evans 曾用 76 張 PPT 展示智能手機對于世界的顛覆,,下面兩幅圖展示了智能手機在整個智能設備領域的巨大影響: 人工智能是新一代的人機交互細心去看,科技的發(fā)展史也是人機交互的歷史,而人工智能發(fā)展的路徑同樣隸屬在人機交互的發(fā)展歷程里,。6 月初,,「互聯網女皇」 Mary Meeker 的互聯網趨勢報告中有一副圖展示了人機交互的歷史:
人工智能的進化是機器越來越聰明的的過程,所謂的「聰明」,,體現在人機交互過程中,,計算機越來越少地問你問題,比如,,現在的計算設備,,比如手機已經不會再問:
但也有一些新的問題出現:
上述問題的變化更像是從簡單的「yes/no」的二元回答轉向更多元的回答,,這背后就是計算的改進,。從這個角度出發(fā)去觀察蘋果與 Google 在人工智能領域的歷史、現狀與未來,,有助于從根本上建構對于蘋果,、Google 以及人工智能現狀的新理解,。 蘋果的「設備智能」2016 年的蘋果開發(fā)者大會( WWDC )有諸多值得回味的點,,從中可以一窺蘋果在人工智能方面的思考。長期以來,,蘋果對于人工智能的定位都是「設備智能」——這是一種將人工智能技術納入到硬件的處理方式,,從最早的 Siri 到現在的 iOS 10 里的圖片自動識別和分類機制,事實上,,蘋果的識別和分類技術并不差,,2015 年 9 月,蘋果收購人工智能初創(chuàng)公司 Perceptio,,該公司可以在無需外部數據庫的情況下,,基于設備(手機、平板)來進行圖像分類,。 新 iOS 10 的照片應用可以自動識別人臉,、物體,并能夠相冊里的人物自動分類,,新加入的「回憶」,,則可以通過對照片的位置信息、人臉照片信息、場景信息等聚集在一起,,還支持插入音樂,。與此同時,開發(fā)者還在 iOS 10 測試版中發(fā)現了關于人臉識別功能的其他信息,,比如大量關于人臉表情的代碼,,包括微笑、驚恐,、驚喜,、哭泣、沉思等等,,這意味著 iOS 10 未來很可能支持識別照片里人物的表情信息,。
蘋果將上述功能加入到一臺運行 iOS 10 的iPhone 中實屬不易,要知道類似的功能在 Google 與微軟那里,,都是通過云端數據處理后的返回結果,。蘋果之所以采用這種方法既有歷史原因,也有諸多現實考量,。歷史上看,,喬布斯時代的蘋果對人機交互有著異常的堅持,比如 iOS 曾經異常的簡潔性——這也意味著毫無選擇性的交互方式,。喬布斯也曾表示,,如果他來做一款 DVD,那么唯一的按鈕就是「燒錄」,,其他都可以舍棄,。正是這樣對于簡潔性的追求,使得蘋果的產品線長期以來在功能上的變化都極其克制,。 喬幫主已仙逝多年,,iOS 自 iOS 7 開始在交互上開始復雜,但將人工智能納入到蘋果產品的過程依然十分緩慢,,擺在蘋果面前的現實問題有兩個,,其一,,蘋果的云服務不如 Google 和微軟,至今蘋果 iCloud 的服務還有一部分跑在亞馬遜 AWS 上,這也使得蘋果無法像Google 微軟那樣通過云端強大的處理性能來處理照片分類,、語音識別等,。 其二,,蘋果長期以來的價值觀就是對用戶隱私的保護,。以虛擬助理來說,Siri 早在 2011 年就已經發(fā)布,,但比起 Google Now,、微軟的 Cortana 來說,,Siri 真的很不智能,原因就在于Siri對于用戶數據的收集非常少,,而另外兩家公司的產品則有點「貪得無厭」,,尤其是Google,默認的用戶協議里,,Google 可以收集用戶幾乎所有的為其所用,。 尤其是在 2015 年 Google 發(fā)布頗具里程碑意義的 Google Photo 之后,蘋果 CEO 庫克在接受媒體采訪時公開表示:
但另一個現實則是,,時下流行的深度學習,,迫切需要海量數據的「喂養(yǎng)」,同樣在今年 WWDC 大會上,,蘋果要重新定義「大數據」,,正式啟動蘋果的「Differential Privacy」,這個概念由微軟的C. Dwork 提出,,其基本含義就是基于統計學原理,,在一個群體層面收集數據,而非像FB,、Google 那樣收集個體的數據,。由于蘋果的 iMessage、 FaceTime 早已部署了端到端的加密技術,,因此能夠讓用戶數據以加密的方式上傳到蘋果的服務器,,然后蘋果在對于這些群體層的數據進行分析和優(yōu)化,,從而改善用戶的體驗,。 「Differential Privacy」將在今年秋天的蘋果各個設備新系統中采用,具體會給 iOS ,、macOS,、watchOS 帶來哪些真正意義的改觀還無從知曉,但在另一個重要領域——語音領域,,蘋果則把一副好牌打成了爛牌,。 Siri 與人才之痛作為喬布斯生前收購的最后一家公司,Siri 肩負著喬布斯對于未來交互模式的遠見思考,。正如 Meeker 在人機交互歷史回顧中展示的那樣,,幾百萬年前,,人類從聲音的交互開始,而文字的發(fā)明,,則讓交互從聲音轉入文本階段,,于是出現了各種與文本打交道的交互工具。即便如此,,人類交流中的 90% 依然還是通過聲音來完成,,這種更自然也更原始的交互模式在過去半個世紀里并未得到突破性的進展。 自動語音識別(Automatic Speech Recognition ,,簡稱ASR)是一種機器可識別人類說話單詞的能力,。很長一段時間里,ASR 在準確度上都無法與人類識別相媲美,,而在 2010 年,,ASR 在識別準確度上迎來一個拐點。 從上圖的變化可以看出,,2010—2015的五年時間,,ASR 準確度得到大幅提升,這種變化超過了過去 30 年到 40 年的變化,。事實上,,我們現在已經接近一個時刻:機器對于語音的識別能力即將超過人類。 喬布斯看到了基于聲音的交互才是人類天性的體現,,而技術進步則幫助人類重新回到了最原始的聲音交互時代,。Siri 在這種情況下成為蘋果布局聲音交互的重要產品,當時,,喬布斯曾被問到收購 Siri 是否想與Google 競爭搜索業(yè)務,,喬布斯給出的答案很明確:Siri 不是搜索產品,他們要做人工智能,。 只可惜,,喬布斯并未看到搭載 Siri 的第一部 iPhone—— iPhone 4S 的發(fā)布儀式。彼時,, Siri 給世界帶來的驚喜隨著一次次的惡作劇般的調侃趨于平淡,,人們突然發(fā)現,Siri 幾乎沒有任何用處,。她(他/它)常常答非所問,,又經常無故跳出(不小心長按 home 健)…..另一方面,,自喬布斯逝世后,,原來的Siri 團隊核心成員幾乎都離開了蘋果,包括 Siri 早期開發(fā)者的 Dag Kittlaus 和Adam Cheyer 等人又創(chuàng)立了一家 Viv 的公司,,其產品可以理解為新一代的 Siri,。 如喬布斯當年所言,,語音交互正在成為人工智能最有可能爆發(fā)的領域??纯词忻嫔系目萍脊緜?,亞馬遜、微軟以及 Google ,、Facebook,,無一不在這個領域發(fā)力。蘋果也推出了應對之策,。 2015 年 10 月開始收購了英國語音技術初創(chuàng)企業(yè)VocalIQ,,這家公司一直以可實現機器自我學習著稱;其次,,蘋果在今年開發(fā)者大會上進一步開放 Siri ,,開發(fā)者可以在 iOS 應用里直接調用 Siri 的借口來實現語音識別、搜索的功能,,考慮到 Siri 和搜索已經成為 iOS 10 無處不在的功能模塊,,未來不排除越來越多開發(fā)者在應用里加入 Siri ;第三,,全平臺的 Siri 或許才有價值,,下一代 macOS 即將配置 Siri ,未來的 Apple Car 的交互設計中,,Siri 將擔當核心角色,。 然而不管是不斷優(yōu)化的設備智能和對 Siri 的強化訓練,蘋果在人工智能人才,、論文方面也面臨諸多挑戰(zhàn),。有媒體盤點過 2015 年蘋果的挖人名單:
上述幾位除了Jonathan Cohen 之外都與秘密研發(fā)的 Apple Car 有關,。2015年9月,,蘋果罕見發(fā)布招聘廣告,大規(guī)模招募人工智能和機器學習方面的人才,。路透社去年援引艾倫人工智能研究所 CEO,、華盛頓大學教授 Oren Etzioni 的話表示,在招募機器學習人才方面蘋果的起步較慢,,不過蘋果正試圖追趕競爭對手,。 更重要的一點還在于,由于堅定的用戶隱私保護措施,,機器學習創(chuàng)業(yè)公司 Dato 聯合創(chuàng)始人 Joseph Gonzalez 評價道:「蘋果希望其手機能在不了解外部世界的情況下快速響應用戶需求,,以此方式實現人工智能,很難實現,?!?/p> 與此同時,Google 從一開始就定位于信息的收集,、整合,,其基于信息的智能已爆發(fā)出不小的影響力。 Google 的人工智能:讓流動的信息產生智能早在 2001 年,,拉里佩奇對于 Google 的定位就是人工智能,。這個理念源于拉里·佩奇的恩師威諾格拉德,上世紀 70 年代,,威諾格拉德曾作為MIT人工智能實驗室的一員,,一門心思要制造與人類思維匹配的智能。然而威諾格拉德看到所謂人工智能在各個領域的潰敗,,同時又受到加州大學伯克利分校教授塞爾斯「中文房間」理念的啟發(fā),,最終退出這個領域。 1998 年,,威諾格拉德和他的學生拉里·佩奇,、謝爾蓋·布林及其導師拉杰夫·莫特瓦尼聯合發(fā)布了一篇學術論文《你能用自己口袋里的論文做什么?(What Can You Do with a Web in Your Pocket?)》,,該論文提出了谷歌搜索的產品原型,。同年,佩奇和布林從斯坦福大學畢業(yè),,創(chuàng)立谷歌,,通過改善人類信息組織和發(fā)現的方式,創(chuàng)造一種可以為人類服務的智能方式,。 該論文的概念也體現在 Google 的 Slogon 里:「整合全球信息并為其使用」,。因此 Google 對于信息背后的智能方式有著天然的熱愛,硅谷資深記者 Steven Levy 在六年前探訪Google 總部后這樣寫道:
2012年,Google 提出了知識圖譜,,所謂知識圖譜,,簡而言之就是一種深度挖掘搜索詞潛在的知識關系,來呈現更結構化的搜索結果,。比如當你搜索硅谷,,你所看到的不僅僅是關于硅谷的網頁信息,還提供結構化及詳細的關于主題的信息,,下圖的右側就是 Google 的知識圖譜:
將雜亂無章的網頁到結構化的實體知識,,搜索引擎可以通過知識圖譜給用戶提供更具條理的信息,甚至順著知識圖譜可以探索更深入,、廣泛和完整的知識體系,,讓用戶發(fā)現他們意想不到的知識。Google 高級副總裁艾米特·辛格博士一語道破知識圖譜的重要意義所在:「構成這個世界的是實體,,而非字符串(things, not strings)」,。 根據 Google 官方的說法,知識圖譜的信息來自許多來源,,包括CIA的世界概況,,Freebase 和維基百科,通過知識圖譜,Google 在踐行「整合知識并使其可用」方面邁出了堅實的一步,。 2011 年開始,,Google 引入深度學習框架,。深度學習并非什么新技術,。上世紀60年代發(fā)明后,先后在 80 年代和 90 年代初期流行過一整,,但隨后就逐漸消沉,。但在 Google 看來,深度學習需要的海量數據恰好也是 Google 最擅長的領域,,與此同時,,對于計算能力的高要求也是 Google 自身技術架構足以應對的。 深度學習最開始由吳恩達推動的Google大腦計劃,,Google 技術大拿 Jeff Dean 也參與其中,。當時想通過使用神經網絡來提升技術水準,但并沒有把研究做成像大學象牙塔那種,,而是結合 Android,、Gmail、圖片去改進產品解決真正問題,。 2012 年 6 月,,《紐約時報》率先報道了 Google 大腦項目,,吸引了公眾的廣泛關注,。公眾第一次了解到,利用16,000個CPU Core的并行計算平臺去訓練含有10億個節(jié)點的深度神經網絡(DNN,,Deep Neural Networks),,使其能夠自我訓練,能夠實現對2萬個不同物體的1,400萬張圖片進行辨識,。 到了 2012 年年底,,在業(yè)界關注的圖片分類的競賽 ImageNet 中,Google 一支采用深度學習的精英團隊完敗給 Geoff Hinton 手下的博士生團隊,。這也促使 Google 重新開始認識深度學習帶來的巨大價值,,一年后,Google 高價收購了 Geoff Hinton 的團隊,,并全面開始在產品里部署基于深度學習的相關技術,。 從早期基于 page Rank 的搜索技術到引入知識圖譜以及全面整合深度學習,Google 一遍遍地將互聯網上的原始信息,、基于 Android 系統收集到信息,、利用Google 服務( 搜索、Gmail、Youtube)搜集的信息清洗,、過濾,、重組,寄希望于從這些「0和1」的組合里找到智能的存在方式,。 2014 年 10月,,Google 推出 Gmail 的「進化版」—— Inbox,這是一個基于對郵件自動掃描后的重新展示,,自 Inbox 的幫助下,,用戶收件箱里的郵件可以自動被歸類到「旅行」(如機票郵件)、「財務」(如信用卡賬單),、新聞資訊(如各種網站的訂閱) ,。2015 年的 Google I/O 大會發(fā)布的 Google Photo 令人震驚。Google 開辟了對于照片處理的新方式,,基于深度學習的算法,,Google Photo 可以自動識別、分類,,并支持自然語言搜索,。 Google :把雞蛋放在多個籃筐直到 2015 年夏天 Google 宣布重組,或許很多人還沒有意識到這家公司的業(yè)務有多繁雜,,在新的 Alphabet 架構下,,新 Google 聚焦在在線業(yè)務和 Android 產品線以及云服務。尤其是在 Google 商業(yè)模式即將轉型的大背景下,,人工智能或許將出現在更多的 Google 產品里,。 長期以來,Google 的盈利渠道都是廣告,。在今年 4 月財報電話會議上,,Google CEO 桑達爾·皮查伊公開表示:Google 將加快云計算業(yè)務發(fā)展,并計劃在 2020 年使云計算業(yè)務超過廣告業(yè)務,。就在皮查伊上述表態(tài)的前后,,Google 云計算服務簽下了Netflix、Spotify 這樣代表未來的企業(yè)級大客戶,;并挖來曾一手打造 VMware 的 Diane Greene 來統領云計算團隊,。 2016 年 7 月的騰訊「云+未來」大會上,馬化騰這樣定義未來:「未來互聯網行業(yè)就是利用人工智能在云端處理大數據,?!惯@實際上也是Google 在做的事情。皮查伊的這一幅手牌就是 Google 構建的云計算生態(tài),。今年的Google Next 云計算大會上,,Google發(fā)布了面向開發(fā)者的新機器學習平臺,并開放語音識別API等等,如果再加上去年推出的 TensorFlow 平臺,,Google希望通過將這些人工智能的服務模塊化,、開放化,讓云計算的PaaS 層,、IaaS 層的服務都具備人工智能屬性,,從而能夠快速完成數據處理。 DeepMind 則是 Google 的另一個秘密武器,。日前,,Google 宣布在數據中心的節(jié)能方案中采用 DeepMind 的算法,,效果顯著,。根據官方的數據顯示,這項技術幫助該公司將電力使用效率(PUE)提升了15%,,與使用效率提升同時帶來的則是耗電量的下降,,如果能將數據中心的耗電量降低10%,便有可能在幾年時間內為 Google 節(jié)約數億美元電費,。而進一步來看,,倘若 Google 能在數據中心節(jié)能方面不斷優(yōu)化,其云計算的價格極有可能繼續(xù)下降,,在云計算服務目前還處在價格敏感階段的時候,,Google 的想象力還很大。 總結上世紀 60 年代,,包括約翰·麥肯錫,、馬文·明斯基在內的人工智能先驅們堅信,只需十年時間就足以制造一種可以匹及人類智能的智能,。后來的故事大家或許都知道了,,半個多世紀的時間,人工智能在寒冬與初春的交替中緩慢前行?,F在,,在算法逐步成熟、數據量增加以及計算能力突飛猛進的幫助下,,我們或將有幸見證一次最接近人類智能的智能,。 與過往不同,這一次的智能誕生在每個人的手里緊緊握著的智能手機,。本文并沒有去對比其他互聯網巨頭,,包括微軟、亞馬遜,、Facebook 以及中國 BAT 的布局和思路,,但無一例外,你能感受的這些智能都或多或少地在你的指尖呈現。 從計算普及到交互進化,,蘋果和 Google 在兩條不同的道路上快速前進,,相比來說,包括微軟,、亞馬遜,、Facebook 在內的人工智能計劃都與 Google 類似,而堅守「隱私價值觀」與「設備智能」 的蘋果,,似乎并沒有同盟者……雖說殊途同歸,,但觀察以及見證他們的行進故事,也頗具意義,。(本文首發(fā)鈦媒體,,作者/趙賽坡)
|
|
來自: xzlxtx > 《科學 創(chuàng)新》