第一講:人工智能的發(fā)展與展望 第二講:余凱-嵌入式人工智能:從邊緣開始的革命 第三講:吳甘沙-智能駕駛 第四講:漆遠-人工智能驅動的金融生活服務
第一講:人工智能的發(fā)展與展望
人工智能發(fā)展的三要素:數(shù)據(jù)、運算能力,、算法,;
人工智能將影響所有產(chǎn)業(yè): 1.服務機器人(掃地機器人,、陪伴機器人、導購機器人,、家庭助理)和人機交互,; 2.工業(yè)機器人和智能工廠; 3.自動駕駛(Google測試200萬英里,,相當于300年駕齡,;特斯拉已經(jīng)開始在司機介入下大范圍使用;百度3年內(nèi)可以商業(yè)化)與智能交通,; 4.智能醫(yī)療和健康,;IBM的癌癥診斷輔助獲得FDA批準,Google&Stanford的皮膚癌診斷達專家水平,。 5.智能金融:Kensho,替代分析師的利器,;芝麻信用,征信分析。
人工智能的發(fā)展與未來: 今天:全球前五大市值公司都是互聯(lián)網(wǎng)公司,; 20年后:全球前五大市值公司都是人工智能公司,;
麥肯錫報告–AI在未來20年替代50%工作; 強人工智能不會很快實現(xiàn),,特定場景,、特定需求的弱人工智能會成為主流。
第二講:余凱-嵌入式人工智能:從邊緣開始的革命
新摩爾定律
摩爾定律指每十八至二十四個月,,計算機的成本會下降一半,,性能則會提升一倍,使計算和應用不斷發(fā)展,。整個摩爾定律已經(jīng)在按另外一個軌道在發(fā)展,,已經(jīng)不是每個單位面積上晶體管的數(shù)目,而是架構的改進,,使得計算由邏輯運算向人工智能運算演進,。那么就是這樣的問題:人工智能運算是提升 CPU 工藝向前發(fā)展,還是設計一個新架構,。
從中心到邊緣
我們可以看到從 PC 互聯(lián)網(wǎng)到移動互聯(lián)網(wǎng)到 internet of smart things,,實際上對 AI 的要求越來越高。對 PC 互聯(lián)網(wǎng)來說,,對 AI 的要求其實沒有那么高,,但在移動互聯(lián)網(wǎng)上,這種要求出現(xiàn)了,。
邊緣計算要求是實時,、低功耗、低成本的,,并且是隱私受保護的,。比如這在汽車上面,,就是一個很大的一個應用場景——不可能前面有小孩子突然橫穿馬路,你還要把數(shù)據(jù)傳上數(shù)據(jù)中心,,處理完了以后再傳回來,,這是不可想象的。所以一定要本地計算,,要實時處理沒有延遲,。
很多移動設備,比如 Amazon 的 Echo,,就是把很多計算往邊緣設備上去推,。又比如監(jiān)控攝像頭,中國去年一共部署了一億個,。監(jiān)控攝像頭的資料,,其實存3個月就扔掉了。未來,,對于所有這些攝像頭,,都會有專門的處理器,去處理實時的視頻,,這是一個大的趨勢,。
邊緣的競賽
未來的5到10年,最具顛覆性的產(chǎn)業(yè)機會是什么,?通常來講,,產(chǎn)業(yè)機會分成兩個階段,首先是一波2B的機會,。2B的機會,,就是 Enabling Technology,公司就是做 technology 本身的,。它是提供槍炮彈藥的,,給誰提供呢?給第二波的機會提供,。第二波的機會是什么呢,?就是 Technology-enabled Business。當然這些都是2C的,。2B就是給 Enterprise 提供服務,。這些 Enterprise 再去捕捉 consumer-orient 的機會。這個 pattern確實在歷史上反復發(fā)生,。
舉一個例子,當年 PC 互聯(lián)網(wǎng)剛出現(xiàn)的時候,,時間是在90年代末,,那時沒有一家互聯(lián)網(wǎng)公司是掙錢的,,大家都看到了這里面存在機會,但在這個階段,,首先要做的工作是把架構,、網(wǎng)絡給做起來吧? 所以 CISCO 這樣的公司會表現(xiàn)得更好,。另外也會有一些2B的培訓師等等,,這個階段整體上屬于為B端造槍造炮提供彈藥的階段,這算是一種曲線救國吧,。
然后才有2C的大的互聯(lián)網(wǎng)公司的出現(xiàn),,比如 Google。再比如移動互聯(lián)網(wǎng),,首先要有 CDMA 這樣的軟件算法,,放在芯片里面,使每個移動設備 stay connected,。然后才是 Apple 這樣的公司的崛起,。中國的大部分投資者、創(chuàng)業(yè)者和企業(yè)家,,他們看重的就是這樣一波機會,。
在我們進入這個市場的時候,美國人把這些基礎技術已經(jīng)做完了,,從2000年開始到今天,,我們是在享受上個世紀八九十年代科技成長的所帶來的的一個環(huán)境,然后我們?nèi)プ隽诉@些用戶導向的企業(yè),。
但今天我們?nèi)タ催@個整個這個創(chuàng)業(yè)環(huán)境,,2C的這種創(chuàng)新其實代價已經(jīng)非常的高昂,比如嘀嘀融了上百億美元,,美團也有幾十億美元,,這個投資其實越來越沉重。其實你想想看,,當時 Google 只融了兩千萬美元就上市了,,百度差不多也就是千萬美元,騰訊也是如此,。在那個時候其實有大把的機會去捕捉,。但是現(xiàn)在的話呢?八九十年代技術創(chuàng)新所帶來的這些能力其實已經(jīng)被發(fā)掘的差不多了,,所以我們會發(fā)現(xiàn)創(chuàng)新越來越沉重,。
第三講:吳甘沙-智能駕駛
為什么要做智能駕駛
每年因為交通事故死亡140萬人,百公里的油耗產(chǎn)生廢氣,,排放霧霾等一系列的問題,。 停車難:第一,,一輛車96% 的時間是停著的,他而且需要兩個停車位,;第二,,在城市的商業(yè)中心CBD附近,35% 的航行里程是與找停車位相關,;第三,,大城市15% 以上的土地是用來停車的。 無論是搖號,、限行,、交通擁堵費,還是網(wǎng)約車,,都沒辦法根本性上解決這些問題,。
我們來看今天為什么有那么多問題——本質(zhì)上因為車太多。例如北京,,有接近六百萬 私家車,,而提供按需出行服務的出租車只有7萬 輛左右。對于我們絕大多數(shù)人來說,,首先打車很難,,其次打車很貴。但是我們相信有了智能駕駛之后,,在10年之后,,城市里面車輛的總保有量可以減少一半,只有100萬 輛私家車,,還有200萬 輛是出租車,。而這些出租車是無人駕駛出租車。那么根據(jù)大數(shù)據(jù)的運算規(guī)律,,我們可以根據(jù)全城人群的分布和出行的規(guī)律,,把這200萬輛車分布在城市的各個角落。保證每個人一叫車,,兩分鐘之內(nèi)就來車,。而且,我們打車的費用可以降到今天的1/3 ,。
如今“滴滴出行”一天的峰值能夠達到2100萬 單,;這什么概念呢?阿里巴巴全品類的電商相加一天大約是3000-5000萬單,。美團,、大眾點評吃喝玩樂住加起來一天大約1300萬單。因此,出行是相當剛性的,、高頻的需求,。 一旦有無人駕駛,一天達到5億 單是完全沒有問題的,,這將成為電商所有品類當中最大的交易量 。而且,,未來的車可能長得不太像車,,其交通工具的屬性會降低,商業(yè)空間的屬性會增加,。大家再一次腦補,,在里面放一臺咖啡機,它就是移動星巴克,;放一塊大屏幕,,它就是移動萬達影城;放塊小屏幕,,它可以是移動的分眾傳媒,;在里面放一套辦公設備,它就移動的寫字樓,。未來你打車,,可能就十來塊錢,但喝杯咖啡需要二三十塊錢,,看場電影需要三四十塊錢,。因此,整套新的商業(yè)體系就會呈現(xiàn)出來,,因此也給我們帶來一個巨大的機會,。
智能駕駛中的AI
智能駕駛里面有一些什么樣的AI技術?我認為,,有三樣非常重要,,我把它分成3種司機:第一種,叫新司機,。想象一下,,剛剛從駕校里面考到了駕照,你懂得交通規(guī)則,,能夠保證不去撞車和撞人,;第二階段,你開著開著,,變成了一個認路的司機,,在任何情況下都不會迷路;第三個階段,就變成老司機,。老司機體現(xiàn)在3個方面:一,、開車開得非常好;二,、你不肉,,這個很有競爭性;三,、碰到一些新的情況,,你也不慌。
其實,,智能駕駛要達到這3個方面:一是感知和認知 的理解部分,;二是地圖和定位 ;三是認知的決策 部分,。先看感知和認知的理解,,傳統(tǒng)上無人駕駛,他是從“激光雷達”開始,。無論是樹,,草坪,車輛,,房子等等,,激光雷達都能夠很準確地把模型建立出來。谷歌第一代,、第二代,、第三代無人駕駛車,上面有個激光雷達,。百度的第一代,、第二代車的頂上有激光雷達。兩邊和后面有3個小的激光雷達,。頂上的激光雷達,,在國內(nèi)市價是70萬人民幣;3個小的激光雷達,,每個大約是七八萬人民幣,。這是錢堆出來的。我們做了一個低速車,,上面其實也有一個激光雷達,,就是七八萬人民幣。那么顯然,,這東西很貴,,自然而然會讓大家去想我有沒有其他的解決方案——就是基于視覺以及毫米波雷達,,超聲波 等等這些輔助傳感器啊。但是,,最重要的還是視覺,,視覺構建的不是一個幾何世界,是一個像素世界,?;谝粋€像素世界,要去理解和預測,,這是基于視覺的智能駕駛,。
那么,我們拿在這一塊商業(yè)化最為成功的特斯拉 為例,。這輛特斯拉Model S上面就有一個單目攝像頭 ,作為它的主要的傳感器,;下面保險杠前面正中,,有一個毫米波雷達 ;車周周邊一圈有12個超聲波傳感器 ,。大家可以看到這些小圓口都是超聲波傳感器,。它通過這3種傳感器,能夠很好地達到新司機的要求,,去理解規(guī)則,,去感知這個世界。
還需要研究的點
SLAM技術的魯棒性 :SLAM技術由于視覺質(zhì)量技術,,非常受限于在環(huán)境當中能夠發(fā)現(xiàn)的這些特征點,,比如說四處都是白墻時是很難獲取特征點的。 多傳感器融合 :攝像頭,、毫米波雷達,、超聲波傳感器聯(lián)合使用的算法融合。 基于基礎高精地圖的地圖學習和更新 :不但具備定位的功能,,也能夠幫助地圖進行更新,,那用戶始終會拿到最新的地圖。 無限提升準確率 :1000-10000倍的標注數(shù)據(jù)(大規(guī)模眾包數(shù)據(jù)收集+基于機器學習的半自動標注),。 “老司機”的要求 :第一步是開得很穩(wěn),,很舒適;第二步是開的不肉,,具有社會性和競爭性,;第三步是怎么去處理未知的情況,能夠開得萬無一失,,一輛奔馳S級轎車,,上面的代碼量是波音787夢想客機代碼量的16倍 。大家可以想見,要對一輛車進行很好的測試,,要求非常高,。但事實上,比代碼更難的是數(shù)據(jù) 和上面的隨機算法機器學習 ,。
Q&A
1.汽車工程學會的定義將自動駕駛分為0到5級:0級就是全人駕駛,;1級 還是人駕駛,但是系統(tǒng),、機器有時會介入 ,,比如說它看見你離前車太近,它會滴滴滴警告一下,,甚至再近了,,它給你踩一把剎車;2級 就是在相當長的一段時間里面自己去駕駛 ,,比如說像特斯拉Autopilot,,在封閉的結構化的高速公路上,駕駛員還需要把注意力放在路上,,但是其實這過程中,,車是自己在開。它自己能夠識別車道線,,始終保持在車道的中間,,甚至它還具備一定的全自動泊車功能;3級 跟2級典型的差別,,首先駕駛員不用全神貫注在路上,,他可以做其他的事情,這個系統(tǒng)可以給予駕駛員八秒到十秒時間重新回到?jīng)Q策環(huán)中 ,,這是一個非常明顯的要求,,另外的話它會在自動型上面給予更多的一些好處,比如說不一定完全是在高速公路上,,在一些更復雜的條件下也可以,;4級幾乎就是無人駕駛 ,或者在某些情況下需要人干預,,或者只能在一個特定的環(huán)境下做無人駕駛,。比如有的場景特別簡單,就不需要干預,;5級 就是全天候,、全區(qū)域、全速度 的無人駕駛,。
2.從國際主流車廠和科技公司的路線圖來說的話,,到2021年會有4級的車上路,。
3.未來10年以內(nèi) ,出現(xiàn)人車分流 ,,也就是人開的車和自動駕駛的汽車分開車道行駛,。一統(tǒng)計數(shù)據(jù):當自動駕駛在城市里面超過交通運量25%以后,就值得為它單開車道,。
4.5G有兩個任務:第一實現(xiàn)關鍵任務下的通訊,,延遲做到個位數(shù)毫秒級別,關鍵任務就包括無人駕駛和遠程手術等等,。第二帶寬變得很大,,可以將一部分工作拿到云上去。
5.汽車這個領域是值得專門去定制芯片 的,,且芯片應該是可編程 的,。
6.傳統(tǒng)汽車廠商和互聯(lián)網(wǎng)為代表的公司博弈:第一是汽車廠必須跟出行業(yè)務結合起來;第二是汽車廠不再滿足于只做一個集成商,,他現(xiàn)在希望能夠更多地去擁有技術,。第三是科技公司需要傳統(tǒng)車廠的硬件合作。
第四講:漆遠-人工智能驅動的金融生活服務
金融生活服務的各種各樣的場景:醫(yī)療,,繳費,教育,,乘坐高鐵,、地鐵、汽車,,交罰款,,查稅等。在美國信用等于財富,,在國內(nèi)如何產(chǎn)生信用分,?這是個技術活,我們需要從數(shù)據(jù),,從各個角度,、維度來判斷一個人的信用。當然不光是人,,還有小微企業(yè),。希望運用大數(shù)據(jù)的技術,通過智能的技術把它自動化,,降低成本,。比如智能助理 、營銷,、保險 ,。 1.智能助理:需要非常好的落腳點,。比如智能客服有海量的電話要接,海量的問題要回答,。還有基金銷售,,理財顧問,保險顧問,,審核等,,在這一系列的環(huán)境中,智能助理是一個非常落地的場景,。 2.營銷:營銷從任何商業(yè)角度來講都是非常重要的,。比如需要做一個營銷策略,可通過大數(shù)據(jù),、云計算使成本急速降低,,保證風控的質(zhì)量,才能大規(guī)模,,低成本,。 3.保險:保險本身是一個數(shù)據(jù)驅動的應用,從營銷到保險的個性化定價,,到新的基于互聯(lián)網(wǎng)的場景,,新保險類別的開發(fā)等等,其實都離不開數(shù)據(jù),。
案例1-螞蟻智能客服
今年我們的目標已經(jīng)不是自助率,,而是問題解決率 。到今年夏天,,我們的智能客服的問題解決率從百分五十幾,,到現(xiàn)在快70%,而人工的用戶問題解決率是71%到72%左右,,我們的目標就是要超過人工,。超過這個意味著什么?其實我不光能夠自助,,我回答問題比人還準,。那其實這個代表什么?不到一年,,我們?yōu)楣臼∫粌|,,除去人的成本和GPU的成本。我們客服部門去年其實裁了100人,。減少的100人去做遞推,,做口碑業(yè)務,這部分大量的人力就省下來了,,這就是AI真實的案例,。
異常檢測 :出現(xiàn)問題是即時定位并解決,。核心思想有幾部分:一部分就是實時計算,要把數(shù)據(jù)實時性提高,,做到秒級定位,。原來一個流程發(fā)現(xiàn)一個問題,到電商的商務異常處理,,需要兩小時,。從發(fā)現(xiàn)問題13分鐘,到響應介入50分鐘,,到異常環(huán)節(jié)75分鐘,,到最后環(huán)節(jié)要兩個多小時,125分鐘,,這是以前的過程?,F(xiàn)在的話,我們秒級解決問題,,就是零分鐘預知,,解決問題不到半個小時。這樣的一個例子其實省下了快1000通電話,,而這個例子有很多,,就省下無數(shù)的電話。
案例2-個性化產(chǎn)品和資訊推薦
跟傳統(tǒng)只做推薦不太一樣,,阿里是一個生態(tài)系,,那生態(tài)系里面其實各個數(shù)據(jù)都會進來。我不是說因為你看過的文章,,又推一篇文章,這是頭條的經(jīng)典模式,。那有各種各樣的,,比如電商的購買行為能否助力財富和保險 ,我們叫遷移學習,,或者叫信息整合,。
螞蟻DNA :就是一個編碼技術,把這個用戶實體包括產(chǎn)品,,文本和外面的article,,我們做一個統(tǒng)一空間里embedding,轉來轉去有很多點,。然后,,把這個人在這個點里邊直接表達出來。它的好處,,比如說加密,,如果你只看著點,,你是不知道什么意思,但是很多合作方,,比如說,,我們保險公司合作,把這個用戶的數(shù)據(jù)加密,,非常關鍵的一個問題,。
案例3-螞蟻安全大腦
從眼紋到人臉到聲紋等整個結合,用來證明“你就是你”這樣的問題,。這個其實有非常大的價值,。比如健康險,我們通過新的數(shù)據(jù)源融合進來能夠反欺詐,,更好地理解健康的風險,;比如說場景險,就是完全互聯(lián)網(wǎng)化的一個場景險:穿緊身褲的很多人,,在淘寶天貓上購買手機新屏幕服務,,干脆直接給你做個保險,這個保險呢,,就是碎屏險,。
案例4-微貸
基于大數(shù)據(jù)和機器學習的信貸模式是螞蟻微貸的優(yōu)勢,在這個模式下,,客戶立即申請立即獲貸,,不良率低,可以解決小微企業(yè)和個人貸款難的問題:金額高,、流程長,、授信難。