2017年,知識經(jīng)濟日益火爆,,分答,、知乎、得到等知識平臺可謂如日中天,。眼下這種火爆已在從人類延展到機器,。互聯(lián)網(wǎng)巨頭紛紛對知識變得饑渴起來,,知識成為數(shù)據(jù)之后的又一個香餑餑,。 互聯(lián)網(wǎng)巨頭對知識越來越青睞 兩三年來,互聯(lián)網(wǎng)大佬言必談數(shù)據(jù),,特別是大數(shù)據(jù),。曾有人戲稱馬云應該叫“Data Ma”,因為不懂技術的馬云,,十分鐘愛談大數(shù)據(jù),,馬云的“五新理論”中有一個是“新能源”,其認為未來機器吃的不是電,而是數(shù)據(jù),。其外,,李彥宏、馬化騰等大佬關于大數(shù)據(jù)都有不少言論,,馬化騰說數(shù)據(jù)是AI應用的四大要素之一,,李彥宏也提到:“由數(shù)據(jù)、算力,、算法‘三位一體’共同驅(qū)動的人工智能或?qū)⒊蔀橥苿咏?jīng)濟增長與時代進步的新引擎,。” 數(shù)據(jù)是AI的基礎,,也是互聯(lián)網(wǎng)公司的重要資產(chǎn),,通過算法挖掘可以形成可觀價值,是毋庸置疑的,。不過,,我觀察到,今年互聯(lián)網(wǎng)巨頭們對于數(shù)據(jù)談得少了,,談知識反而越來越多,。 最具代表性的是百度,新春內(nèi)部演講中,,李彥宏說,,“知識圖譜(包括需求圖譜、用戶畫像等等),,這些東西都是百度整個人工智能當中非?;A的構件,也是我們相對于其他任何一家公司的優(yōu)勢所在,?!薄胺浅!币辉~足見李彥宏對于“知識”的重視,。百度總裁兼COO陸奇在今年AI開發(fā)者大會上則指出,,“知識就是力量,有了知識我們可以做預測,、做自動化,,解決任何重要的問題,人類歷史就是改造世界,、認識世界的歷史,,AI就是幫助人類認識世界、改造世界的工具,,AI是人類歷史上重要的里程碑,?!痹跇I(yè)務層面,百度在知識上的底層布局就是知識圖譜,。 除了百度谷歌在知識圖譜上也一直在積極布局,。2012年5月,Google就推出了知識圖譜(Google Knowledge Graph),,利用其優(yōu)化搜索結(jié)果,。2013年,Google收購自然語言處理技術公司W(wǎng)avii,,將后者技術與GoogleKnowledge Graph整合,。2015年谷歌推出醫(yī)療版知識圖譜。現(xiàn)在谷歌語音搜索,、Google Assistant,、Google Lens、Google Home諸多軟硬件產(chǎn)品均已接入谷歌知識圖譜,。 不只是百度,、谷歌等搜索引擎在知識圖譜上布局,阿里,、華為等玩家也已在部署知識圖譜,,讓自己變得更有知識。從Data到Knowledge,,為什么互聯(lián)網(wǎng)巨頭們青睞的事物會有這樣的轉(zhuǎn)變,? 知識對于互聯(lián)網(wǎng)究竟有何價值? 知識對于互聯(lián)網(wǎng)第一層價值是內(nèi)容或者說信息價值——就像知乎,、分答,、百科、知道等等知識類產(chǎn)品一樣,,它們滿足了用戶的知識生產(chǎn),、共享、獲取等需求,。不過,,長期來看,,知識對于互聯(lián)網(wǎng)的價值主要在于,,起到一個從數(shù)據(jù)到AI的“橋梁”作用,它不可或缺且會日益重要,。 第一,,知識讓機器具有認知能力。 每家互聯(lián)網(wǎng)公司都在強調(diào)自己擁有海量數(shù)據(jù),,不過,,不同數(shù)據(jù)價值是截然不同的,。從應用場景看,搜索數(shù)據(jù),、社交數(shù)據(jù),、電商數(shù)據(jù)、支付數(shù)據(jù),、視頻數(shù)據(jù)等等的價值可以說大不相同,;從數(shù)據(jù)形式看,結(jié)構化與非結(jié)構化的數(shù)據(jù)價值不同,,前者更可能被機器利用,;從數(shù)據(jù)性質(zhì)看,感知類和知識類數(shù)據(jù)價值截然不同,,前者是視覺,、聲音、運動等物理感知數(shù)據(jù),;后者則是知識類數(shù)據(jù),,“人類對物質(zhì)世界以及精神世界探索的結(jié)果總和?!敝挥腥祟惒拍墚a(chǎn)生,、創(chuàng)作、總結(jié)和理解的數(shù)據(jù),,比如支付,、搜索、創(chuàng)作,、語言等等數(shù)據(jù),。 而知識類數(shù)據(jù)最核心的價值在于,可讓機器形成認知能力,。百度AIG(人工智能技術體系)負責人王海峰曾提出,,AI可以分為感知層和認知層,感知是人類和動物都有的能力,,機器一定程度也可以比人類更強,;但認知是人類的專屬能力。機器感知能力目前已趨于成熟(比如百度世界大會上語音技術可以實時生成字幕,,再比如圖像識別很多時候比人準),,但認知能力還有很大的提升空間。知識類數(shù)據(jù)可以讓機器在感知能力的基礎上形成認知能力,。 第二,,知識可以讓機器與人類對話。 我們要機器成為合作伙伴也好,,智能助理也罷,,前提就是要能夠與機器溝通,,就是交互。目前我們與機器的主要交互方式,,是反人性的——用輸入法打字即便再簡單也需要一定的學習成本,,只有觸摸、語音,、視覺這樣的交互方式才是自然的,,是小孩子都擁有的能力。 盡管眼下已經(jīng)有語音交互技術,、圖像識別技術,,但整體來說還不夠智能,比如語音無法理解長句子等復雜句式,,再比如圖像識別更多是對條形碼等簡易圖片有效,。要機器實現(xiàn)與人類的自然對話,像一個真正的助理那樣與用戶交互,,就需要它儲備足夠多的知識,。有知識儲備的機器有了認知,就不只是擁有語音或者圖像識別能力,,而是具備語義理解能力,,從聽清進步到聽懂,從看出來升級到看得懂,。 再舉個例子,,一個真正的秘書不只是可以識別主人,還能根據(jù)主人表情揣摩其情緒,,進而做出響應,。iPhone X的Face ID目前只能識別主人的臉,如果有了知識就可以“讀臉”揣摩主人情緒,,比如用戶愁眉苦臉時可以推薦一首歡快的歌曲,。百度世界大會上李彥宏演示的“火車司機疲勞識別”,本質(zhì)上就是在圖像識別技術上加載了知識圖譜后的成果,,機器可以理解“什么表現(xiàn)是疲勞駕駛”,。 第三,知識可以讓機器智能決策,。 如果機器只有感知能力,,本質(zhì)上只是改變數(shù)據(jù)輸入方式——機器的數(shù)據(jù)輸入自動化、無人化,、實時化,,進而提高輸入效率,、降低人力成本,,增加采集場景,。然而機器的本質(zhì)還是傳統(tǒng)意義上的功能計算機。就算可以做出決定,,本質(zhì)也只是“if this thenthat”的,、在人類設定的規(guī)則下的按部就班。 然而,,當機器通過足夠多的知識建立認知能力,,對世界有自己的理解后,就可以進行智能決策,。一個例子是AlphaGo——相對于深藍等基于規(guī)則的下棋程序不同,,它每一步的走棋,是基于對圍棋規(guī)則的認知以及下贏對方的目標而進行的,,它是真正意義上的AI下棋,。AlphaGo Zero則是進階版,它可以不借助任何圍棋棋譜與人類經(jīng)驗自我學習進步,,等于說是構建了一套自主的知識體系,,它成為知識的輸出者,棋譜也值得人類棋手去學習,。當然,,前提也是有圍棋規(guī)則這個人類知識的輸入。 我們不論是招聘秘書,,還是聘請管家,,都希望找一個“有一定想法”的,會主動思考和自我決策的人,,而不是找一個讓TA做什么才做什么的人,。同樣的道理,要機器有“一定的想法”,,能夠自我決策,,變得智能,就必須要有足夠多的知識輸入,,讓其形成認知能力,。 因此可以看到,在AI時代,,我們要讓機器真正意義上認知這個世界,,要讓機器與我們更自然地交互,要讓機器可以智能做出決策,,都必須要輸入足夠多的知識給機器,。如何給機器輸入知識?核心技術就是知識圖譜,,它就像AlphaGo“吃”的棋譜一樣,,是將人類掌握的不同知識進行關聯(lián)存儲于計算機中,,形成網(wǎng)狀結(jié)構并持續(xù)動態(tài)完善,讓機器不斷汲取知識,,對世界的認知日益完善,。 看到這里就能明白,為什么李彥宏會說知識圖譜是百度整個人工智能非?;A的構件了,。知識圖譜對于人工智能可以說是不可或缺,陸奇說,,“AI革命的本質(zhì)是快速的,、自動地獲取知識”,王海峰則認為知識圖譜是AI的基石,?!叭绻R是人類進步的階梯,知識圖譜就是AI進步的階梯”,,知識是AI的基礎已得到行業(yè)共識——有數(shù)據(jù)的巨頭企業(yè)很多,,然而有知識圖譜技術的巨頭卻屈指可數(shù)。 知識圖譜到底有哪些應用場景,? 說到語音技術,,人們就會想到Siri;說到圖像技術,,人們會想到iPhone X的Face ID,;說到知識圖譜,人們可能會想到百度搜索結(jié)果右側(cè)的關聯(lián)內(nèi)容,,這是百度2014年便已大規(guī)模應用的知識圖譜產(chǎn)品,,3年應用量增加了160倍。 不過,,知識圖譜的應用場景遠不止于搜索,,它跟自然語言處理技術一樣更為底層,很多時候是透明的,,許多AI應用,,背后都在應用知識圖譜技術,目前這些場景最典型: 1,、資訊,。 資訊行業(yè)正在迎來一場大變革——內(nèi)容創(chuàng)作進入自媒體時代,內(nèi)容分發(fā)信息流日益流行,,而信息流的基礎就是個性化推薦技術,。要做好個性化推薦技術只需做好兩點:一個是理解用戶的閱讀興趣;另一個是理解資訊內(nèi)容。然而兩點要做到都不容易,,理解用戶的前提是足夠多的用戶興趣數(shù)據(jù),,理解內(nèi)容的前提則是知識圖譜,平臺必須要有一定的“認知”才知道不同內(nèi)容意味著什么,,適合哪些興趣的用戶,而不是簡單的關鍵詞匹配,。 舉個例子,,一個文章內(nèi)容是馬云最新演講解讀,是將其推薦給電商行業(yè)人士,,還是希望獲得成功的年輕人,,還是李彥宏等企業(yè)家們?每個人都可能感興趣,,如何推薦就要結(jié)合對內(nèi)容的認知,,以及對用戶興趣以及當前場景的理解,知識圖譜就派上用場了,。特別是在視頻領域,,要理解內(nèi)容不是靠文字識別,而是要靠機器視覺技術,,對內(nèi)容本身的理解難度更高,,知識圖譜更重要。 現(xiàn)在,,今日頭條,、百度、一點資訊,、搜狐,、網(wǎng)易、企鵝,、UC,、微博等等都在做信息流。百度世界大會上宣布百度信息流月活超過6億,,相比去年5月剛推出時日均閱讀量提升105倍,,短視頻日均播放量提升169倍,這個成果,,與知識圖譜的優(yōu)勢密不可分,。 2、泛娛樂,。 看上去,,娛樂與人工智能八竿子打不著關系,更與知識圖譜沒什么瓜葛。實則不然,,傳統(tǒng)娛樂或許確實不需要什么信息技術,,然而新娛樂時代,技術重要性與日俱增,。今年百度世界大會上,,愛奇藝CEO龔宇的演講是讓人印象十分深刻的環(huán)節(jié),徹底顛覆了許多人對娛樂的認知,。 愛奇藝通過自制內(nèi)容戰(zhàn)略取得突破,,推動其會員模式成功,將于2018年IPO,。很少人知道的是愛奇藝一直很強調(diào)對技術的應用,,創(chuàng)作、制造,、宣發(fā),、營銷、預測等等環(huán)節(jié)都應用AI技術,。比如基于機器學習的多時間窗口預測電影票房,,提前半年方差準確率高達77%;比如《中國有嘻哈》這個小眾音樂節(jié)目的成功,,也得益于愛奇藝對年輕受眾用戶畫像再采取針對性措施,;再比如愛奇藝可以基于娛樂知識圖譜來預測哪個藝人會成為下一個黑馬。 早在2015年,,愛奇藝就建立了“視頻深度學習產(chǎn)學聯(lián)合實驗室”,,計劃通過可視計算、機器學習,、大數(shù)據(jù)挖掘算法和自然語義分析,,挖掘人與視頻間的多維關系,構建視頻知識圖譜和視頻推薦系統(tǒng),,提升愛奇藝智能推薦和流量,、票房預測精度。百度正在輸出AI能力,,相信愛奇藝會與大股東百度有更深層次的合作,,特別是視頻知識圖譜領域,愛奇藝將是一個絕佳場景,。 3,、金融。 金融是百度最先商用的AI場景,,正如李彥宏所說:“金融的數(shù)據(jù)化本質(zhì),,加上業(yè)務規(guī)則清晰,,使它成為人工智能最佳的應用場景?!苯鹑诘闹R相對垂直,,因此也非常適合與知識圖譜技術結(jié)合。我記得2015年,,百度就已將知識圖譜應用在股票領域,,旗下產(chǎn)品股市通通過數(shù)據(jù)、信息與股票的關系,,以及股票與股票之間的關系,,在股票領域首創(chuàng)知識圖譜,實現(xiàn)智能選股,。不只是百度金融在應用知識圖譜,,整個金融行業(yè)都在將知識圖譜應用在個人征信,、貸款風控,、保險銷售、保險策劃,、金融指數(shù),、反欺詐、客戶管理管理,、智能客服等領域,,出現(xiàn)了不少提供金融AI技術或者是金融知識圖譜服務的創(chuàng)業(yè)公司,百度金融也在積極地推進智能金融科技的開放,,包括金融知識圖譜的開放,。 4、手機,。 智能手機2017年最大賣點是全面屏,,同時還有一個亮點是AI——iPhone X、華為Mate 10等等旗艦機都有不少AI元素,。怎樣的手機稱得上真正的AI手機,?關鍵在于智能化功能和智能化能力。智能化功能上除了像FaceID這樣可以識人外,,還要有比Siri更聰明的助理,,真正意義上成為用戶的個人助理,給用戶做決策,,這離不開知識圖譜技術,。智能化能力上就是要在芯片、系統(tǒng),、云端形成AI能力,,可以越用越快、安全等等,要實現(xiàn)這些能力需要手機領域的知識圖譜,。 可以說,,智能手機要AI化離不開信息/服務知識圖譜和手機知識圖譜。不過,,AI技術,、云服務以及知識圖譜技術都是互聯(lián)網(wǎng)巨頭擅長的事情,是多數(shù)手機公司的短板,。怎么辦,?最近百度與小米就AI達成深度合作,聯(lián)系到此前DuerOS與HTC,、vivo等合作來看,,百度未來很可能會給手機公司提供知識圖譜技術助力智能手機真正“智能”起來。 知識圖譜的應用場景遠遠不止這些,,它是AI的基石,,理論上來說每一個AI場景都是知識圖譜的場景,而AI將改變各行各業(yè),,其應用場景之廣泛可想而知了,。截至目前,百度知識圖譜已經(jīng)應用到幾十個領域,,百度知識圖譜技術奠基人王海峰曾在一次演講中表示:“人工智能與傳統(tǒng)產(chǎn)業(yè)融合的過程中,,要想為這個行業(yè)提供更好的服務,就需要對這個行業(yè)進行定制化,,要有行業(yè)知識,,這時候就需要在通用知識圖譜的基礎上,有相應的行業(yè)知識圖譜,,進而幫助這個行業(yè)提升生產(chǎn)力,,幫助這些行業(yè)、產(chǎn)業(yè)升級,?!睆倪@段話可以看出,百度知識圖譜也會開放給更多行業(yè),,讓各行各業(yè)吃上知識圖譜,。 微博@互聯(lián)網(wǎng)阿超 微信 羅超頻道(luochaotmt) |
|