來源: 瑞萊智慧RealAI 專家介紹
訪談直擊 情景再現(xiàn) 1 什么是人工智能,? ??? 龔克 張老師,,我知道您是我們在中國的科學(xué)家里最早接觸人工智能的(之一),,現(xiàn)在人工智能應(yīng)該說是和原來已經(jīng)不在一個階段了,。 現(xiàn)在人工智能進(jìn)入了2.0時代,,我想這個階段非常重要的一個特點呢,,從應(yīng)用角度來講,,是真正有了實際的應(yīng)用的時期,,在社會上的談?wù)撘蔡貏e多。 我想咱們回到一個根本的問題上:在您看來,,到底什么是人工智能? ??? 張鈸 這個問題很好,,因為現(xiàn)在大家對于人工智能的問題都非常關(guān)注,,但是對人工智能究竟做什么,?什么是人工智能,?大多數(shù)人還不是很理解,,我們也是從四十多年的工作中慢慢地理解到人工智能究竟是做什么的,、究竟能做什么。大家都以為人工智能就是用機(jī)器來模擬人類的智能,,但實際上這是很困難的。 大家知道,,我們對人類的大腦和人的智能了解得很少。如果要沿著這個方向做研究的話,,它必須去模擬大腦的工作機(jī)理,而怎么去模擬大腦的工作機(jī)理,?所以走這條路就很困難,這在人工智能領(lǐng)域也算是一個比較少數(shù)的流派,。 現(xiàn)在大多數(shù)人做的人工智能,實際上是用機(jī)器來模擬人類的智能行為,,簡單地來理解就是:智能行為就是智能的外部表現(xiàn),。比如說人類的情感,,就是喜怒哀樂等情緒,,是模擬困難的一部分,,好多人以為我們?nèi)ツM情感,,是真的去模擬情感,,所以大家對這個會提出質(zhì)疑。 確實我們沒法去模擬人類的情感,,因為很多時候人類的情感無法定義,是因人而異的,,我們不是很清楚當(dāng)產(chǎn)生情感時,,它的生理基礎(chǔ)是什么,、它的大腦起什么變化,、它的心理學(xué)基礎(chǔ)是什么,,所以人們會很疑惑人工智能到底能不能產(chǎn)生情感,。 這個不是該對人工智能提出的問題,,人工智能是要模擬情感的表現(xiàn),,比如說模擬快樂的表現(xiàn),,由一般情感通過三個途徑的表達(dá),即臉部,、語言及聲音、肢體的動作等方面進(jìn)行模擬,;或者通過情感分析,,即通過分析人類的語言去分析他的情感,。 這樣的前提是智能的行為是可以觀察的,因為可以觀察我們就可以模擬它,,模擬的結(jié)果我們可以評價它,這就可以作為一個科學(xué)問題來研究,。 2 人工智能走到了什么程度,? ??? 龔克 您現(xiàn)在談的是對“什么是人工智能”這個問題的解答,我覺得非常受啟發(fā),。概括下來就是說人工智能實際上是在用人工,即我們設(shè)計的各種算法,,利用各種工具去模擬人的智能行為,。 接下來,,請您繼續(xù)為我們分析下,基于我們對于人工智能的定義,,在經(jīng)過了這么多年的發(fā)展后,人工智能現(xiàn)在走到了一個什么程度,? ??? 張鈸 到本世紀(jì)初的時候,,因為我們有了大數(shù)據(jù),、有了計算能力,,在這方面人工智能就在圖像識別,、語音識別,、文本處理方面有了很大的進(jìn)步,,而且也產(chǎn)生了很多實用的系統(tǒng),這個技術(shù)現(xiàn)在還在繼續(xù)發(fā)展,,因此人工智能取得了很大的進(jìn)步,。 3 什么是人工智能? ??? 龔克 我自己也有所體會,。其實在我們九十年代的時候,當(dāng)時也出現(xiàn)了一些手寫的輸入,、語音的輸入,,但對我個人來說,,錯誤率太高,,很不實用,。 現(xiàn)在對比當(dāng)時有了很大的進(jìn)步,從原來的基本不可用到現(xiàn)在的基本可用,,產(chǎn)生這樣的變化,像您剛才所提到的是因為我們有了大數(shù)據(jù)技術(shù),,我們有了強(qiáng)大的算力,使得我們有了深度機(jī)器學(xué)習(xí)的辦法,。那是不是就可以說機(jī)器學(xué)習(xí)就是人工智能了呢,? ??? 張鈸 應(yīng)該說機(jī)器學(xué)習(xí)是人工智能中間的一部分,而且深度學(xué)習(xí)是機(jī)器學(xué)習(xí)里頭的一部分,。語音識別,、圖像識別在深度學(xué)習(xí)出來之前,它基本上是不能用的,,主要歸功于大數(shù)據(jù)的數(shù)據(jù)和計算能力,。 這幾年算法技術(shù)本身就有很大的改進(jìn),,但是在這之前,,算法在其中的貢獻(xiàn)還不是很大,,因為和以前的技術(shù)不可同日而語了,現(xiàn)在有很快速的算法了,。深度學(xué)習(xí),我們現(xiàn)在把它叫做第二代人工智能,,有的時候又把它叫做數(shù)據(jù)驅(qū)動的方法,因為它必須要有數(shù)據(jù)來驅(qū)動,。 人工智能的創(chuàng)始人最早就提出來一個基于知識和經(jīng)驗的符號推理模型,比如醫(yī)生看病,,這是一種診斷的行為,是醫(yī)生利用他本身豐富的醫(yī)學(xué)知識和臨床經(jīng)驗做一些推理,,一般情況就是從癥狀到疾病的推理,然后再從疾病到如何用藥做治療,。 所以我們可以把人類的很多行為看成是在知識和經(jīng)驗支持下面的一些推理行為,它是專門針對某些領(lǐng)域,,醫(yī)療也好、生產(chǎn)過程也好,、調(diào)度過程也好,建立的這些實用的專家系統(tǒng),,我們把它叫做第一代人工智能。現(xiàn)在,,支撐人工智能發(fā)展的主要是知識驅(qū)動和數(shù)據(jù)驅(qū)動。 4 怎么看待建立可信,、可靠的人工智能,? ??? 龔克 人們對現(xiàn)在的人工智能,,比如說我們要建立可信的人工智能、可靠的人工智能,,張老師您怎么看待這個問題? ??? 張鈸 深度學(xué)習(xí)就是剛才說的數(shù)據(jù)驅(qū)動的方法,,有個很大的好處,它可以利用大數(shù)據(jù)做出來很多實用系統(tǒng),,但是有很大的問題,就是這個方法本質(zhì)上是不可解釋的,。如果嚴(yán)格地講,,人工智能現(xiàn)在只能用到一些結(jié)構(gòu)化的,、變化比較小的,、信息比較完備的環(huán)境中,。 所以人工智能一個很大的問題就是如何處理這個不確定性,,如果針對不確定性去做的話,做出來的系統(tǒng)就很難對付一些復(fù)雜的環(huán)境,。 現(xiàn)在我們想出來的辦法,就是用概率統(tǒng)計的方法去做,,把概率加進(jìn)入,,實際上考慮了不確定性,這樣才符合實際情況,。應(yīng)該說現(xiàn)在人工智能遇到了一個很大的困難,我過去用“天花板問題”來描述它,,即單純地沿著兩代人工智能的方法走下去,會遇到的很大的困難,。 5 為什么提出“第三代人工智能”的概念? ??? 龔克 您用了“天花板”這個詞,,實際上是描述這個困難之大,人工智能的發(fā)展受到很嚴(yán)重局限,。您在2015年的時候提出了“第三代人工智能”的概念,為什么要提出這個概念呢,? ??? 張鈸 2015年,,在深度學(xué)習(xí)在全世界范圍內(nèi)如日中天被討論的時候,,首先是由美國發(fā)現(xiàn)了深度學(xué)習(xí)的一個非常致命的缺點——深度學(xué)習(xí)非常脆弱。 他們做了一個圖像,,原來是熊貓的圖像,機(jī)器的識別率很高,,但是如果在熊貓的圖像上加上一點點噪聲,,人類可以識別它是熊貓,可機(jī)器卻會99.9%的認(rèn)為它是長臂猿,。 機(jī)器跟人類的視覺是完全不同的,,在一定條件下,它的識別率甚至能超過人類,,但它跟人類視覺的性能差得太遠(yuǎn)了。拿上面的例子來說,,只有將圖片上的熊貓改變成語言概念上的其他物種人類才會識別出錯,但對于機(jī)器來說,,即使給圖片上加上一點點噪聲,,語義上沒有任何改變,,機(jī)器仍然會將圖片識別成完全不同的東西。 這就說明機(jī)器的根本不能理解圖像的語義的,,而只是處理實際上的形式。不僅僅圖像是這樣,,語音、文本也是這樣,,尤其是文本,只要加上一點點變化,,文章的意思就完全不同,。 之所以會有這樣的現(xiàn)象,就是因為純粹數(shù)據(jù)驅(qū)動的方法會必然帶來這樣的問題,。與人類從大的輪廓來識別圖像不同,人工神經(jīng)網(wǎng)絡(luò),、深度學(xué)習(xí)只能提取局部的紋理色彩特征,所以只要改變局部的特征,,就會出現(xiàn)識別錯誤,。如果用技術(shù)的術(shù)語來講的話,數(shù)據(jù)驅(qū)動最大的問題就在于單純的數(shù)據(jù)驅(qū)動只是在低層次的特征空間層面來識別物體,,而不是在高層的語義空間中進(jìn)行識別。 因此,,我們提出了“第三代人工智能”的概念,,就是把數(shù)據(jù)驅(qū)動和知識驅(qū)動結(jié)合起來。 數(shù)據(jù)驅(qū)動為什么會有那么多的缺點,?是因為在人工智能領(lǐng)域,,只用了數(shù)據(jù)驅(qū)動的三個要素:數(shù)據(jù)、算力和算法,。同樣的,,知識驅(qū)動也有不少的缺點,我們也只用了其中另外的三個要素: 知識,、算法和算力,。 為了克服這兩個算法存在的缺點,應(yīng)該將四個要素結(jié)合起來,,而且四個要素之間,,我認(rèn)為應(yīng)該遵循以下的順序:第一應(yīng)該是知識,我認(rèn)為知識才是人類智慧的源泉,;第二是數(shù)據(jù),,因為機(jī)器處理數(shù)據(jù)能力遠(yuǎn)比人類強(qiáng),利用這個要素,,機(jī)器就有可能做出超越人類(能力)的事情,;第三是算法;第四是算力,。我們現(xiàn)在也是沿著這個方向去發(fā)展第三代人工智能,。 6 結(jié)合產(chǎn)業(yè)應(yīng)用,,談?wù)勅斯ぶ悄艿陌l(fā)展 ??? 龔克 從現(xiàn)在來看,過去十多年來,,以機(jī)器學(xué)習(xí)算法為代表的大量應(yīng)用走到了生產(chǎn)和生活里,,各種應(yīng)用場景不斷地展開,知識的一些算法也有一定進(jìn)展,,期間也有一些結(jié)合,。 下面張老師是不是能夠結(jié)合產(chǎn)業(yè)的應(yīng)用,來進(jìn)一步的談一談人工智能的發(fā)展,? ??? 張鈸 這也是一個很好的問題,。實際上人工智能從一開始就非常重視應(yīng)用和產(chǎn)業(yè)發(fā)展,當(dāng)時也一直在摸索人工智能產(chǎn)業(yè)的發(fā)展道路應(yīng)該是什么樣子,,同樣也是經(jīng)過六七十年的發(fā)展,,不斷地積累經(jīng)驗。 最初時候的發(fā)展有點像按照信息產(chǎn)業(yè)發(fā)展的路子走,,我們能看到信息產(chǎn)業(yè)的發(fā)展是非常快而且非常順利的,,中間基本上沒有過停頓,。 它的發(fā)展路徑,,拿計算機(jī)來講,首先是做機(jī)器,、做硬件等體系結(jié)構(gòu),經(jīng)過了三代的發(fā)展,,由一臺機(jī)器好多人用發(fā)展到一臺機(jī)器一個人用,再到后來的以手機(jī)為代表的移動端,,它的發(fā)展是非常迅速的,產(chǎn)業(yè)的發(fā)展也非常順利,。 從硬件到系統(tǒng)軟件,,再到后來成千上萬的應(yīng)用軟件的開發(fā),,每一個硬件、每一個軟件都能支撐起大量的企業(yè),。之所以會這樣,,在于軟硬件具有通用性,,具有很大的市場,從而推動了信息產(chǎn)業(yè)的快速發(fā)展,。 人工智能一開始發(fā)展時,也有一部分人想沿著信息產(chǎn)業(yè)的發(fā)展道路走,,如七八十年代美國的Lisp機(jī),、日本的五代機(jī),,都是想做出來一個人工智能的硬件或者機(jī)器,在此之上發(fā)展軟件及應(yīng)用,,但是后來都失敗了,沒能形成產(chǎn)業(yè),,原因就在于人工智能沒有理論基礎(chǔ)的支持,我們不知道智能機(jī)器應(yīng)該是什么樣子的,。 后來大家被迫選擇了一條路,,現(xiàn)在看來這條路也還是可以的。如上面說到的人工智能所擁有的兩類算法:基于數(shù)據(jù)驅(qū)動的算法和基于知識驅(qū)動的算法,,我們現(xiàn)在的產(chǎn)業(yè)就不是從硬件出發(fā),,而是從算法出發(fā),,根據(jù)算法來定義硬件或者定義軟件,,所以不是硬件在先而是算法在先,?;蛘呶覀儾蝗ザx硬件,,而是利用現(xiàn)有的硬件來進(jìn)行應(yīng)用,,且這個應(yīng)用是必須針對行業(yè)的應(yīng)用,,場景的應(yīng)用,這一點和信息產(chǎn)業(yè)不同,。 深度學(xué)習(xí)出現(xiàn)之后,,緊接著大家就用深度學(xué)習(xí)的算法去定義一些硬件,,如我們現(xiàn)在看到的所謂AI芯片,它實際上是由深度學(xué)習(xí)定義出來的硬件,,我們也可以用算法開發(fā)出來的各種各樣的計算平臺去應(yīng)用,,現(xiàn)在看起來,,企業(yè)發(fā)展還是很快的,。 基于知識算法的系統(tǒng),,比如已經(jīng)出現(xiàn)的各種專家系統(tǒng),,它一定是跟領(lǐng)域緊密相連的,因此它就存在很大的局限性,;基于數(shù)據(jù)驅(qū)動的算法開發(fā)出來的產(chǎn)品要比基于知識驅(qū)動開發(fā)出來的產(chǎn)品要多,但它本身也有一個非常大的弱點,,也由算法帶來,,限制了它的應(yīng)用場景。要解決算法的問題,,唯一的辦法就是開展基礎(chǔ)研究去克服缺陷,,如果我們有辦法克服它,那么產(chǎn)業(yè)就會得到高速的發(fā)展,。 7 要將通用算法和專業(yè)算法結(jié)合嗎,? ??? 龔克 我聽張老師您講了這一段以后,也很受啟發(fā),,我感覺是這樣,我們在人工智能的發(fā)展,,特別是技術(shù)產(chǎn)業(yè)發(fā)展的過程中,,更加凸顯了我們對人工智能扎實的基礎(chǔ)理論的強(qiáng)烈需求。它不是簡單地在一個現(xiàn)有的方法上做一些微調(diào)就可能克服我們所有的問題,,要從根本上解決問題,,我們需要加強(qiáng)基礎(chǔ)研究,但這個基礎(chǔ)研究并不是很遙遠(yuǎn)的,,并不是遠(yuǎn)遠(yuǎn)地脫離我們現(xiàn)在的產(chǎn)業(yè)實踐,。 根據(jù)您剛才的講述,我們是不是可以理解為一方面要很好地做一個扎實的理論,,另一方面也需要對具體的應(yīng)用場景有比較深入地把握,,結(jié)合具體應(yīng)用場景去發(fā)展,即通用算法和專業(yè)算法還是需要很好地結(jié)合,? ??? 張鈸 你說得很對,。 人工智能從1978年開始發(fā)展,我們基本上經(jīng)歷了人工智能的整個發(fā)展過程,,前面的二十年基本是探索的過程,,這與信息產(chǎn)業(yè)的發(fā)展非常不一樣,。 信息產(chǎn)業(yè)的整個發(fā)展思路是非常清楚的,人工智能完全不一樣,。人工智能是在探索“無人區(qū)”,,我們連什么叫智能都沒有搞清楚,人工智能始終在我們對智能一知半解的情況下發(fā)展的,。 所以其發(fā)展就必須要有兩個精神:一個是堅韌不拔,,因為人工智能的發(fā)展一定會有起伏;一個是必須相信人工智能永遠(yuǎn)在路上,,不應(yīng)該急于求成,,必須得有一個長期奮斗的思想。 未來智能實驗室的主要工作包括:建立AI智能系統(tǒng)智商評測體系,,開展世界人工智能智商評測,;開展互聯(lián)網(wǎng)(城市)大腦研究計劃,構(gòu)建互聯(lián)網(wǎng)(城市)大腦技術(shù)和企業(yè)圖譜,,為提升企業(yè),,行業(yè)與城市的智能水平服務(wù)。每日推薦范圍未來科技發(fā)展趨勢的學(xué)習(xí)型文章,。目前線上平臺已收藏上千篇精華前沿科技文章和報告,。 |
|