人工智能(簡稱AI)是一門前沿交叉學(xué)科,截至目前還沒有統(tǒng)一的定義,。但人工智能誕生于20世紀(jì)50年代,,2012年深度學(xué)習(xí)算法通過ImageNet比賽而名聲大噪,逐漸被廣泛采用,。2016年AlphaGo戰(zhàn)勝圍棋選手李世石,,使AI備受矚目。 2017年AI仍在進一步發(fā)展,,發(fā)展較多的是在深度學(xué)習(xí)領(lǐng)域,,AlphaGo二代技術(shù)升級為AlphaGo Zero、向深度學(xué)習(xí)進行技術(shù)升級的CTR預(yù)估等等,。計算機視覺方面發(fā)展平穩(wěn),,但自然語音處理方面發(fā)展緩慢需要突破。 這些都將AI推向全球關(guān)注的高點,,資本的投資,、政策的扶持都開啟了AI的新一輪浪潮。 當(dāng)前人工智能的發(fā)展主要集中在訓(xùn)練機器看懂圖像、聽懂語言,、處理大數(shù)據(jù),,從而實現(xiàn)人機自然交互,輔助人類進行自我決策,,最終達到自我決策的目的,。要使機器達到這一目的,需要三個基本要素的支撐:數(shù)據(jù),、算法,、算力。在這三要素中,,大量的數(shù)據(jù)是機器學(xué)習(xí)的根本,;算法模型則為機器學(xué)習(xí)提供了強大的動力與捷徑;算力也可廣義理解為計算系統(tǒng),,即指機器在學(xué)習(xí)的過程中需要的支持承載系統(tǒng),。 在互聯(lián)網(wǎng)的大環(huán)境下,催生出了“大數(shù)據(jù)”,,數(shù)據(jù)的完善與充足是人工智能發(fā)展的關(guān)鍵,,目前數(shù)據(jù)的來源主要有三種:學(xué)術(shù)界和大公司對外開放的免費數(shù)據(jù)庫;通過第三方數(shù)據(jù)供應(yīng)商購買或定制數(shù)據(jù)庫,;自行采集或模擬數(shù)據(jù),。 算法決定了人工智能技術(shù)的興衰。作為算法之一的深度學(xué)習(xí)是近年來發(fā)展與研究最多的領(lǐng)域,也引領(lǐng)了人工智能的三度崛起,。深度學(xué)習(xí)是一種對數(shù)據(jù)進行表征學(xué)習(xí)的機器學(xué)習(xí)方法,,也包含多種模型。而近年來各種理論的提出和實現(xiàn)都與卷積神經(jīng)網(wǎng)絡(luò)模型(CNN)密不可分,,它是一種包含卷積層的神經(jīng)網(wǎng)絡(luò)模型,,從1989年CNN的提出到2012年獲得重大技術(shù)突破,再到2016,、2017年多種變種模型的興起,,CNN在深度學(xué)習(xí)模型的發(fā)展中起到了重要的推動作用。 芯片是算力的核心,,算力即廣義理解的計算系統(tǒng),。以人工智能芯片為例,經(jīng)歷傳統(tǒng)的中央處理器(CPU),、運算速度較高的圖形處理器(GPU),,到目前市場上備受青睞的現(xiàn)場可編程門陣列(FPGA)和專用集成電路(ASIC),人工智能芯片正在朝著運算速度高,、體積小,、能耗小、性能強的方向發(fā)展,。 人工智能技術(shù)不斷突破,,尤其在自然語言處理、圖像識別,、語音識別領(lǐng)域取得了重大進步,,由此帶動人工智能技術(shù)從實驗室階段向下游應(yīng)用階段發(fā)展,。人工智能技術(shù)在不同領(lǐng)域的發(fā)展,,需要不同的深度學(xué)習(xí)模型在適應(yīng)的深度學(xué)習(xí)框架上進行預(yù)訓(xùn)練,隨后實現(xiàn)其在特定領(lǐng)域的功能,。以語音識別為例,,當(dāng)前主流基本上都是基于深度學(xué)習(xí)的框架,基本原理都是把輸入聲學(xué)序列輸出文本串序列,,最終目的是實現(xiàn)通訊和交流,。語音識別是最初感知層、從聲學(xué)到文本轉(zhuǎn)換過程,,而更難的是在理解層次上,。而語音識別新算法的開發(fā)則與具體的應(yīng)用場景和開發(fā)場景相關(guān)聯(lián),盡量簡單的實現(xiàn)基本影射功能,,以解決更多的自由對話交流問題,。 在深度學(xué)習(xí)模型CNN的基礎(chǔ)上,發(fā)展較快的模型包括:Alexnet、Resnet,、RNN,、Googlenet等;目前最流行的深度學(xué)習(xí)框架包括:TensorFlow,、Keras,、Caffe、MXNet,、Torch等,。2017年發(fā)布的新結(jié)構(gòu)Capsule從神經(jīng)科學(xué)出發(fā),雖然暫時并沒有應(yīng)用到業(yè)界,,但有一定發(fā)展?jié)摿?,有望取代CNN。 縱觀全球人工智能產(chǎn)業(yè),,美國第一、中國第二,,歐洲,、日本緊隨其后的格局。 在研究論文的質(zhì)量與數(shù)量上,,美國與中國具有壓倒性優(yōu)勢,,日本難以比肩。具體地說,,美國壟斷了芯片,,既有英偉達、微軟等重量級企業(yè),,創(chuàng)業(yè)企業(yè)也層出不窮,;中國則是在AI應(yīng)用領(lǐng)域發(fā)展勢頭強勁,初創(chuàng)企業(yè)較多,;日本則是在人工智能機器人上發(fā)展較好,。 人工智能產(chǎn)業(yè)帶動GDP增長,體現(xiàn)最為突出的是中國,、其次為美國,,日本則較為落后。中美日IT人才數(shù)量龐大,,但是年均收入水平上中美明顯高于日本,,這也是制約日本人才培養(yǎng)的一方面原因。 隨著人工智能技術(shù)日益滲透當(dāng)前社會的方方面面,,其作為未來科技發(fā)展的一個決定性領(lǐng)域,,已在全球范圍內(nèi)掀起了競爭熱潮,。在AI技術(shù)的發(fā)展和利用上,中美日各有優(yōu)勢,,將持續(xù)高速發(fā)展,。 ▏本文作者:材料委天津院 |
|