無論在學(xué)術(shù)界、產(chǎn)業(yè)界或是公眾生活中,,人工智能都稱得上當(dāng)前最熱門的一個(gè)話題,,也是目前發(fā)展最快的一個(gè)領(lǐng)域?;仡櫲斯ぶ悄馨l(fā)展歷程,,1956年達(dá)特茅斯會(huì)議的召開標(biāo)志著人工智能研究的開啟,歷經(jīng)60年的發(fā)展,,兩起兩落,,每次興盛都是人工智能算法有了新的突破,比如50年代神經(jīng)網(wǎng)絡(luò)理論的提出,,80年代反向傳播算法的出現(xiàn)等,。而每次低潮又是計(jì)算性能和數(shù)據(jù)規(guī)模的局限不能滿足實(shí)際應(yīng)用的需求,從而導(dǎo)致政府和投資的冷落,。自2013年始,,以深度學(xué)習(xí)為代表的神經(jīng)網(wǎng)絡(luò)算法為核心,在大數(shù)據(jù)和圖形處理器(gra- phics processing unit, GPU)大規(guī)模應(yīng)用的推動(dòng)下,,在語(yǔ)音識(shí)別,、圖像識(shí)別領(lǐng)域達(dá)到甚至超過了人類平均水平,迎來了人工智能研究的第三次高潮,。如今,,人們不僅能頻繁看到人工智能的研究與技術(shù)進(jìn)展的報(bào)道,如AlphaGo打敗了人類圍棋手,,波士頓動(dòng)力公司的機(jī)器人做出空翻等高難度動(dòng)作等,,也能不時(shí)地感受到人工智能對(duì)生活的影響,如家中新添的掃地機(jī)器人,,高鐵進(jìn)站的“刷臉”,,手機(jī)即時(shí)翻譯等。這一切無不宣告世界正進(jìn)入人工智能時(shí)代,,而且發(fā)展迅猛,,影響深遠(yuǎn),。人工智能的迅速發(fā)展對(duì)各行各業(yè)將造成巨大沖擊,許多行業(yè)可能在這場(chǎng)變革中消失,,一些行業(yè)將獲得大發(fā)展,。測(cè)繪遙感是一個(gè)與人工智能關(guān)聯(lián)密切的領(lǐng)域,在這樣的背景下既有發(fā)展的機(jī)遇,,也面臨很大的危機(jī), 本文將著重討論,。 人工智能可以分成6個(gè)研究方向: ①機(jī)器視覺,包括三維重建,、模式識(shí)別,、圖像理解等;②語(yǔ)言理解與交流,,包括語(yǔ)音識(shí)別,、合成,人機(jī)對(duì)話交流,,機(jī)器翻譯等,;③機(jī)器人學(xué),包括機(jī)械,、控制,、設(shè)計(jì)、運(yùn)動(dòng)規(guī)劃,、任務(wù)規(guī)劃等,;④認(rèn)知與推理,包含各種物理和社會(huì)常識(shí)的認(rèn)知與推理,;⑤博弈與倫理,,包括多代理人(agents)的交互、對(duì)抗與合作,,機(jī)器人與社會(huì)融合等,;⑥機(jī)器學(xué)習(xí),包括各種統(tǒng)計(jì)的建模,、分析工具和計(jì)算方法等,。 前3項(xiàng)是類人的外觀,是與外界接觸的部件,。類比人的五官(眼,、耳、鼻,、舌,、身),人工智能的研究方向中包含了其中三官,。機(jī)器視覺相當(dāng)于人的眼睛,,語(yǔ)音理解與交互相當(dāng)于人的耳朵,,機(jī)器人學(xué)主要研究智能機(jī)器人的運(yùn)動(dòng)器官,包括能夠運(yùn)動(dòng)的腳,、能夠工作的機(jī)械手,、能夠空翻的身體等等,。而后3項(xiàng)相當(dāng)于人腦的功能,,認(rèn)知與推理是智能體需要具備的基本能力,它可以是簡(jiǎn)單的認(rèn)知與推理,,也可以是復(fù)雜的高級(jí)的認(rèn)知與推理,,認(rèn)知與推理過程可以是計(jì)算機(jī)算法驅(qū)動(dòng),也可以是已有規(guī)則或者知識(shí)的直接驅(qū)動(dòng);機(jī)器學(xué)習(xí)是一個(gè)增加智能體知識(shí),、提高智能體認(rèn)知與推理水平的過程;博弈與倫理則是更高級(jí)的智能,,它不僅涉及到智能體與智能體之間的協(xié)同,還涉及到人與智能體之間的協(xié)同與融合,。一個(gè)智能體可能包含一個(gè)或者多個(gè)方面的智能,,如機(jī)器翻譯可能僅包含語(yǔ)言理解和機(jī)器學(xué)習(xí),但人臉識(shí)別可能包括機(jī)器視覺,、機(jī)器學(xué)習(xí)和認(rèn)知與推理等,。當(dāng)一個(gè)智能體具備以上6個(gè)方面的智能時(shí),就可能進(jìn)入到強(qiáng)智能時(shí)代,。 什么時(shí)候能夠進(jìn)入強(qiáng)智能時(shí)代,,強(qiáng)智能時(shí)代的標(biāo)志是什么,筆者給出了一個(gè)例子,。如果哪一天機(jī)器人與人進(jìn)行一場(chǎng)足球賽并取得勝利,,則可以認(rèn)為強(qiáng)智能時(shí)代已來。原因在于,,這種比賽要求機(jī)器人不僅具有以上6個(gè)方面的能力,,且各方面能力應(yīng)高級(jí)到足以打敗人類。人工智能要到達(dá)這一水平,,可能還需要幾十年的時(shí)間,。 人工智能的發(fā)展過程中許多衍生的技術(shù)是可以用于其他領(lǐng)域的,并且有可能推動(dòng)其他領(lǐng)域的技術(shù)變革,。智能科技產(chǎn)業(yè)形成從宏觀到微觀的各領(lǐng)域的智能化新需求,,將重塑全球經(jīng)濟(jì)結(jié)構(gòu),催生新技術(shù),、新產(chǎn)品,、新產(chǎn)業(yè)、新業(yè)態(tài),、新模式,,打造智能經(jīng)濟(jì),、智能社會(huì)和智能生活。測(cè)繪遙感是一個(gè)與人工智能密切相關(guān)的學(xué)科領(lǐng)域,。攝影測(cè)量與遙感和機(jī)器視覺有許多概念、原理,、理論,、方法與技術(shù)上的重疊,它們都是用來感知環(huán)境的技術(shù);其區(qū)別是攝影測(cè)量與遙感主要是感知地球和自然環(huán)境,,而機(jī)器視覺主要是感知智能體關(guān)注的目標(biāo)和環(huán)境,,但是它們?cè)跀?shù)學(xué)和物理上的原理基本相同。機(jī)器學(xué)習(xí),,特別是最近幾年快速發(fā)展的深度學(xué)習(xí)方法,,在機(jī)器視覺,、模式識(shí)別,、語(yǔ)音理解等方面得到廣泛有效的應(yīng)用,可說是一個(gè)革命性的技術(shù),,在攝影測(cè)量與遙感領(lǐng)域也得到廣泛應(yīng)用,。認(rèn)知與推理是一種更廣義的智能,在時(shí)空大數(shù)據(jù)挖掘和智慧城市等方面將大有用武之地,。本文將討論機(jī)器視覺,、機(jī)器學(xué)習(xí)和認(rèn)知與推理在測(cè)繪遙感學(xué)科的應(yīng)用。 1機(jī)器視覺及其在攝影測(cè)量與遙感領(lǐng)域的應(yīng)用 機(jī)器視覺或者稱計(jì)算機(jī)視覺,,是一門研究用攝影機(jī)和電腦代替人眼對(duì)目標(biāo)進(jìn)行識(shí)別,、跟蹤和測(cè)量等的學(xué)科。廣義上,,計(jì)算機(jī)視覺包括圖像處理,、目標(biāo)重建與識(shí)別、景物分析,、圖像理解等內(nèi)容,。狹義上,計(jì)算機(jī)視覺通常是通過對(duì)采集的圖片或視頻進(jìn)行處理以獲得相應(yīng)場(chǎng)景的三維信息,,即三維重建,。 20世紀(jì)40年代,貝爾實(shí)驗(yàn)室的Julesz發(fā)現(xiàn)任意視差圖都可恢復(fù)立體感,,無需事先識(shí)別單幅圖像的含義;而此前心理和神經(jīng)學(xué)家認(rèn)為人需要先感知才能產(chǎn)生立體感,。由此Marr認(rèn)識(shí)到復(fù)雜的神經(jīng)和心理過程可用直接的數(shù)學(xué)計(jì)算表達(dá),,并提出三維重建的計(jì)算視覺理論。他在1982年發(fā)表的《視覺:從計(jì)算的視角研究人的視覺信息表達(dá)與處理》中詳細(xì)分析了二維圖像的表達(dá),、立體圖像的對(duì)應(yīng)和重建,、算法以及硬件的實(shí)現(xiàn),是計(jì)算機(jī)視覺的開山之作,。20世紀(jì)80年代同時(shí)也是計(jì)算機(jī)視覺的第一段黃金時(shí)期。許多經(jīng)典的算法和算子,,如Canny邊緣檢測(cè),、shape from shading、Hough變換,、LoG(Laplace of Gaussian)等都起源于70-80年代。除了圖像處理,,早期的計(jì)算機(jī)視覺同樣關(guān)注幾何和三維重建問題,。不過,在計(jì)算機(jī)和數(shù)碼相機(jī)還未成熟之前,,攝影測(cè)量與計(jì)算機(jī)視覺當(dāng)時(shí)的狀況距離Marr所提倡的三維重建理論依然相去甚遠(yuǎn),。 與計(jì)算機(jī)視覺相似,攝影測(cè)量學(xué)是一門利用光學(xué)像片研究被攝物體的形狀,、位置,、大小、特性及相互位置關(guān)系的學(xué)科,,簡(jiǎn)而言之,,攝影測(cè)量學(xué)是以攝影為工具,以測(cè)量為目的,。事實(shí)上,,攝影測(cè)量學(xué)的歷史遠(yuǎn)早于計(jì)算機(jī)視覺。19世紀(jì)早期,,德國(guó)教授舒爾茲發(fā)現(xiàn)銀的混合物在日光下會(huì)變黑;1839年,,法國(guó)畫家達(dá)蓋爾發(fā)明了銀版攝影法,并制作了世界上第一臺(tái)真正的照相機(jī);19世紀(jì)中葉,,法國(guó)測(cè)量學(xué)家和攝影測(cè)量學(xué)的先驅(qū)Fourcade首先發(fā)現(xiàn)了用立體照片可重建立體視覺,,從而促進(jìn)了攝影測(cè)量學(xué)的誕生。在其后漫長(zhǎng)的歲月里,,相機(jī)和照片幫助人們將地球表層地形地物在室內(nèi)重建三維立體,從而將野外測(cè)量工作搬運(yùn)至室內(nèi),?!皟?nèi)業(yè)”工作成為主體,,照片和攝影測(cè)量?jī)x器替代了三腳架,、經(jīng)緯儀和標(biāo)尺,,成了主要的研究對(duì)象,。隨著航空航天技術(shù)的發(fā)展,,以航空航天飛行器為載體的攝影測(cè)量應(yīng)運(yùn)而生,。第一次世界大戰(zhàn)中,首臺(tái)航攝儀問世,,立體坐標(biāo)量測(cè)儀和1318立體測(cè)圖儀投入使用,,標(biāo)志著航空攝影測(cè)量學(xué)的理論、方法與技術(shù)體系初步形成,。1957年,,第一顆衛(wèi)星被發(fā)射到外太空,同時(shí)開啟了衛(wèi)星攝影測(cè)量時(shí)代,。 1973年,,貝爾實(shí)驗(yàn)室的Boyle和Smith發(fā)明了電荷耦合器件(charge-coupled device,CCD),,促成數(shù)碼相機(jī)和數(shù)字?jǐn)z影測(cè)量時(shí)代的誕生,。以CCD/互補(bǔ)金屬氧化物半導(dǎo)體(complementary metal oxide semiconductor, CMOS)數(shù)字成像器件為代表的數(shù)字?jǐn)z影技術(shù)開啟了數(shù)字?jǐn)z影測(cè)量理論與方法的研究。從此,,計(jì)算機(jī)成為測(cè)量的主要工具,數(shù)字影像和攝影測(cè)量算法替代了膠片和攝影測(cè)量?jī)x器成為主要研究對(duì)象,,形成了目前的數(shù)字?jǐn)z影測(cè)量理論,、方法與技術(shù)體系。與此同時(shí),計(jì)算機(jī)視覺也得到迅猛發(fā)展,,并成為計(jì)算機(jī)領(lǐng)域的一個(gè)熱門方向,。 90年代后,兩個(gè)領(lǐng)域都得到數(shù)碼成像技術(shù)和計(jì)算機(jī)技術(shù)的強(qiáng)大推動(dòng),。僅幾何而言,,兩門學(xué)科具有同樣的理論基礎(chǔ),即小孔成像和雙目視覺原理,。但在應(yīng)用和技術(shù)細(xì)節(jié)上,,兩者存在區(qū)別。如數(shù)字?jǐn)z影測(cè)量主要用于相對(duì)靜態(tài)的地形地物測(cè)繪,,使用航空和航天平臺(tái),,所用的相機(jī)通常為專業(yè)量測(cè)相機(jī);而計(jì)算機(jī)視覺主要以普通相機(jī)、手動(dòng)和車載移動(dòng)平臺(tái)為主,,用于運(yùn)動(dòng)目標(biāo)的實(shí)時(shí)重建與識(shí)別,,應(yīng)用領(lǐng)域包括人臉識(shí)別、機(jī)器人和無人駕駛車等大眾應(yīng)用領(lǐng)域,。在技術(shù)方法上,如相機(jī)檢校,,攝影測(cè)量一般布設(shè)有高精度三維檢校場(chǎng),,而計(jì)算機(jī)視覺常采用二維平面棋盤。在空中三角測(cè)量方面,,攝影測(cè)量一般用嚴(yán)密的光束法區(qū)域網(wǎng)平差,而在計(jì)算機(jī)視覺中一般稱為從運(yùn)動(dòng)恢復(fù)結(jié)構(gòu)(structure from motion, SfM),除了用全局的光束法平差,,也采用一些非全局解法,,如增量式的局部平差、濾波等;這些差異源于攝影測(cè)量需要更高的測(cè)量精度,。此外,,還有一些近似等價(jià)的概念,由于學(xué)科的發(fā)展而具有不同的稱呼,。如平差中的粗差探測(cè),,攝影測(cè)量中稱為選權(quán)迭代的方法,在計(jì)算機(jī)視覺中則稱為權(quán)衰減法;又如為了處理法方程系數(shù)陣(即Hessian矩陣)接近奇異的問題,,計(jì)算機(jī)視覺中常用L-M(Levenberg-Marquardt)算法,,而攝影測(cè)量中常用嶺估計(jì)法。一般而言,,計(jì)算機(jī)視覺中理論的嚴(yán)密性要高于攝影測(cè)量,,算法發(fā)展也非常迅速,,當(dāng)然,反過來說,,攝影測(cè)量在工程和實(shí)用性方面可能更占優(yōu)勢(shì)。 計(jì)算機(jī)視覺中的同時(shí)定位與地圖構(gòu)建(simul-taneous localization and mapping, SLAM)已經(jīng)成為一個(gè)重要研究支流,,是機(jī)器人和無人駕駛車的必備技術(shù)。早期的SLAM以激光掃描儀為主,,這也是SLAM中Mapping的由來;后來基于視覺的SLAM(Visual SLAM)成為主流,,并與攝影測(cè)量特別是實(shí)時(shí)攝影測(cè)量在各個(gè)研究點(diǎn)上(匹配、平差,、定位和重建)都有共同之處。實(shí)際上,,Visual SLAM的原理與攝影測(cè)量的空中三角測(cè)量類似,。空中三角測(cè)量與SLAM的明顯區(qū)別在于,,前者是通過連接點(diǎn)構(gòu)建航帶,確定航攝儀的6個(gè)外方位元素,,即攝站定位;而后者在定位的同時(shí)生成密集點(diǎn)云。早在21世紀(jì)初,,美國(guó)為了精確測(cè)量“勇氣號(hào)”和“機(jī)遇號(hào)”火星探測(cè)器的具體位置,,就采用了空中三角測(cè)量區(qū)域網(wǎng)平差的原理,根據(jù)每天獲得的火星表面的序列影像,,通過匹配同名點(diǎn),,建立“航帶”模型,以此精確計(jì)算每個(gè)攝站點(diǎn)的坐標(biāo)位置,,以糾正遙測(cè)定位產(chǎn)生的誤差,。該項(xiàng)目的首席研究員是時(shí)任俄亥俄州立大學(xué)測(cè)量系教授的李榮興博士,。圖 1所示為“勇氣號(hào)”火星探測(cè)器基于序列影像采用區(qū)域網(wǎng)平差對(duì)火星探測(cè)器進(jìn)行精確導(dǎo)航與定位的示意圖,藍(lán)色為遙測(cè)的位置,,紅色為糾正后的位置。這一實(shí)例說明,,攝影測(cè)量工作者早就采用了區(qū)域網(wǎng)平差的方法為火星機(jī)器人導(dǎo)航定位,,即Visual SLAM,。 由此可見,,攝影測(cè)量與計(jì)算機(jī)視覺在原理、方法和應(yīng)用上都有很多相通的地方。在進(jìn)入21世紀(jì)后,,兩者的融合速度又得到進(jìn)一步提升,,它們之間的技術(shù)交叉點(diǎn)是無人機(jī)和車載移動(dòng)平臺(tái),。攝影測(cè)量的一個(gè)重要發(fā)展方向是地面移動(dòng)測(cè)量系統(tǒng),,它可以用來采集道路和街景;而計(jì)算機(jī)視覺同樣關(guān)注道路信息的提取與重建,,并應(yīng)用于機(jī)器人、城市地圖,、智能交通和自動(dòng)駕駛汽車中,。同時(shí),,無人機(jī)航攝技術(shù)除了是攝影測(cè)量中的一個(gè)方便快捷的測(cè)量技術(shù),,也是計(jì)算機(jī)視覺所關(guān)注的未來焦點(diǎn),。 由于計(jì)算機(jī)視覺領(lǐng)域研究學(xué)者云集,,應(yīng)用領(lǐng)域又很廣泛,,發(fā)展了大量新理論和新方法。攝影測(cè)量工作者應(yīng)在這場(chǎng)技術(shù)變革中擁抱新技術(shù),,學(xué)會(huì)跨界融合,,并發(fā)揮自己的優(yōu)勢(shì),貢獻(xiàn)自己的智慧,,方能使自己的學(xué)科立于不敗之地,同時(shí)與其他學(xué)科一起推動(dòng)智能科學(xué)的發(fā)展,。 為了促進(jìn)測(cè)繪遙感學(xué)科與計(jì)算機(jī)視覺的交叉融合,,緊跟人工智能領(lǐng)域的技術(shù)潮流,,國(guó)內(nèi)學(xué)者組織了專門的人工智能研究團(tuán)隊(duì),,積極行動(dòng)。圖 2為武漢大學(xué)研發(fā)的無人駕駛汽車和機(jī)器人,。無人駕駛汽車技術(shù)除了可以用于無人駕駛的交通通行以外,,一個(gè)重要應(yīng)用是用于無人測(cè)繪。無人駕駛汽車上裝載的各種傳感設(shè)備除了用于汽車本身的導(dǎo)航定位以外,,還可以自動(dòng)獲取道路及周邊環(huán)境信息,,進(jìn)行自動(dòng)測(cè)量。智能機(jī)器人也將廣泛應(yīng)用于室內(nèi)外測(cè)量,,特別是一些困難和危險(xiǎn)地區(qū),,如煤礦井下測(cè)量等。一方面,,測(cè)繪遙感學(xué)者在人工智能大潮中參與人工智能技術(shù)的發(fā)展,,另一方面,人工智能技術(shù)的進(jìn)步將推動(dòng)測(cè)繪遙感技術(shù)更深層次的變革,。 2機(jī)器學(xué)習(xí)及其在攝影測(cè)量與遙感領(lǐng)域的應(yīng)用 當(dāng)前人工智能發(fā)展的一個(gè)重要方向是機(jī)器學(xué)習(xí),。從1955年John McCarthy提出人工智能的概念以來,機(jī)器學(xué)習(xí)就作為人工智能的一個(gè)重要方向,。機(jī)器學(xué)習(xí)的基本原理是尋找某種函數(shù),,能從數(shù)據(jù)與類別之間得到正確或最佳的映射?;诮y(tǒng)計(jì)學(xué)習(xí)的思想不僅長(zhǎng)期應(yīng)用于機(jī)器學(xué)習(xí),,在攝影測(cè)量與遙感領(lǐng)域也得到廣泛應(yīng)用,如監(jiān)督和非監(jiān)督目標(biāo)識(shí)別與分類方法,?;趥鹘y(tǒng)統(tǒng)計(jì)學(xué)習(xí)的遙感影像的監(jiān)督與非監(jiān)督分類以及經(jīng)典的神經(jīng)元網(wǎng)絡(luò)方法的研究進(jìn)展一直很慢,目標(biāo)識(shí)別的準(zhǔn)確度和分類精度難以大幅提高,,機(jī)器學(xué)習(xí)有效地改變了這一現(xiàn)狀,。 2006年,Hinton的研究表明,,采用一種逐層的貪心算法可實(shí)現(xiàn)深度神經(jīng)元網(wǎng)絡(luò)的訓(xùn)練,,深度學(xué)習(xí)的概念由此浮出水面。深度學(xué)習(xí)算法的突破來自于LeCun Yann,、Bengio Yoshua和Hinton Geoffrey 3位科學(xué)家在深度卷積網(wǎng)絡(luò)方面的杰出工作,。他們通過多層的深度卷積處理抽取圖像的抽象特征,而這原本深度依賴算法設(shè)計(jì)者的經(jīng)驗(yàn),。目前的研究進(jìn)展已經(jīng)有能力訓(xùn)練一個(gè)深度網(wǎng)絡(luò),,根據(jù)目標(biāo)任務(wù)的不同來選取不同的特征,實(shí)現(xiàn)了人工智能方法和實(shí)踐上的突破,。2012年,,在ImageNet挑戰(zhàn)賽中,深度學(xué)習(xí)的方法奪得第一,,并一舉超過傳統(tǒng)機(jī)器學(xué)習(xí)方法10個(gè)百分點(diǎn);而第二至第四名相差不超過1%,,顯示了傳統(tǒng)方法的天花板,。隨后的大量實(shí)驗(yàn)表明,無論在圖像分類,、物體識(shí)別,、語(yǔ)音識(shí)別、遙感應(yīng)用等關(guān)于學(xué)習(xí)和語(yǔ)義的研究領(lǐng)域,,深度學(xué)習(xí)都占據(jù)上風(fēng),,深度學(xué)習(xí)的時(shí)代由此開啟。 除了自然語(yǔ)言處理(natural language processing, NLP)以外,,深度學(xué)習(xí)最重要的應(yīng)用是在視覺圖像上,,如手寫字體識(shí)別、自然圖像分類[18]和目標(biāo)檢索等等,。深度學(xué)習(xí)在計(jì)算機(jī)視覺領(lǐng)域得到廣泛應(yīng)用,,推動(dòng)了人臉識(shí)別、機(jī)器人和無人駕駛車等相關(guān)技術(shù)的蓬勃發(fā)展,。由于攝影測(cè)量的研究對(duì)象也是視覺圖像,,因此攝影測(cè)量也成為深度學(xué)習(xí)發(fā)展最受益的學(xué)科之一。 攝影測(cè)量的兩個(gè)主要任務(wù)是目標(biāo)幾何定位和屬性的提取,,包括從二維像片重建三維幾何以及地物要素分類,。將深度學(xué)習(xí)應(yīng)用于幾何定位目前還未進(jìn)入攝影測(cè)量研究領(lǐng)域,但已經(jīng)出現(xiàn)在密切相關(guān)的計(jì)算機(jī)視覺領(lǐng)域,,如SfM與SLAM,。然而,深度學(xué)習(xí)方法的定位精度目前尚不能同傳統(tǒng)的方法相比,,約相差一個(gè)數(shù)量級(jí),。對(duì)于三維重建中的關(guān)鍵技術(shù)——密集匹配,深度學(xué)習(xí)已經(jīng)取得很好的應(yīng)用效果,。如在KITTI等標(biāo)準(zhǔn)數(shù)據(jù)集上,,前10名的方法都是深度學(xué)習(xí)方法,展現(xiàn)了深度學(xué)習(xí)方法的應(yīng)用潛力,。 深度學(xué)習(xí)在攝影測(cè)量領(lǐng)域的另一個(gè)主要任務(wù),,即影像的語(yǔ)義提取方面,則取得了重要進(jìn)展,,并開始普及應(yīng)用,。基于圖像的建筑,、道路網(wǎng)等地物的提取數(shù)十年來一直是熱門課題,。雖然經(jīng)典方法取得一定的效果,但距離實(shí)用、市場(chǎng),、商業(yè)軟件尚有一定的距離,。卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network, CNN)目前已成為道路網(wǎng)提取的主流方法。文獻(xiàn)通過級(jí)聯(lián)式端到端CNN同時(shí)實(shí)現(xiàn)了道路網(wǎng)提取及道路中心線提取,,與其他方法比較,,分類精度更高。文獻(xiàn)通過CNN結(jié)合線積分卷積克服了樹木遮蔽,、房屋陰影造成的道路網(wǎng)殘缺問題。文獻(xiàn)通過非監(jiān)督學(xué)習(xí)預(yù)處理和空間相關(guān)性的應(yīng)用,,利用深度學(xué)習(xí)極大地提高了復(fù)雜城市場(chǎng)景的道路提取精度,。文獻(xiàn)采用CNN實(shí)現(xiàn)了高分辨率多光譜衛(wèi)星影像的建筑物提取。文獻(xiàn)在影像平面上進(jìn)行二維卷積,,在光譜方向上進(jìn)行一維卷積,,分別提取出影像空間特征和光譜特征,取得了比隨機(jī)森林和全連接NLP更好的作物分類精度,。肖志鋒等使用深度學(xué)習(xí)方法對(duì)天地圖上的高分辨率遙感影像進(jìn)行語(yǔ)義檢索,,能夠檢索37類地物目標(biāo),準(zhǔn)確率達(dá)90%以上,。目前,,深度學(xué)習(xí)已經(jīng)廣泛用于遙感圖像的分類、識(shí)別,、檢索和提取,,在語(yǔ)義上基本全面碾壓了傳統(tǒng)的方法。表 1為肖志鋒等開發(fā)的基于深度學(xué)習(xí)方法的遙感影像內(nèi)容檢索系統(tǒng),。從表 1可以看出,,這里采用的基于深度級(jí)聯(lián)降維網(wǎng)絡(luò)的遙感圖像特征提取方法(deep convolutional neural network, DCNN)的查全率和精度大大高于傳統(tǒng)的LBF-HF(local binary pattern histogram Fourier)和EFT-HOG(the elliptic Fourier transform-histogram of oriented gradients)方法,其精度高出了20%~30%,。 基于深度學(xué)習(xí)的方法除了可有效地用于遙感影像的地物分類與目標(biāo)檢索以外,,在其他攝影測(cè)量與遙感數(shù)據(jù)處理方面也有廣泛用途。例如,,胡翔云等采用深度學(xué)習(xí)方法進(jìn)行激光雷達(dá)(light detection and ranging, LiDAR)點(diǎn)云數(shù)據(jù)處理,。山地林區(qū)的點(diǎn)云數(shù)據(jù)濾波,從點(diǎn)云數(shù)據(jù)提取數(shù)字高程模型,,自動(dòng)化很難實(shí)現(xiàn),,一般需要人機(jī)交互作業(yè),耗費(fèi)大量人力物力,。目前該小組采用機(jī)器學(xué)習(xí)方法,,在人機(jī)交互作業(yè)過程中進(jìn)行訓(xùn)練,學(xué)習(xí)到知識(shí),然后再應(yīng)用于點(diǎn)云數(shù)據(jù)的自動(dòng)處理中,,自動(dòng)處理的準(zhǔn)確率達(dá)到95%以上,,大大提高了作業(yè)效率。圖 3所示為廣東某地的點(diǎn)云提取的地形斷面,,可以看出,,該地區(qū)相當(dāng)復(fù)雜,但是用深度學(xué)習(xí)獲取的地面模型斷面還是相當(dāng)準(zhǔn)確的(紅色曲線),。這說明深度學(xué)習(xí)方法在點(diǎn)云數(shù)據(jù)自動(dòng)處理方面有很好的應(yīng)用前景,。同理,深度學(xué)習(xí)方法在測(cè)繪領(lǐng)域的其他方面,,特別是需要人機(jī)交互數(shù)據(jù)處理等方面,,如影像變化檢測(cè)、地圖綜合,,也將發(fā)揮重要作用,,使之更加智能化和自動(dòng)化。 3基于時(shí)空大數(shù)據(jù)認(rèn)知與推理 人機(jī)物三元世界(物理世界,、人類社會(huì),、信息空間)是一個(gè)多人、多機(jī),、多物組成的動(dòng)態(tài)開放的網(wǎng)絡(luò)社會(huì),,如圖 4所示。在這個(gè)三元世界中,,一方面,,人們采用測(cè)量、遙感,、野外調(diào)查和最近興起的傳感網(wǎng)技術(shù)獲取物理世界的信息;另一方面,,人們應(yīng)用社會(huì)調(diào)查以及近幾年興起的互聯(lián)網(wǎng)、智能手機(jī),、導(dǎo)航設(shè)備,、可穿戴設(shè)備和監(jiān)控視頻等工具獲取人類社會(huì)經(jīng)濟(jì)信息。這些信息形成了多種多樣的海量時(shí)空大數(shù)據(jù),。這些數(shù)據(jù)成為對(duì)物理世界和人類社會(huì)認(rèn)知與推理的源泉,,這也是人工智能的使命之一,而且是用于輔助決策的高級(jí)智能,。 與計(jì)算機(jī)視覺和深度學(xué)習(xí)等人工智能領(lǐng)域具有的比較完善的理論與方法不同,,對(duì)物理世界和人類社會(huì)認(rèn)知與推理的人工智能的理論與方法目前還很不成熟,并且不成體系,。但是這并不妨礙人們?cè)谌斯ぶ悄艿目蚣芟虏捎么髷?shù)據(jù)分析方法開展智慧城市,、智能社區(qū)的研究與應(yīng)用。 經(jīng)過幾十年的發(fā)展,地理信息系統(tǒng)已經(jīng)有了比較完善的空間分析理論與方法體系,。但是,,加入了傳感網(wǎng)和社會(huì)感知設(shè)備的時(shí)空數(shù)據(jù)分析與挖掘的理論與方法還不夠成熟,目前正處于快速發(fā)展之中,。 時(shí)空數(shù)據(jù)可分為兩類不同類型,,一類來自測(cè)繪遙感及地面?zhèn)鞲芯W(wǎng)的反映地球表層及環(huán)境特征的時(shí)空數(shù)據(jù);另一類是來自社會(huì)感知設(shè)備,,包括互聯(lián)網(wǎng),、智能手機(jī)、導(dǎo)航設(shè)備,、可穿戴設(shè)備,、視頻監(jiān)控設(shè)備以及社會(huì)調(diào)查獲取的時(shí)空數(shù)據(jù),它主要反映人為活動(dòng)及社會(huì)經(jīng)濟(jì)形態(tài)特征,。第一類數(shù)據(jù)比較規(guī)范,適于數(shù)值分析與計(jì)算,,所以通常采用數(shù)學(xué)模型來進(jìn)行模擬及預(yù)測(cè)分析,。例如,陳能成等采用航空航天遙感與傳感網(wǎng)集成技術(shù)建立了長(zhǎng)江流域?qū)Φ赜^測(cè)傳感網(wǎng)系統(tǒng),,該系統(tǒng)除包含航空航天遙感數(shù)據(jù),、基礎(chǔ)地理信息數(shù)據(jù)以外,還包含了氣象,、水文,、航標(biāo)、土壤濕度等32種共上萬個(gè)地面?zhèn)鞲芯W(wǎng)實(shí)時(shí)數(shù)據(jù),。通過這些實(shí)時(shí)動(dòng)態(tài)數(shù)據(jù),,能對(duì)流域內(nèi)的水庫(kù)和河流的水位、水量,、泥沙,、河道進(jìn)行分析和預(yù)測(cè),實(shí)現(xiàn)水利的智能調(diào)度,,為蓄水發(fā)電和防洪抗旱等提供決策支持,。圖 5為長(zhǎng)江流域天空地對(duì)地觀測(cè)傳感網(wǎng)示意圖。 來自社會(huì)感知設(shè)備的時(shí)空數(shù)據(jù)是一種新型數(shù)據(jù),,它的結(jié)構(gòu)和形式更加多樣,。例如互聯(lián)網(wǎng)數(shù)據(jù)主要以多媒體的文本數(shù)據(jù)為主,導(dǎo)航軌跡數(shù)據(jù)是流式的點(diǎn)坐標(biāo)數(shù)據(jù),,視頻監(jiān)控?cái)?shù)據(jù)是圖像數(shù)據(jù),,而智能手機(jī)數(shù)據(jù)則有文本、點(diǎn)坐標(biāo)和圖像等多種數(shù)據(jù)。這些數(shù)據(jù)復(fù)雜多樣,,有些時(shí)空標(biāo)簽明顯,,有些則需要經(jīng)過分析處理才能添加時(shí)空標(biāo)簽。目前多個(gè)領(lǐng)域的學(xué)者,,包括計(jì)算機(jī)應(yīng)用,、測(cè)繪遙感、地理信息科學(xué),、城市規(guī)劃與管理等,,都對(duì)社會(huì)感知的時(shí)空數(shù)據(jù)感興趣,,認(rèn)為該數(shù)據(jù)是社會(huì)科學(xué)與信息領(lǐng)域交叉的新興學(xué)科,,是建設(shè)智能城市和智慧社區(qū)的有效手段。 社會(huì)感知時(shí)空數(shù)據(jù)包含了多源,、異構(gòu),、海量的數(shù)據(jù)的同時(shí)包含了復(fù)雜的社會(huì)網(wǎng)絡(luò)關(guān)系。針對(duì)社會(huì)感知的時(shí)空數(shù)據(jù)分析方法主要包含以下方面:①數(shù)據(jù)預(yù)處理:數(shù)據(jù)清理,、數(shù)據(jù)集成,、數(shù)據(jù)歸約、數(shù)據(jù)變換;②時(shí)空分析:時(shí)間序列分析,、空間自相關(guān)分析,、空間聚類分析;③網(wǎng)絡(luò)分析:網(wǎng)絡(luò)的構(gòu)建、學(xué)習(xí)與發(fā)現(xiàn);④時(shí)空挖掘:文本挖掘,、特征建立,、學(xué)習(xí)與知識(shí)模式的提取。通過時(shí)空數(shù)據(jù)分析與挖掘來揭示人類社會(huì)活動(dòng)及行為規(guī)律,。圖 6為方志祥等使用深圳市民手機(jī)移動(dòng)位置信息勾畫了深圳人活動(dòng)空間的主要范圍和熱點(diǎn)區(qū)域(圖 6(a)),,并探測(cè)出社區(qū)的邊界(圖 6(b))。利用社會(huì)感知時(shí)空大數(shù)據(jù)揭示城鎮(zhèn)居民社會(huì)行為及活動(dòng)規(guī)律是比人臉識(shí)別,、三維建模,、語(yǔ)言翻譯等更加復(fù)雜、更高級(jí)的人工智能,。 4結(jié) 語(yǔ) 人工智能正在掀起一場(chǎng)技術(shù)革命和產(chǎn)業(yè)革命,測(cè)繪遙感既是人工智能技術(shù)的受益者,,又是人工智能技術(shù)的貢獻(xiàn)者。攝影測(cè)量從靜態(tài)走向動(dòng)態(tài)與實(shí)時(shí),,并將與計(jì)算機(jī)視覺深度融合,;遙感應(yīng)用人工智能技術(shù)解決影像解譯、信息自動(dòng)提取問題,;互聯(lián)網(wǎng),、物聯(lián)網(wǎng)、傳感網(wǎng)獲取的海量時(shí)空數(shù)據(jù)是人工智能的血液,,為機(jī)器學(xué)習(xí),、智能抉擇與服務(wù)提供支撐。本文首先回顧了攝影測(cè)量與機(jī)器視覺的歷史,,并分析了兩者間的緊密聯(lián)系,。然后,介紹了深度學(xué)習(xí)以及卷積神經(jīng)元網(wǎng)絡(luò)的基本思想,;分析了攝影測(cè)量與遙感,、計(jì)算機(jī)視覺、機(jī)器學(xué)習(xí)等領(lǐng)域的相關(guān)發(fā)展,,以及深度學(xué)習(xí)在遙感影像目標(biāo)檢索與激光測(cè)高數(shù)據(jù)處理中的應(yīng)用,;最后,分析了測(cè)繪遙感與社會(huì)感知方法獲取的時(shí)空數(shù)據(jù)對(duì)自然和社會(huì)認(rèn)知與推理的潛力,,介紹了基于時(shí)空大數(shù)據(jù)的流域與城市智能管理和分析中的應(yīng)用,。 面對(duì)人工智能的迅猛發(fā)展,攝影測(cè)量工作者是僅跟蹤應(yīng)用計(jì)算機(jī)視覺成果,,還是主動(dòng)作為;是僅應(yīng)用現(xiàn)有的深度學(xué)習(xí)方法,,還是構(gòu)建新的遙感深度學(xué)習(xí)網(wǎng)絡(luò),;社會(huì)感知信息如何與測(cè)繪遙感信息融合用于揭示自然物理空間發(fā)展和人類社會(huì)行為及活動(dòng)規(guī)律,發(fā)展更高級(jí)更復(fù)雜的人工智能,;這些是測(cè)繪遙感工作者面臨的新任務(wù)和新挑戰(zhàn),。【來源:武漢大學(xué)學(xué)報(bào)·信息科學(xué)版】 |
|