近日,,“2018中國人工智能應(yīng)用與生態(tài)峰會(huì)”在北京中關(guān)村軟件園國際會(huì)議中心舉行,,中國工程院院士,、新一代人工智能產(chǎn)業(yè)技術(shù)創(chuàng)新戰(zhàn)略聯(lián)盟理事長高文發(fā)表了《AI開源平臺(tái)的挑戰(zhàn)與機(jī)遇》的主題演講。
高文指出,,智慧城市已被談及多年,,“視頻監(jiān)控+AI”也成為眾多公司研究的方向。但現(xiàn)階段,,通過監(jiān)控?cái)z像頭讓城市變得更智智慧,,不僅僅是單一的視頻檢索和計(jì)算機(jī)視覺問題,而是在面臨海量信息和突發(fā)事件時(shí),,能否能迅速做出反應(yīng),、能否降低計(jì)算量、能否有效識(shí)別和檢索等一系列龐大的系統(tǒng)工程,。
現(xiàn)有視頻監(jiān)控體系的弊病,,使得很多復(fù)雜任務(wù)無法完成,即便是人工智能大規(guī)模滲入后,,需求方也往往為了一些特殊目的才加特定的智能攝像頭和處理系統(tǒng),。有些專用攝像頭只是用來識(shí)別車牌號(hào),有些攝像頭只用來識(shí)別人臉,,這種打補(bǔ)丁式的方法實(shí)際會(huì)帶來很多問題,。
針對(duì)這些問題,高文提出了“數(shù)字視網(wǎng)膜”的概念,。
高文院士在大會(huì)中指出,,承載數(shù)字視網(wǎng)膜的攝像頭需做兩件事:首先做好編碼;其次為后面的識(shí)別,,提取出所需的信息,。數(shù)字視網(wǎng)膜與人的眼睛既具有影像重構(gòu)(精細(xì)編碼視覺內(nèi)容),又具備特征提?。嫦蜃R(shí)別理解)的功能,。
數(shù)字視網(wǎng)膜最終如何實(shí)現(xiàn)?原則上這一部分把高效,、監(jiān)控視頻編碼(視頻特征的緊湊表達(dá))和特征集合起來緊湊地給它表達(dá)出來,。有了這些后,把它應(yīng)用在其中,,傳輸?shù)皆贫?,從而擁有了?shù)字視網(wǎng)膜功能。
整個(gè)數(shù)字視網(wǎng)膜實(shí)際上包含了三種核心技術(shù):基于背景模型的場景視頻編碼,、視頻特征的緊湊表達(dá),、視頻編碼與特征編碼的聯(lián)合優(yōu)化。
未來當(dāng)一對(duì)一模式變成一對(duì)多模式,,與此同時(shí),,一對(duì)多模式中的技術(shù)標(biāo)準(zhǔn)就位后,,可以把該技術(shù)標(biāo)準(zhǔn)進(jìn)一步優(yōu)化,然后嵌入在產(chǎn)品里中盡快地實(shí)踐和應(yīng)用,,使得城市將更容易治理,。