人工智能實(shí)時(shí)用文字描述監(jiān)控錄像內(nèi)容

mtjs 2010-06-03

展開全文

《MIT技術(shù)評(píng)論》報(bào)道,，加州大學(xué)洛杉磯分校（UCLA）的研究人員開發(fā)出一種計(jì)算機(jī)視覺系統(tǒng)原型，能實(shí)時(shí)用文字描述監(jiān)控錄像的內(nèi)容,。負(fù)責(zé)這項(xiàng)研究的統(tǒng)計(jì)學(xué)和計(jì)算機(jī)科學(xué)教授朱送春（Song-Chun Zhu）稱,，我們周圍的視頻資源越來越多，搜索視頻正成為一個(gè)巨大的難題,。朱指出,，幾乎所有的圖像和視頻搜索都是基于周圍的文字描述。朱與同事Benjamin Yao,、Haifeng Gong開發(fā)出名為I2T的系統(tǒng),，試圖改變這種情況。I2T是Image to Text（圖像到文本）的縮寫,，它利用一系列計(jì)算機(jī)視覺算法,，抽取圖像或視頻幀作為輸入源，然后輸出圖像或視頻所描述內(nèi)容的摘要文字。用戶就可以用簡(jiǎn)單的文本搜索進(jìn)行搜索,。I2T系統(tǒng)已經(jīng)與ObjectVideo合作,，對(duì)交通監(jiān)控錄像進(jìn)行測(cè)試。朱也已經(jīng)將部分?jǐn)?shù)據(jù)發(fā)布在網(wǎng)上供其他研究人員免費(fèi)使用,。

本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,，所有內(nèi)容均由用戶發(fā)布，不代表本站觀點(diǎn),。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式,、誘導(dǎo)購買等信息，謹(jǐn)防詐騙,。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,，請(qǐng)點(diǎn)擊一鍵舉報(bào)。

轉(zhuǎn)藏 分享

QQ空間 QQ好友新浪微博微信

獻(xiàn)花（0） +1

來自： mtjs > 《AI & AL》

舉報(bào)/認(rèn)領(lǐng)