《MIT技術(shù)評(píng)論》報(bào)道,,加州大學(xué)洛杉磯分校(UCLA)的研究人員開發(fā)出一種計(jì)算機(jī)視覺系統(tǒng)原型,能實(shí)時(shí)用文字描述監(jiān)控錄像的內(nèi)容,。負(fù)責(zé)這項(xiàng)研究的統(tǒng)計(jì)學(xué)和計(jì)算機(jī)科學(xué)教授朱送春(Song-Chun Zhu)稱,,我們周圍的視頻資源越來越多,搜索視頻正成為一個(gè)巨大的難題,。朱指出,,幾乎所有的圖像和視頻搜索都是基于周圍的文字描述。朱與同事Benjamin Yao,、Haifeng Gong開發(fā)出名為I2T的系統(tǒng),,試圖改變這種情況。I2T是Image to Text(圖像到文本)的縮寫,,它利用一系列計(jì)算機(jī)視覺算法,,抽取圖像或視頻幀作為輸入源,然后輸出圖像或視頻所描述內(nèi)容的摘要文字。用戶就可以用簡(jiǎn)單的文本搜索進(jìn)行搜索,。I2T系統(tǒng)已經(jīng)與ObjectVideo合作,,對(duì)交通監(jiān)控錄像進(jìn)行測(cè)試。朱也已經(jīng)將部分?jǐn)?shù)據(jù)發(fā)布在網(wǎng)上供其他研究人員免費(fèi)使用,。
|
|