海康威視在PASCAL VOC目標(biāo)檢測(cè)中奪冠 刷新世界紀(jì)錄
來(lái)源:數(shù)字音視工程網(wǎng) 編輯:郭雨婷 2016-09-28 09:52:02 加入收藏 咨詢
![](http://static.dav01.com/site/onlineExhibition/mould1/images/close.png)
所在單位: | * |
姓名: | * |
手機(jī): | * |
職位: | |
郵箱: | * |
其他聯(lián)系方式: | |
咨詢內(nèi)容: | |
驗(yàn)證碼: |
|
(數(shù)據(jù)來(lái)源:http://host.robots.ox.ac.uk:8080/leaderboard/displaylb.php?challengeid=11&compid=4 )
PASCAL VOC目標(biāo)檢測(cè)任務(wù)囊括了車、人、貓、狗等20類常見(jiàn)目標(biāo)。訓(xùn)練樣本較少、場(chǎng)景變化多端,非常具有挑戰(zhàn)性。提到奪冠之道,??低曆芯吭撼?wù)副院長(zhǎng)浦世亮表示:“我們的預(yù)研團(tuán)隊(duì)基于Faster R-CNN深度學(xué)習(xí)目標(biāo)檢測(cè)算法,通過(guò)調(diào)整網(wǎng)絡(luò)結(jié)構(gòu)、上下文建模、優(yōu)化訓(xùn)練和預(yù)測(cè)等策略,大幅提升了檢測(cè)性能。研究成果可以應(yīng)用到視頻監(jiān)控的車輛檢測(cè)、車牌識(shí)別、人體檢測(cè)、人體屬性分析、視頻結(jié)構(gòu)化等產(chǎn)品中,將大幅提升產(chǎn)品性能與應(yīng)用效果。長(zhǎng)遠(yuǎn)來(lái)看,在智能安全監(jiān)控、汽車輔助駕駛、智能交通感知、視頻語(yǔ)義理解、機(jī)器人和無(wú)人機(jī)等各方面都有著巨大的應(yīng)用價(jià)值。”
PASCAL VOC可謂視覺(jué)識(shí)別類競(jìng)賽的鼻祖,是由利茲大學(xué)、蘇黎世聯(lián)邦理工學(xué)院、愛(ài)丁堡大學(xué)、微軟、牛津大學(xué)等組織的一個(gè)視覺(jué)識(shí)別競(jìng)賽,包含了物體分類、目標(biāo)檢測(cè)、圖像分割等任務(wù)。PASCAL VOC對(duì)計(jì)算機(jī)視覺(jué)的發(fā)展具有深遠(yuǎn)而巨大的影響,后續(xù)的ImageNet競(jìng)賽的任務(wù)設(shè)置就基本沿用了它的設(shè)定。此前,微軟、英特爾、CMU、Facebook、UC Berkeley等國(guó)際頂尖研發(fā)團(tuán)隊(duì)先后在這個(gè)排行榜上刷新紀(jì)錄。
??低曆芯吭河芍悄芊治?、大數(shù)據(jù)技術(shù)、感知技術(shù)和多媒體技術(shù)等專業(yè)團(tuán)隊(duì)組成,突出在音視頻技術(shù)的專注和積累,著重研究視音頻的智能算法、大數(shù)據(jù)的分析、挖掘和計(jì)算,同時(shí)針對(duì)新的圖像傳感器等感知技術(shù),視頻的播放技術(shù),人機(jī)交互等多媒體技術(shù)進(jìn)行深入研究。目前在??低曆芯吭罕姸囝I(lǐng)域的研究都走在行業(yè)前列,2015年,??低曆芯吭涸贙ITTI的評(píng)測(cè)中,車輛檢測(cè)和車頭朝向估計(jì)兩項(xiàng)任務(wù)評(píng)分均排名世界第一;在MOT Challenge算法測(cè)評(píng)中獲得“計(jì)算機(jī)視覺(jué)的多目標(biāo)跟蹤算法”世界第一;名列TRECVID2016 SED第二名、PASCAL VOC 2012圖像分割任務(wù)第二名。
評(píng)論comment