omniture

目標檢測領域最優(yōu) 中科智云獲國際頂級賽事VOT兩項挑戰(zhàn)賽冠軍

2021-12-08 14:12 4438

上海2021年12月8日 /美通社/ -- 近日,繼2019-2020年獲得視覺跟蹤領域國際頂級賽事 VOT(Visual-Object-Tracking Challenge )多項挑戰(zhàn)賽冠軍以來,中科智云-大連理工聯(lián)合AI實驗室在今年計算機視覺三大頂會之一 -- 國際計算機視覺大會ICCV2021上舉辦的VOT 2021中再次披荊斬棘,包攬了五個賽道中兩項挑戰(zhàn)賽的冠軍

 VOT-RT2021(實時目標跟蹤挑戰(zhàn)賽);

 VOT-RGBD2021(顏色和深度的長時跟蹤挑戰(zhàn)賽)。

VOT是國際目標跟蹤領域最權威的測評平臺,由于每年的評測序列都會更新,且標注的精確度逐年提高,VOT競賽也被視為視覺跟蹤領域最難的競賽。VOT挑戰(zhàn)為跟蹤社區(qū)提供了一種精確定義和可重復的方法,用于比較短期跟蹤者和長期跟蹤者,以及討論視覺跟蹤領域的評估和進展的通用平臺。


視覺目標跟蹤是計算機視覺中的一個重要研究方向,有著廣泛的應用,如:視頻監(jiān)控人機交互,無人駕駛等。傳統(tǒng)的目標跟蹤算法采用相關性運算方式來實現(xiàn)模板與搜索區(qū)域相似度的簡單融合。然而,相關運算本身是一個局部線性匹配過程,容易丟失語義信息,容易陷入局部最優(yōu),這可能是設計高精度跟蹤算法的瓶頸。


此次中科智云-大連理工聯(lián)合AI實驗室提出了一個新的基于Transformer 跟蹤框架TransT-M,能有效的結合注意力機制把模板和搜索區(qū)域的特征信息融合起來產(chǎn)生一個高性能目標跟蹤器。該注意力機制同時又融合了基于自我注意的自我上下文增強模塊和基于交叉注意力的跨特征增強模塊,確保長距離跟蹤需要的充足的上下文有效信息,同時避免了不必要的信息干擾。實驗表明,我們的 TransT-M 在六個具有挑戰(zhàn)性的數(shù)據(jù)集上,尤其是在大規(guī)模 LaSOT、TrackingNet 和 GOT-10k 基準測試上,無論在精度還是效率遠遠超出了目前現(xiàn)有算法,取得了非常不俗的結果。目前該算法已經(jīng)納入到智云X-Brain平臺的目標物體視頻模塊中使用,為X-Brain的客戶提供最好的體驗。

中科智云近年來已經(jīng)先后在視頻跟蹤分割領域內(nèi)的多個國際挑戰(zhàn)大賽中獲得了領先的名次,標志著中科智云在視頻目標檢測,跟蹤和分割技術等視頻智能分析的關鍵技術已處于業(yè)界領先水平。這些技術將在國內(nèi)外的智能建造、智慧城市、智慧農(nóng)業(yè)、智慧交通、智慧醫(yī)療等領域的5G+AR視頻業(yè)務中獲得廣泛應用。

歷屆VOT獲獎情況:

2019年獲得 VOT-LT2019(Long-term tracking challenge,即長時跟蹤挑戰(zhàn)賽)冠軍,
2020年獲得三項挑戰(zhàn)賽的冠軍
VOT-RT2020(Short-term Real-time tracking challenge,即實時跟蹤挑戰(zhàn)賽)
VOT-LT2020(Long-term tracking challenge,即長時跟蹤挑戰(zhàn)賽)
VOT-RGBD2020(Color and depth long-term tracking challenge。即顏色和深度的長期跟蹤挑戰(zhàn)賽)

中科智云作為計算機視覺領域的“佼佼者”,擁有全球頂尖的AI技術研發(fā)能力,并已實現(xiàn)關鍵核心技術國產(chǎn)可控。目前已與牛津大學、帝國理工等全球知名院校成立7家聯(lián)合實驗室;成立兩年來,公司已申請近50件國內(nèi)國際AI專利,多次在全球頂級會議發(fā)布論文,并斬獲多個國際大賽佳績。

消息來源:中科智云科技有限公司
China-PRNewsire-300-300.png
全球TMT
微信公眾號“全球TMT”發(fā)布全球互聯(lián)網(wǎng)、科技、媒體、通訊企業(yè)的經(jīng)營動態(tài)、財報信息、企業(yè)并購消息。掃描二維碼,立即訂閱!
collection