近日,科大訊飛憑借在道路目標檢測領域多年的技術探索,刷新了Cityscapes 3D目標檢測任務的全球最好成績,得到檢測分數(DS)42.9,取得了該項評測的第一名。這也是科大訊飛繼2017年、2018年參與測評之後,再一次刷新Cityscapes的世界紀錄。
此次評測,科大訊飛借鑒了已在城市交通出行場景下應用的Anchor-Free車輛檢測技術,將2D目標檢測技術升級至3D,並結合3D到2D重投影的特殊先驗資訊進行演算法遷移,通過結合語義、上下文資訊、位置先驗資訊以及目標形狀先驗資訊等,提取精確的3D目標檢測框,構建形成一套具有豐富上下文資訊的多層次單目3D目標檢測方案。
什麼是Cityscapes和3D目標檢測任務?
Cityscapes是包含城市大量街道圖片、視頻用來訓練識別的數據集,由戴姆勒(DAIMLER)等在內的三家德國單位聯合提供,吸引了華為、阿裏、微軟、北大、中科院、MIT等上百個國內外著名AI實驗室和頂尖學術研究機構積極參與,是CVPR、ECCV等國際頂級會議中實例分割任務常用的權威測試數據集。
2020年,在CVPR workshop上,Cityscapes公開了新的單目圖像3D目標檢測評測集,包含car, truck, bus, train, bicycle, motorcycle共6種類別目標。每種目標需要檢測出其在空間中的三維坐標位置,目標的長、寬、高以及目標在空間中的旋轉姿態。基于視覺的3D目標檢測,是圖像處理和電腦視覺領域的重要研究方向之一。
基于視覺的3D目標檢測有什麼重要意義?
基于科大訊飛在AI+3D視覺技術的結合探索之下,未來3D目標檢測將能在城市治理、工業智能、機器智能、智能駕駛等多方面發揮廣泛的作用。
比如在城市交通管理場景中,當前交通違法判定主要還是依靠固定攝像頭抓拍、二維圖像判定的方式,往往存在視覺盲區。若將3D目標檢測技術接入公安交警現有的交通視頻智能分析平臺,與AI巡檢相結合,可以進一步精確判定車輛車型,基于空間位置感知和連續軌跡跟蹤,計算出車輛的行駛速度、空間軌跡等,為越斑馬線停車、超速抓拍、擁堵感知等違法異常事件判斷提供更實時、更精準的決策依據。這不僅能夠達到對已有設備資源的最大化利用,實現降本提效,還能夠提升城市數字化治理能力,助力文明出行、平安出行。
AI賦能,建設美好世界
如何讓機器變得更加“聰明”,具備足夠的學習能力,並更精準地貼合現實使用需求,是所有人工智慧研發團隊所需解決的最大難題。科大訊飛直面檢測精細度更高、場景更為復雜、挑戰難度更大的3D目標檢測任務,並一舉刷新了世界紀錄,意味著科大訊飛已經具備了強大的AI技術硬核實力。
多年來,科大訊飛在人工智慧領域百花齊放,在基于深度學習的通用核心技術上厚積薄發。不僅在智能語音、機器翻譯等大眾熟悉的領域上在多項國際權威賽事上取得第一,在教育圖文、人臉識別等電腦視覺領域也深耕多年,擁有豐富的經驗和國際領先的技術,並已運用在教育、醫療、金融等多個行業,取得耀眼成績,獲得良好口碑。
未來,科大訊飛將繼續堅持源頭技術創新路線,秉持“頂天立地”的理念,加快開放應用場景,促進AI技術和各種應用場景相結合,加速人工智慧技術落地,建設美好世界。(李倩)