我國人工智能發展已經駛入快車道。截至2023年年底,我國人工智能核心産業規模接近5800億元,核心企業數量超過4400家,居全球第二。
人工智能領域的高速發展離不開算法技術的加速創新。作為人工智能的“三駕馬車”之一,算法是産業高質量發展的重要基礎。對提升人工智能核心技術實力發揮着至關重要的作用。
近年來,廣州琶洲發力算法産業建設,結合産業和區位優勢,不斷推出相關政策,組織活動,凝聚人才。今年5月,《廣州市數字經濟高質量發展規劃》正式公布,其中提到,海珠區要進一步打響“琶洲算谷”品牌,舉辦廣州·琶洲算法大賽,加快打造廣州市人工智能大模型生態集聚和創新應用高地。
第三屆琶洲算法大賽已經拉開帷幕,有什麼新驚喜等待發現?
經典領域新突破
作為廣州琶洲全國首創的重磅品牌活動之一,琶洲算法大賽至今已連續舉辦三屆。
在今年的幾大賽題中,中國人工智能學會聯合GigaVision組委會提出了“十億像素視覺智能”算法賽題——複雜場景長程軌跡預測(GigaTraj),受到各界關注。GigaVision挑戰賽是全球首個針對大場景、多對象及複雜關係問題的智能算法比賽,其去年的比賽吸引了全球超過1000支隊伍參與。
據了解,本次賽題的素材來自清華大學成像與智能技術實驗室的研究成果——非結構光場成像裝備(Unstructured Camera Array)。該研究攻克了寬視場與高分辨的矛盾,具備十億像素級的成像能力。基於該成像裝備,GigaVision團隊構建了國際首個具有大場景、多對象、複雜關係數據平台PANDA,旨在推動新一代人工智能理論與方法的變革。

(PANDA數據平台中的代表性場景——雲南潑水節。4萬平方米場景中,千余名行人存在複雜的群組和交互關係。)
本屆GigaVision賽題基於PANDA數據集,為選手提供了複雜大場景的寬視場高分辨圖像序列(單幀涵蓋約4萬平方米場景,達十億像素級)和長時程行人軌跡(像素坐標與真實世界坐標,30秒/60幀)。要求參賽者根據給定數據,完成針對百餘名行人的長程軌跡預測(30秒/60幀)。

(GigaTraj挑戰賽的場景縮略圖。均為4萬平方米大場景,平均單幀行人數量超300名。)
作為全球首個針對大場景、多對象及複雜關係問題的智能算法比賽,GigaVision可以説是人工智能視覺算法領域的“試金石”。相較於其他計算機視覺算法比賽,這一比賽存在諸多與眾不同之處。
軌跡預測是計算機視覺領域的經典問題。但受限於傳統成像設備的局限性,現有軌跡預測研究缺少同時兼顧寬視場和高分辨的數據。如果圖像的分辨率不夠高,研究者只可根據行人的歷史運行軌跡進行分析。而由現有成像技術已突破十億像素級感知通量,兼顧寬視場和高分辨,因此構建的數據集包含了更多的信息。因此,參賽者能利用的信息包括但不限於:長程軌跡、運動姿勢以及人與人、人與環境的交互行為等。
“場景中有海量信息可被挖掘。換言之,我們歡迎各個水平的人都參與進來。”GigaVision挑戰賽賽題評委&&,面向具有大場景、多對象、複雜關係特點的十億像素視頻數據,現有視覺智能算法面臨超高數據通量與信息量帶來的諸多挑戰。
參賽者“各顯神通”,評委會如何給參賽算法“打分”?“首先最重要的肯定是看性能指標。”GigaVision組委會&&,用更少的信息實現更精準的軌跡預測、更巧妙地挖掘圖像中的語義輔助軌跡預測、使算法可以泛化到不同場景下,這些都是賽題評判時會考慮的問題。
“我們的最終願景是成為算法領域的‘奧林匹克’。”GigaVision組委會告訴21世紀經濟報道記者,團隊希望通過比賽打造一個新一代人工智能算法權威榜單。“就像奧運會一樣,大家想知道哪個算法更優秀,就可以通過在GigaVision排行榜來判斷。”
傳統行業新場景
人工智能風起,算法在經濟發展中的地位日益凸顯。
近年來,面對新一輪科技革命和産業變革浪潮,琶洲把握機遇、乘勢而上,率先建設人工智能大模型應用示範區,推動“琶洲算谷”勇立潮頭。
“琶洲對算法産業的發展非常重視,這是我們選擇與琶洲一起打造賽題的原因。”GigaVision組委會指出。
在與琶洲展開闔作之前,GigaVision已經聯合國際人工智能頂會(CVPR、ICCV、ECCV、ACM MM等)舉辦了多屆十億像素視覺智能比賽。當被問及本次選擇與琶洲算法大賽合作的原因,GigaVision組委會解釋道:“十億像素視覺智能事實上還有突破的空間。我們每年都舉辦比賽,就是希望鼓勵相關領域研究者追求更高、更快、更強。”在組委會看來,這是一個不斷解決問題,最終跑出顛覆性技術的過程。“所以今年我們也希望在這一賽題上,與琶洲算法大賽強強聯合,碰撞出新的火花。”
據組委會方面透露,相較於GigaVision往屆的賽題,在今年的琶洲算法大賽中,有不少高質量場景首次亮相。比如,出題方提供了一段雲南潑水節場景,讓參賽者進行分析。在文化層面,賽題能夠凸顯民族特色;在技術層面,潑水節人流量大、行動軌跡複雜,也能保證賽題的難度。
人工智能技術的産業發展都在不斷加速,算法、算力、數據作為技術基礎的重要性不斷得到提升。
2023年12月召開的中央經濟工作會議提到, 要以科技創新推動産業創新,特別是以顛覆性技術和前沿技術催生新産業、新模式、新動能,發展新質生産力。今年《政府工作報告》也將加快發展新質生産力列為2024年的重點任務。
走向千行百業、賦能生産生活的人工智能技術是新質生産力的最好代表之一。
“人工智能技術革命可以與蒸汽機帶來的工業革命相提並論,AI最終會進入所有行業,並大幅提升勞動生産率。”此前,歐洲科學院外籍院士、國際人工智能聯合會理事會主席、南京大學教授周志華在第三屆琶洲算法大賽啟動大會上指出。
在GigaVision挑戰賽賽題評委看來,參與GigaVision賽道角逐的賽題如果足夠優秀,將能夠引領産業變革。
製造業有望通過與相關算法的結合更進一步。《廣東省製造業數字化轉型實施方案(2021—2025年)》發出了全面推進製造業數字化轉型號召,其中就提到,要發展高端裝備製造産業集群支持整機及核心零部件企業建設數字化、智能化、無人化車間。
“比如,在製造園區的無人場景下,機器人等設備提供服務時,需要一個中樞大腦對其發布指令。這時,優秀的視覺算法和高素質的相機能夠保證決策中樞‘心明眼亮’,高效決策。”GigaVision挑戰賽賽題評委指出。
在製造業之外,複雜場景的軌跡預測算法在公共安全、智慧城市等領域都已經投入應用。在以前,如果只用多個小的攝像頭,對火車站、商圈等人流密集場景進行監測,則容易面臨跨相機跟蹤的難題。如果使用寬視場高分辨成像裝備,則有利於實現平方公里級大場景精確監測,提供有效的安全保障。在智慧城市方面也同理,只有詳細掌握軌跡,才能保證在調度規劃上後續的有效響應。
GigaVision組委會告訴記者,往年賽題中,有部分表現優異的算法已經走向應用。GigaVision組委會也希望能夠通過與琶洲合作共同突破大場景長程軌跡預測領域的技術極限,激發市場價值。
AI強區新方向
近年來,海珠區緊緊扣住“算法、算力、數據”人工智能三大支柱,全力以赴推進“琶洲算谷”建設,實施了“組建一個算法産業聯盟,&&一份促進措施,舉辦一場算法國際大賽,建設一個算法産業中心,集聚一批算法項目,認定一批算法産業基地,凝聚一批算法産業人才,拓展一批算法應用場景”的“八個一”舉措。
據悉,百度、商湯、科大訊飛等AI強勢企業都加入了琶洲算法産業聯盟。而琶洲領軍算法師的入選人除了來自前述“大廠”,還有來自樹根互聯、技象科技、雲蝶科技等琶洲企業的算法人才獲評。
在今年“人工智能+”的號召下,AI如何應用到各行各業成為産業發展的重要問題。
為支持相關産業高質量發展,海珠區重點構建了政策助力、算力供給、合規指導、孵化培育、金融賦能、生態集聚六大平台,打造大模型發展最好生態,推動大模型産業集群成勢。
在政策方面,海珠發布《廣州市海珠區建設人工智能大模型應用示範區實施細則(徵求意見稿)》,爭取以政策為激勵,撬動大模型千億級産業集群。
在算力方面, 打造算力供給平台,全力夯實大模型算力底座建設,打造綠色、穩定、適配全球大模型的智算中心,統籌構建算力調度平台,目前已推動琶洲算谷系列智算中心建成200P本地算力,通過異構算力服務,全力助力大模型企業調優、應用。
而在合規指導方面,琶洲人工智能大模型合規指導服務中心,圍繞大模型和算法備案,向企業提供備案諮詢、輔導培訓等服務,推動大模型技術的合規化、規模化應用,今年以來已引導完成大模型備案3個,算法備案15個。
據悉,目前海珠區已進駐行業大模型近40個,集聚泛人工智能企業近2000家,2023年貢獻營收近900億元,同比增長21.3%,已初步形成龍頭引領、腰部支撐、中小企業集聚的“熱帶雨林式”産業生態,帶動海珠信息傳輸、軟體和信息技術服務業連續3年實現兩位數增長,佔海珠區GDP比重達到15.4%。
第三屆琶洲算法大賽,邀請參賽個人、機構和企業拿出最成熟的産品、最先進的算法參與切磋,推動人工智能技術提升和落地轉化。海珠將以算法為抓手,持續發展人工智能産業,賦能新質生産力發展。
掃碼點擊進入官網報名

記者 馮戀閣 林曦 實習生王睿芝 廣州報道

