重慶人工智能領域,出現了新的世界紀錄。近日,我市人工智能領域的頭部企業——重慶中科雲從科技有限公司(以下簡稱雲從科技)的視覺大模型取得重要進展,其行人基礎大模型在PA-100K、RAP V2、PETA、HICO-DET4個數據集上刷新世界紀錄。
8月16日,記者從雲從科技了解到,一口氣刷新四項世界紀錄的背後,有位“秘密功臣”——雲從科技開發的“從容”大模型。
在計算機視覺和人工智能相關領域“領跑”
新紀錄是如何誕生的?
雲從科技研究院算法工程師焦賓介紹,這是行人基礎大模型在公開測試集上“跑”出成績後,和全球範圍內已知最佳成績對比的結果。今後,這一成績還可能繼續被刷新。
這不是雲從科技第一次打破世界紀錄。自2015年成立以來,其一直在計算機視覺和人工智能相關領域“領跑”。2018年至2020年,雲從科技跨鏡追蹤技術就曾連續三年3次打破世界紀錄。
而行人基礎大模型的“特長”更為豐富,它可以精確高效地識別與人相關的特徵,如面部特徵、衣服顏色、眼鏡和手錶等配飾;同時還能精準識別人與物體的交互,如抽煙、使用智能手機等行為。
這就意味着,行人基礎大模型既可以辨認“人”,也可以辨認“人在幹什麼”,從而具備了大規模商用的可能性。
大模型的“聰明”程度比起以往模型,就像大學生“PK”小學生
為啥大模型的識別能夠精準高效?
焦賓解釋,這得益於雲從科技研發的雲從“從容”大模型的支撐。
“大模型的‘大’,體現在參數量大、數據量大、算力資源大3個方面。”焦賓説,通俗地説,這使得大模型的“聰明”程度比起以往的模型,就像大學生“PK”小學生。
首先,十億級的參數量,意味着大模型能夠容納的場景極為豐富。它像一個巨大的“底座”,可以容納和匹配各類生産生活場景,根據用戶需求“微調”小部分參數即可。
例如,在安全領域中,大模型既能識別在禁煙區抽煙的行為,也能“抓住”駕駛時接打手機的不規範操作。
而過去,不同的場景需要單獨開發不同的模型,不僅造成了數據壁壘,也使得研發和使用成本更高。
其次,百億級的數據量,意味着大模型的“知識”更“豐富”。在海量數據的訓練下,大模型擁有出色的視覺識別能力。記者在雲從科技看到,只需給出一張圖片,大模型便能在秒級範圍內識別出圖中的人、物體和行為,並給出文字反饋。
再次,算力資源大,意味着大模型的“反應”更快。今年5月落地兩江新區的雲從科技西部智算中心擁有最高可達5000P的算力,能支撐複雜、大規模的計算。這也標誌着雲從“從容”大模型生産線正式投産。
多項技術用於礦山、建築工地以及特殊場所的安全布控
焦賓&&,行人基礎大模型的優秀表現,意味着該技術已經進入大規模商用階段。
記者了解到,基於雲從“從容”大模型&&的多項技術已經進入了“實戰”。目前廣泛應用於礦山、建築工地以及特殊場所的安全布控。
雲從科技也在涉獵更多領域。今年7月,雲從科技、佳都科技、重慶交通開投集團就深入開展城市交通技術研發及應用落地達成戰略合作,並正式發布知行城市交通行業大模型。
接下來,三方將共同圍繞重慶軌道交通在建和擬建項目需求以及相關城市交通痛點,開展城市交通行業大模型Trans-GPT研究、綜合監控智慧節能等方面的創新研究和應用落地,提升重慶智慧交通水平,打造全球智慧交通高地。
8月4日,雲從科技還參加了第十四屆海峽兩岸(廈門)文化産業博覽交易會,基於雲從“從容”大模型帶來多項核心AIGC産品及行業案例亮相,積極賦能文化産業發展。