近日,由中國科學院自動化研究所聯合武漢人工智能研究院研發的紫東太初4.0多模態推理大模型發布。自2021年首次推出以來,紫東太初已完成4次迭代,實現了從“純文本思考”“簡單操作帶圖思考”到“細粒度多模態語義思考”的躍遷,邁向多模態深度推理的新階段。
中國科學院自動化研究所研究員、武漢人工智能研究院院長王金橋介紹,“細粒度多模態語義思考”是指大模型能像人一樣主動深度思考,不僅能動態適應和處理更複雜的任務,還能在視覺語義層面展現出清晰且可解釋的推理過程,實現“邊看、邊識、邊思”。
“比如在音頻理解中,用戶對紫東太初説‘我想挂一個呼吸科的號’,它能自動操作APP並根據症狀選擇門診;在視頻理解中,它能對180分鐘的長視頻進行片段精準定位和內容總結。”王金橋説,此外,它還能在真實場景中通過汽車、機器人等“動手操作”。
據了解,紫東太初已在具身智能、低空經濟、智慧醫療等多個産業中實現布局,為城市基礎設施與行業需求提供定制化解決方案。(記者劉禎)
【糾錯】 【責任編輯:焦鵬】