
7月2日至7月5日,2025年全球數字經濟大會在京召開。北京智源人工智能研究院院長王仲遠在接受新華網專訪時&&,具身智能是一場至少持續5到10年乃至更長時間的産業革命,需保持長期視角推動技術突破與産業落地,智源研究院通過技術創新與生態協作突破發展瓶頸,推動産學研深度融合與人才培養,助力中國在全球具身智能領域佔據領先地位。
新華網:您覺得具身智能會在哪些産業率先爆發?2到3年內具身智能“集中力量辦大事”主要發展方向是什麼?
王仲遠:具身智能是一場長期的産業革命,至少持續5到10年乃至更長時間,對於具身智能需要保持長期的耐心。在未來2到3年內,我認為其率先會在to b的場景裏應用,比如在封閉的場景裏應用機器人進行貨物或包裹的分揀、零件的裝配等。這些場景的特點是機器人可在相對封閉的環境中作業,較少與人類打交道,對硬體和模型的成熟度要求相對較低,更容易實現在産業端的落地應用。
新華網:您曾提到“具身大腦RoboBrain 2.0是目前全球最強的開源具身大腦大模型”,這個標準是什麼?整個具身大腦目前全球産業競爭格局是什麼?
王仲遠:多模態大模型雖具備在具身機器人上應用的潛力,能幫助人工智能感知、理解世界並對人類指令進行推理,但是缺乏對於空間和時間的感知。而機器人在真實的物理世界裏,它要面臨的是一個三維的空間,加上時間序列的特點,使得多模態大模型並不能簡單地直接適配於具身機器人,這就是我們研發具身大腦大模型的意義所在。
智源研究院研發的“具身大腦RoboBrain”,從3月份在中關村論壇上發布1.0版本,到6月份在智源大會上發布2.0的7B版本,再到如今在全球數字經濟大會上發布2.0的32B版本,其一直不斷提升的是對於空間的感知和推理能力,從而能夠指揮機器人本體根據用戶的交互來執行具體指令。因此,在指令拆解、空間感知、空間理解、推理能力以及閉環反饋等能力上,RoboBrain 2.0的優勢顯著。同時,RoboBrain 2.0還有一個顯著的特點,它能真正跨本體,適配各種構型、品牌的機器人本體,例如機械臂、輪式單臂、輪式雙臂以及雙足人形機器人等,並通過大小腦協作框架,使其易於部署在不同的機器人上,這是其他具身大模型不太具備的能力。在行業裏已有的具身相關基準評測上,RoboBrain 2.0也都顯著優於其他已發布的具身大模型。這些都是其作為全球最強的開源具身大腦大模型的依據。
新華網:您曾提到具身智能産業發展瓶頸之一就是“數據不足”,未來如何解決這個問題?
王仲遠:當前具身智能行業發展面臨諸多挑戰。例如本體不夠成熟導致成本較高,難以大規模採集數據,數據缺乏又導致模型能力弱,進而導致落地應用難,而落地應用難又進一步導致機器人本體很難量産出貨,形成了發展中的循環悖論。要想破解悖論,需要整個具身智能行業各參與方的共同努力。
為破解數據難題,智源研究院在做具身大腦大模型時,採用獨特的技術路徑:通過海量互聯網數據構建模型基礎能力,利用模擬器在倣真環境中生成數據以增加數據獲取來源,最後再通過真機採集少量真實物理世界的數據對模型進行微調,使模型能夠快速適應物理世界。我們發現人類的學習過程也有類似的特點,如今小朋友可以通過電視、手機等獲取大量來自互聯網的信息,例如通過觀看視頻學習某項技能,再通過在真實物理世界進行少量嘗試,就能獲得相應的能力。那麼具身大腦大模型也有類似獲取能力的可能性,這也是智源研究院在破解數據難題上所做的嘗試。
新華網:智源研究院在推動産學研合作中積累了哪些經驗?企業與科研機構的合作模式如何實現共贏?
王仲遠:智源研究院從成立之初就一直擁抱開源開放的生態,將自身科研項目定位為“高校做不了、企業暫時不願意做”的一些科研項目,與高校和企業形成差異化定位,使其成為了鏈結科研工作者與産業的人工智能生態平台。
目前,國內有100多位智源學者與智源研究院共同進行科研技術攻關,近百家企業與智源開展戰略合作,實現産學研聯動。智源研究院的重要特點是所有的研究以落地為目標,以服務産業和支撐産業為使命,通過開源開放的方式,聯合智源學者和生態合作企業,將人工智能産業、高校學者和研究機構串聯起來,實現多方共贏。
新華網:在AI領域人才爭奪白熱化的背景下,智源研究院如何平衡學術與産業需求,吸引全球頂尖人才?
王仲遠:智源研究院始終秉持“功成不必在我”的使命感,致力於為年輕人,尤其是青年人工智能科學家提供平台和舞&。我們一直倡導“青年人才挑大梁”,不論資排輩也不看頭銜,而是更看重研究員過往的代表作,提倡代表作文化。
在實踐過程中,我們既為年輕人提供成長舞&,又培養他們在科研領域不斷創新突破的能力。在過往發布的眾多重磅科研成果中,很多項目的負責人年齡不到30歲。正是這種獨特的模式才能為中國的年輕科學家帶來更多發展的可能性,也吸引全球頂尖人才關注智源研究院。

