人形機器人“居家化”倒計時

2025-04-03 07:00:00 來源: 《環球》雜誌

 

3月19日,在武漢大學機器人學習算法與軟操作實驗室內,研發團隊在對“天問”人形機器人進行研發調試

文/徐一平 竇淼磊

編輯/胡艷芬

  從工業場景到商業場景再到家庭場景,被認為是機器人落地應用的三部曲。因為家庭場景所特有的非標準化、任務多樣化,且與環境和人的交互要求最複雜,可以説,機器人從工業走進家庭,本質上是實現從“確定性”向“不確定性”的跨越。

  特斯拉創始人兼首席執行官埃隆·馬斯克曾&&,未來地球上每個人都可能擁有至少一個機器人,暗示全球機器人數量可能達到100億個甚至更多。如果真能如此,機器人將進入每個家庭,成為兒童、老人的陪伴者、照料者,以及家務助手。

  高盛一項最新研究預測,到2035年,人形機器人市場規模將達到380億美元;花旗銀行則估計,到2050年全球將有6.48億台人形機器人。這預示着,未來10到20年間,人形機器人將明顯應用於家居場景中。

智能和倣生

  在大模型出現前,給機器人下達的任務指令,是通過編程寫在機器人的大腦裏的。比如你不需要對掃地機器人説“現在開始掃地”,也不需要向它解釋什麼是掃地,它就會根據預設程序開始工作,並在結束工作後找到自己的充電站。

  如今,具身智能大模型正逐步從單一模態邁向以圖像-語言-動作(VLA)為代表的多模態大模型時代。今年2月,美國Figure AI公司發布的Helix VLA模型,通過對人類腦科學的研究構建起慢思考和快思考兩個系統,讓機器人既能理解模糊的人類語言,又能實現毫米級操作精度。

  從語言大模型(LLM)、視覺大模型(VLM)到VLA大模型的轉變,不僅意味着機器人將擁有更強大的信息處理能力,還預示着它們將能打破語言與視覺的局限,實現更為複雜、靈活的交互方式。

  在Figure AI公司的演示中,當機器人Figure 02接收到“整理房間的東西”這句指令後,會對身邊的雜物、蔬果等進行辨別、分類,再將它們分別放進抽屜或冰箱。兩台機器人甚至還可以進行協作,比如機器人A將物品遞給機器人B,由機器人B負責收納。

3月22日,在位於江蘇無錫的天奇股份人形機器人數據採集實訓基地,工程師在調試人形機器人

  多模態與倣生技術,正在打開機器人的“感官屏障”。波蘭Clone公司的倣生機器人Protoclone V1展示了倣生技術在機器人領域的巨大潛力,它代表着機器人正從傳統的電機驅動向倣生驅動轉變。它高度模擬人體的心臟(電動泵)、血液(液壓油)、肌肉(人造肌肉技術)等構造,行走時步態流暢。據介紹,其將主要用於家庭場景,具有對話、握手、倒飲料、做三明治等功能。

  挪威1X公司的家用機器人NEO Gamma展示了另一種解決方案:視覺系統採用事件相機(Event Camera)技術,在低光照下仍能以微秒級延遲捕捉物體的動態;擁有20個自由度(即有20個可獨立控制的關節彎折點,人類一隻手大約有27個自由度)的靈巧手、尼龍皮膚和內置100個壓力傳感器的觸覺手套,可識別玻璃表面污漬的摩擦力差異,實現“擦窗不留痕”。

  騰訊自研的TRX-Hand靈巧手,採用倣生設計並具有20個自由度,能搬運超過20公斤的重物,與一個成年人的能力相當。

  在居家場景中,這類技術突破意味着機器人既能穩妥搬運重物,也可輕柔協助老人起身,甚至完成穿針引線這類精細操作。尼龍倣生皮膚的應用更將觸覺反饋誤差控制在更小範圍內,大幅提升服務安全性。

必須是“人形”嗎

  人形設計可通過面部表情、手勢、眼神、情緒、語音等擬人化交互方式,增強用戶接受度。例如,上一代人形機器人代表Pepper就可以通過擬人化動作提升兒童和老人的交流興趣;Engineered Arts開發的倣真機器人Ameca接入了GPT-4語言模型,能實時分析人類的面部表情、語音、情感和體態動作,從而做出相匹配的情感回應。

  這類功能搭配人形外觀帶來更強的親和力,是其他形態的機器人難以替代的。2024年,騰訊研究院曾做過一項線上調查,結果顯示75%的受訪者希望擁有實體陪伴機器人,其中36%更偏好能模擬真實情感互動的人形機器人。

  比如,騰訊發布的人居環境機器人“5號”具有環境適應性和人機安全交互能力,它採用四腿輪足複合設計,能在跨越障礙的同時保持運行效率,具備上下樓梯和平穩搬運物品的能力。這是單純的輪式機器人無法完成的。

  然而,雙足、雙手的人形結構,也會帶來運動穩定性與能耗方面的問題,最終因高成本影響商業化進度。例如高自由度的關節設計導致能耗劇增;類人形態依賴精密零部件(如諧波減速器、絲杠),製造工藝複雜、成本高昂;人形機器人需整合感知、決策、控制等多模塊算法,但不同任務缺乏統一底層模型,導致開發周期長、兼容性差。

  2024年末,在回應機器人發展中的“人形路線”之爭這一問題時,騰訊首席科學家、騰訊Robotics X實驗室主任張正友&&,機器人設計不一定需要人形,應回歸初心,考慮如何能更好地服務人類。

  我們應該轉變認識,將機器人的分類從按形態分轉向按人的需求來分,建立一套“人居環境機器人”體系。人居機器人的形態可以更多維——OpenAI支持的人形機器人1X成為世界上第一種可以和人類同居的機器人,而1X就是一個以輪子為腿的倣人形機器人;斯坦福大學開發的Mobile ALOHA機器人在移動底座上集成了兩個機械臂,能完成諸如烹飪、清洗碗具、鋪床等多項靈活操作。將抓取、移動、簡單搬運等任務進行穩定和泛化。

適應“銀發社會”需求

  2025年的政府工作報告首次提出培育具身智能等未來産業,大力發展機器人新終端。今年初,《中共中央 國務院關於深化養老服務改革發展的意見》發布,提出要“研究設立養老服務相關國家科技重大項目,重點推動人形機器人、腦機接口、人工智能等技術産品研發應用”。

  中國預計在2035年進入重度老齡化社會,65歲以上人口占比將超過21%,專業護工缺口高達1300萬人,獨居者、雙職工家庭對家務助手的渴望也在攀升。

  自2020年以來,聯合國、世界衞生組織及中國智慧養老主管部門強調,可將機器人作為應對老齡化的創新解決方案,拓展其在康復訓練、行為輔助及安全監護領域的應用,以及研發家居場景的智能服務機器人。

  儘管諸如環境控制、體位調整、體徵監測甚至心理陪伴等都是極為典型的照護場景,卻極容易因處理不當等因素,帶來老人和照護者的雙重壓力。因此,養老機器人需要以安全交互為底線,並提供梯次化服務。騰訊“5號”機器人在手臂上部署了自研的具有180個檢測點的大曲面覆蓋觸覺皮膚,這不僅提升了機器人的感官靈敏度,也增強了其對老年人跌倒等情況的監測與保護功能。

  中國已有部分城市對機器人餐廳等創新場景頒發“經營許可證”,預示着未來在社區養老領域,機器人也有望釋放更多潛能。

機器人家居化的社會配套

  機器人是具有實體形態的人工智能(AI),是服務人類活動的物理實體,人形機器人進入家庭,是精密的機械系統嵌入非結構化物理空間的過程,所以環境的適配不可忽視。2023年騰訊研究院發布了《人機友好空間探索》報告,指出人形機器人進入人居環境,除技術、市場、政策外,在基礎設施、社會層面的探討也同樣迫切。

3月6日,在國家會展中心(天津),宇樹科技帶來的一款人形機器人現場表演

  在家裏,有不停跑動的孩童、不知躲在哪的貓、容易受驚嚇的狗、掉落的透明塑料袋、隨時被寵物或孩子弄濕的地板……這是相比於其他場景更為複雜多變的環境——酒店的送餐機器人可通過1.2~1.8米/秒的低速行駛和視覺定位與地圖構建技術(VSLAM)降低風險,但居家人形機器人需要更高的自主決策能力,甚至要在毫秒內作出反應。特斯拉Optimus機器人的靈巧手已能抓取小型物品,但力控精度仍需提升,畢竟人類無法容忍一台捏疼老人手腕的“智能護工”。

  此外,傳統的基礎設施,比如家庭空間擺設、建築物、道路是否能夠適配機器人?是否有廣泛的物聯傳感系統、通信網絡、能源供給來支撐家用人形機器人的運行?如果不能,我們需要對生活空間進行怎樣的改造,才能實現從軟體到硬體的雙向人機友好?

  技術方面的準備不可或缺。一方面大語言模型、端到端訓練、五指靈巧手,甚至直驅電機等技術和工程正加速迭代,機器人崗前培訓進度條正按月刷新;另一方面,大模型“數據饑渴症”,對高度泛化場景的識別,以及人形機器人商業化、多樣化應用等難題仍在求解中。多重因素作用下,機器人廠商仍在疊buff、均成本和贏利潤的不可能三角中找平衡。

  數字技術為具身智能訓練帶來了降本的前景。例如英偉達Isaac&&、騰訊Robotics X實驗室等正探索構建“倣真訓練&&”“數據工程&&”等,改寫機器人創造模式。例如通過開源計算機模擬系統Genesis創建的4D動態環境,機器人可在虛擬空間完成百萬次“跌倒-站起”訓練。

  我們還需要制定法規與倫理標準來守住安全底線。就像汽車上要裝載各種雷達、攝像頭等傳感器,機器人也要依靠許多信號採集裝置來提高感知系統的靈敏度。人形機器人在家庭中工作,必然會收集大量用戶數據,如何確保這些數據的安全性和保護隱私,是立法者和技術開發者需要共同面對的挑戰。

  機器人與人類的交互倫理問題也不容忽視。例如,當機器人照護老人或孩子時,如何確保其行為符合倫理規範,避免對用戶造成心理或情感上的傷害,是需要深入探討的問題。

  人形機器人進入居家場景,不僅是技術與産業鏈的創新和整合,也是社會系統的適應性改造。技術樂觀主義者預言,2035年將是居家機器人普及元年;謹慎派則提醒,實驗室性能與真實場景存在“代差”。無論如何,一場重構生活方式的變革,正在身邊發生,我們都有機會擁有一個全能的家庭助手。

  (作者均係騰訊研究院高級研究員)

手機版