人形機器人“居家化”倒計時

2025-04-03 07:00:00 來源： 《環球》雜誌

3月19日，在武漢大學機器人學習算法與軟操作實驗室內，研發團隊在對“天問”人形機器人進行研發調試

文/徐一平竇淼磊

編輯/胡艷芬

　　從工業場景到商業場景再到家庭場景，被認為是機器人落地應用的三部曲。因為家庭場景所特有的非標準化、任務多樣化，且與環境和人的交互要求最複雜，可以説，機器人從工業走進家庭，本質上是實現從“確定性”向“不確定性”的跨越。

　　特斯拉創始人兼首席執行官埃隆·馬斯克曾&&，未來地球上每個人都可能擁有至少一個機器人，暗示全球機器人數量可能達到100億個甚至更多。如果真能如此，機器人將進入每個家庭，成為兒童、老人的陪伴者、照料者，以及家務助手。

　　高盛一項最新研究預測，到2035年，人形機器人市場規模將達到380億美元；花旗銀行則估計，到2050年全球將有6.48億台人形機器人。這預示着，未來10到20年間，人形機器人將明顯應用於家居場景中。

智能和倣生

　　在大模型出現前，給機器人下達的任務指令，是通過編程寫在機器人的大腦裏的。比如你不需要對掃地機器人説“現在開始掃地”，也不需要向它解釋什麼是掃地，它就會根據預設程序開始工作，並在結束工作後找到自己的充電站。

　　如今，具身智能大模型正逐步從單一模態邁向以圖像-語言-動作（VLA）為代表的多模態大模型時代。今年2月，美國Figure AI公司發布的Helix VLA模型，通過對人類腦科學的研究構建起慢思考和快思考兩個系統，讓機器人既能理解模糊的人類語言，又能實現毫米級操作精度。

　　從語言大模型（LLM）、視覺大模型（VLM）到VLA大模型的轉變，不僅意味着機器人將擁有更強大的信息處理能力，還預示着它們將能打破語言與視覺的局限，實現更為複雜、靈活的交互方式。

　　在Figure AI公司的演示中，當機器人Figure 02接收到“整理房間的東西”這句指令後，會對身邊的雜物、蔬果等進行辨別、分類，再將它們分別放進抽屜或冰箱。兩台機器人甚至還可以進行協作，比如機器人A將物品遞給機器人B，由機器人B負責收納。

3月22日，在位於江蘇無錫的天奇股份人形機器人數據採集實訓基地，工程師在調試人形機器人

　　多模態與倣生技術，正在打開機器人的“感官屏障”。波蘭Clone公司的倣生機器人Protoclone V1展示了倣生技術在機器人領域的巨大潛力，它代表着機器人正從傳統的電機驅動向倣生驅動轉變。它高度模擬人體的心臟（電動泵）、血液（液壓油）、肌肉（人造肌肉技術）等構造，行走時步態流暢。據介紹，其將主要用於家庭場景，具有對話、握手、倒飲料、做三明治等功能。

　　挪威1X公司的家用機器人NEO Gamma展示了另一種解決方案：視覺系統採用事件相機（Event Camera）技術，在低光照下仍能以微秒級延遲捕捉物體的動態；擁有20個自由度（即有20個可獨立控制的關節彎折點，人類一隻手大約有27個自由度）的靈巧手、尼龍皮膚和內置100個壓力傳感器的觸覺手套，可識別玻璃表面污漬的摩擦力差異，實現“擦窗不留痕”。

　　騰訊自研的TRX-Hand靈巧手，採用倣生設計並具有20個自由度，能搬運超過20公斤的重物，與一個成年人的能力相當。

　　在居家場景中，這類技術突破意味着機器人既能穩妥搬運重物，也可輕柔協助老人起身，甚至完成穿針引線這類精細操作。尼龍倣生皮膚的應用更將觸覺反饋誤差控制在更小範圍內，大幅提升服務安全性。

必須是“人形”嗎

　　人形設計可通過面部表情、手勢、眼神、情緒、語音等擬人化交互方式，增強用戶接受度。例如，上一代人形機器人代表Pepper就可以通過擬人化動作提升兒童和老人的交流興趣；Engineered Arts開發的倣真機器人Ameca接入了GPT-4語言模型，能實時分析人類的面部表情、語音、情感和體態動作，從而做出相匹配的情感回應。

　　這類功能搭配人形外觀帶來更強的親和力，是其他形態的機器人難以替代的。2024年，騰訊研究院曾做過一項線上調查，結果顯示75%的受訪者希望擁有實體陪伴機器人，其中36%更偏好能模擬真實情感互動的人形機器人。

　　比如，騰訊發布的人居環境機器人“5號”具有環境適應性和人機安全交互能力，它採用四腿輪足複合設計，能在跨越障礙的同時保持運行效率，具備上下樓梯和平穩搬運物品的能力。這是單純的輪式機器人無法完成的。

　　然而，雙足、雙手的人形結構，也會帶來運動穩定性與能耗方面的問題，最終因高成本影響商業化進度。例如高自由度的關節設計導致能耗劇增；類人形態依賴精密零部件（如諧波減速器、絲杠），製造工藝複雜、成本高昂；人形機器人需整合感知、決策、控制等多模塊算法，但不同任務缺乏統一底層模型，導致開發周期長、兼容性差。

　　2024年末，在回應機器人發展中的“人形路線”之爭這一問題時，騰訊首席科學家、騰訊Robotics X實驗室主任張正友&&，機器人設計不一定需要人形，應回歸初心，考慮如何能更好地服務人類。

　　我們應該轉變認識，將機器人的分類從按形態分轉向按人的需求來分，建立一套“人居環境機器人”體系。人居機器人的形態可以更多維——OpenAI支持的人形機器人1X成為世界上第一種可以和人類同居的機器人，而1X就是一個以輪子為腿的倣人形機器人；斯坦福大學開發的Mobile ALOHA機器人在移動底座上集成了兩個機械臂，能完成諸如烹飪、清洗碗具、鋪床等多項靈活操作。將抓取、移動、簡單搬運等任務進行穩定和泛化。

適應“銀發社會”需求

　　2025年的政府工作報告首次提出培育具身智能等未來産業，大力發展機器人新終端。今年初，《中共中央國務院關於深化養老服務改革發展的意見》發布，提出要“研究設立養老服務相關國家科技重大項目，重點推動人形機器人、腦機接口、人工智能等技術産品研發應用”。

　　中國預計在2035年進入重度老齡化社會，65歲以上人口占比將超過21%，專業護工缺口高達1300萬人，獨居者、雙職工家庭對家務助手的渴望也在攀升。

　　自2020年以來，聯合國、世界衞生組織及中國智慧養老主管部門強調，可將機器人作為應對老齡化的創新解決方案，拓展其在康復訓練、行為輔助及安全監護領域的應用，以及研發家居場景的智能服務機器人。

　　儘管諸如環境控制、體位調整、體徵監測甚至心理陪伴等都是極為典型的照護場景，卻極容易因處理不當等因素，帶來老人和照護者的雙重壓力。因此，養老機器人需要以安全交互為底線，並提供梯次化服務。騰訊“5號”機器人在手臂上部署了自研的具有180個檢測點的大曲面覆蓋觸覺皮膚，這不僅提升了機器人的感官靈敏度，也增強了其對老年人跌倒等情況的監測與保護功能。

　　中國已有部分城市對機器人餐廳等創新場景頒發“經營許可證”，預示着未來在社區養老領域，機器人也有望釋放更多潛能。

機器人家居化的社會配套

　　機器人是具有實體形態的人工智能（AI），是服務人類活動的物理實體，人形機器人進入家庭，是精密的機械系統嵌入非結構化物理空間的過程，所以環境的適配不可忽視。2023年騰訊研究院發布了《人機友好空間探索》報告，指出人形機器人進入人居環境，除技術、市場、政策外，在基礎設施、社會層面的探討也同樣迫切。

3月6日，在國家會展中心（天津），宇樹科技帶來的一款人形機器人現場表演

　　在家裏，有不停跑動的孩童、不知躲在哪的貓、容易受驚嚇的狗、掉落的透明塑料袋、隨時被寵物或孩子弄濕的地板……這是相比於其他場景更為複雜多變的環境——酒店的送餐機器人可通過1.2～1.8米/秒的低速行駛和視覺定位與地圖構建技術（VSLAM）降低風險，但居家人形機器人需要更高的自主決策能力，甚至要在毫秒內作出反應。特斯拉Optimus機器人的靈巧手已能抓取小型物品，但力控精度仍需提升，畢竟人類無法容忍一台捏疼老人手腕的“智能護工”。

　　此外，傳統的基礎設施，比如家庭空間擺設、建築物、道路是否能夠適配機器人？是否有廣泛的物聯傳感系統、通信網絡、能源供給來支撐家用人形機器人的運行？如果不能，我們需要對生活空間進行怎樣的改造，才能實現從軟體到硬體的雙向人機友好？

　　技術方面的準備不可或缺。一方面大語言模型、端到端訓練、五指靈巧手，甚至直驅電機等技術和工程正加速迭代，機器人崗前培訓進度條正按月刷新；另一方面，大模型“數據饑渴症”，對高度泛化場景的識別，以及人形機器人商業化、多樣化應用等難題仍在求解中。多重因素作用下，機器人廠商仍在疊buff、均成本和贏利潤的不可能三角中找平衡。

　　數字技術為具身智能訓練帶來了降本的前景。例如英偉達Isaac平台、騰訊Robotics X實驗室等正探索構建“倣真訓練平台”“數據工程平台”等，改寫機器人創造模式。例如通過開源計算機模擬系統Genesis創建的4D動態環境，機器人可在虛擬空間完成百萬次“跌倒-站起”訓練。

　　我們還需要制定法規與倫理標準來守住安全底線。就像汽車上要裝載各種雷達、攝像頭等傳感器，機器人也要依靠許多信號採集裝置來提高感知系統的靈敏度。人形機器人在家庭中工作，必然會收集大量用戶數據，如何確保這些數據的安全性和保護隱私，是立法者和技術開發者需要共同面對的挑戰。

　　機器人與人類的交互倫理問題也不容忽視。例如，當機器人照護老人或孩子時，如何確保其行為符合倫理規範，避免對用戶造成心理或情感上的傷害，是需要深入探討的問題。

　　人形機器人進入居家場景，不僅是技術與産業鏈的創新和整合，也是社會系統的適應性改造。技術樂觀主義者預言，2035年將是居家機器人普及元年；謹慎派則提醒，實驗室性能與真實場景存在“代差”。無論如何，一場重構生活方式的變革，正在身邊發生，我們都有機會擁有一個全能的家庭助手。

　　（作者均係騰訊研究院高級研究員）