具身智能的終極命題:是造「人」還是造「生產力」?

具身智能的終極命題:是造「人」還是造「生產力」?

文章圖片

具身智能的終極命題:是造「人」還是造「生產力」?
機器之心報道
編輯:吳昕

「賣鏟人」華為給具身智能出了另一種解法 。
華為開發者大會 2025(HDC 2025)上發布了 CloudRobo 具身智能平臺 。 該平臺可視為具身智能的「技術底座」 , 通過云端的「強智能」賦能機器本體 , 規避了本體側智能進程慢 , 且部署成本高的痛點 , 摸索出一條涉獵范圍最廣、實現速度最快的具身智能落地路徑 。
「華為云的目標是讓一切聯網的本體都成為具身智能機器人 。 」華為云計算 CEO 張平安說道 。
不做「本體」轉而去做云端的技術賦能 , 華為云的布局思路雖是更符合自身需求的戰略方向 , 但也為具身智能帶來了發展新視角 。
具身智能追求的并不是本體「構型」 , 或是本體的智能程度 , 而是站在「更好用」的終局視角 , 從人形到移動機器人再到卡車 , 讓一切機器「具身智能化」 , 加速其在物理世界真正用起來的腳步 。
這種終局思維 , 極大拓寬了具身智能產業化的想象空間 , 并為商業落地指明了潛在的效率最優路徑 。
工業領域的實踐印證了這條路徑的可行性:在工業噴涂領域 , CloudRobo 助力埃夫特機械臂快速適應新噴涂任務;在半導體制造領域 , CloudRobo 賦能優艾智合物流機器人 , 實時同步生產系統 , 更新任務規劃 , 完成物料搬運及運輸 。

其合作方優艾智合、埃夫特等伙伴 , 都早已完成規模化商業應用 。 在工廠中絲滑穿梭 , 并完成海量作業 。 當業界仍在探討人形機器人的「生產力時代」何時到來時 , 這些早已完成大面積應用的機器人 , 已經在技術躍遷下 , 率先釋放具身智能的生產力價值 , 在真實場景中規?;瘍冬F , 步入「正在進行時」 。
基于此 , 一條更務實且前景清晰的具身智能發展路線已然浮現:摒棄對單一形態的過度追求 , 轉而聚焦于通過高效、普適的智能賦能手段 , 激活現有及未來廣泛機器的「具身智能」潛力 , 以實際場景的生產力提升為標尺 , 構建可快速規模化復制的價值閉環 。 這標志著具身智能產業正邁向產業化的成熟階段 。
場景需要的不是「形」 , 是生產力
華為云用一張簡單且足夠直接的圖片詮釋了「具身智能」 。 除了活躍在聚光燈下的人形機器人外 , 還有在工業場景步履不停的移動機器人、生產線上忙忙碌碌的協作機械臂等 。 除了同樣具備「本體」和「大腦」之外 , 其還有另一個共性:生產力 。

業內之所以普遍將人形機器人視為具身智能的「究極形態」 , 原因也是對其「生產力想象空間」的期待 。 和人類外觀高度統一 , 能完成和人類相似的動作 , 在理想狀態下 , 人類可執行的任務范疇 , 人形機器人亦能覆蓋 , 并可無縫融入以人體尺度設計的物理空間 。
然而 , 該論斷的深層要義實為追求「更廣泛的任務執行能力」 , 其重點在于后者「生產力」而非形態本身 。 從應用場景的本質需求出發 , 關鍵在于機器人能否提供解決實際問題的有效生產力 , 其具體形態并非核心考量因素 。
以工業制造場景為例 , 其高度標準化流程、成熟的自動化基礎及高度結構化的環境 , 使之成為具身智能落地的首要陣地 。 該場景的另一關鍵特征在于對穩定性的嚴苛要求(即極低容錯率) , 這直接驅動具身智能機器人必須確保運行的高度可靠性 , 以滿足工廠端提質增效的核心應用目標 。
在某國際頭部晶圓廠的 8 寸晶圓車間 , 優艾智合超 50 臺 OW8 晶圓盒搬運機器人 , 實現了從光刻到清洗全流程的自動化物流 。 OW8 機器人采用高精度 SLAM 導航技術 , 能夠在復雜的車間環境中自主避障和路徑規劃 。 其獨特的四面開口底盤設計 , 使得設備維護更加便捷 , 維修時間縮短 60% 以上 。 此外 , 機器人還配備了專利減震機構 , 確保運輸過程中的振動值控制在 0.1g 以下 , 有效降低了晶圓破損率 。
在實際運行中 , OW8 單臺機器人日均處理物料超過 240 次 , 整個系統單日物料處理量突破 12000 次 , 完全滿足了工廠 7×24 小時連續生產的需求 。
優艾智合的案例已經再次驗證了場景對于「生產力」需求的本質 , 是能干活 。
除了工廠場景外 , 商業場景的高動態環境和實時變化的需求 , 亦要求機器人在感知 - 決策 - 執行閉環中飛速奔跑 。 目前商用機器人擎朗、云跡等正在完成從單一配送到具身智能的轉換 。 機器人不再囿于方寸之間的配送 , 而是深度嵌入工作流完成配送、清潔等多任務 , 并打通全自動工作流 , 進一步減少人工參與 。
綜觀工業與商業場景的實踐 , 具身智能的產業落地路徑已然清晰:其終極目標并非塑造某種特定的「終極形態」 , 而是鍛造普適的「生產力引擎」 。
無論是半導體車間里精準搬運的移動機器人 , 還是餐廳酒店中穿梭服務的配送機器人 , 其價值核心都在于以可靠的作業能力 , 深度融入工作流 , 切實解決效率瓶頸 , 釋放人力并創造可量化的經濟效益 。
優艾智合、擎朗、云跡等企業的規?;瘧米C明 , 形態各異的本體搭載高效的大腦 , 正在多元場景中將「生產力時代」從愿景變為現實 。 產業的未來 , 不在于對單一形態的無限逼近 , 而在于如何讓這枚「生產力引擎」適配更廣闊的場景 , 驅動更高效的自動化進程 , 最終實現機器智能在物理世界的泛在價值兌現 。
具身智能的終極命題 , 是生產力工具的涌現與進化 。
不是對立面 , 而是共存
剖析完場景真正需求后 , 新的問題隨之而來:尚未大規模應用的人形機器人該何去何從?其和多形態具身智能機器人是迭代關系還是共存?
用一個最貼切生活的案例即可解答 。
一家蓬勃發展的大型公司 , 既有深耕底層技術的「專家型」研發部門 , 又有穿梭在各個業務線、將線串聯精準高效推進目標落地的「管理崗」運營團隊 。 二者并非迭代取代 , 而是深度協同、優勢互補 。
對標到具身智能生產力來看 , 專家型就是當下已經應用的具身智能機器人 , 人形機器人擔任的就是游走在各作業崗位完成非標作業的角色 。 在二者的相互配合下 , 場景等來了最懂它的解決方案 。
當「形色各異」的具身智能以「集群協作」的形式出現在場景中 , 其新的課題為如何讓機器人之間緊密配合 , 不僅能做到對工作任務的毫米級統一理解 , 還要做到機器人間的交流無障礙 。
目前業內有幾條技術路線 , 有的側重本體間智能化提升 , 而有的選擇從底座開始迭代 。
以優艾智合為例 , 其研發的 MAIC 系統 , 以多模態通用基座大模型 +「一腦多態」端側具身模型的混合架構為主 , 創造性地將通用智能控制系統與模塊化硬件形態相結合 。 先賦予其更聰明的智慧 , 再讓群體間做到「善于溝通」 。
其中 , 多模態通用具身基座大模型負責復雜任務的規劃和推理 , 訓練數據來源于自主搭建的多模態空間數據平臺 , 兼容上百種硬件形態的訓練 , 具有海量的多模態真實訓練數據 , 并能兼容主流的開源預訓練數據集 。
基礎模型為多模態 VLM 模型 , 整合細分領域專業 RAG , 在從指令到控制的轉化中 , 添加規劃器和評估器 , 規劃器負責將復雜指令離散化 , 評估器在線評估控制質量并異常召回 。
一腦多態的端側控制模型負責多形態機器人的高頻實時控制 , 以機器人智慧大腦 MAIC(Mobile AI Comprehension) 為核心 , 實現多形態機器人的多模態融合感知、自適應多臂協同操作、多形態移動控制、全域物流調度 。 該控制模型既保留了 AI 算法的推理能力 , 又能保證模型執行效率和精確性 , 是具身智能機器人高泛化操作的核心能力所在 。
優艾智合還構建了面向多個專業領域的 Agent 聚合平臺 , 將大模型與工業軟件的深入融合 。 實現模型訓練與微調 , 針對不同行業差異化的復雜下游任務的快速訓練 , 基于 RAG 和思維鏈訓練具備思考能力的專家 Agent , 以及輔助全局生產排程優化 。
透過優艾智合發布的視頻可見 , 多「構型」的機器人在互相配合時 , 移動機器人每個動作精準無誤一步到位 , 人形機器人在復雜任務中拆解動作 , 運動軌跡能做到細節微操級的調整 。 在跨形態機器人群體的認知耦合下 , 共同點亮了具身智能的「光束」 。

【具身智能的終極命題:是造「人」還是造「生產力」?】因此 , 具身智能產業的終極競賽 , 并非「人形」與「多形態」的路線之爭 , 而在于誰能率先打造出普適、開放、高效的「群體智能協同」 , 編織一張覆蓋物理世界的「智能生產力網絡」 。 這要求產業參與者突破單體智能的思維桎梏 , 以生產力思維擁抱協同生態的構建 。

    推薦閱讀