智元機器人發布首個動作驅動世界模型,預告精靈G2本體升級

智元機器人發布首個動作驅動世界模型,預告精靈G2本體升級

文章圖片

四輪驅動破局落地瓶頸 , 智元構建具身智能 “飛輪體系” 。

本文為IPO早知道原創
作者|Stone Jin


據IPO早知道消息 , 由智元機器人主辦 , 以“全球視角下的具身智能新機遇”為主題的“智啟具身論壇”于7月27日在上海世博展覽館舉行 。

在本次論壇上 , 智元機器人合伙人&具身業務部總裁姚卯青以《通向具身智能大規模突破之路——智元的本體 , 數據 , 算法飛輪》為主題分享 。

據姚卯青介紹 , 智元打通了機器人本體、運動智能、交互智能、作業智能 , 實現“一體三智”全棧閉環發展 , 并構建“數據-模型-本體-場景”四輪驅動的具身智能飛輪體系 。 每一次\"數據-模型-本體-場景\"飛輪的轉動 , 都讓具身智能賦能千行百業更進一步 。

目前 , 智元通過自建專業數采工廠 , 形成全球最大數據集AgiBot World并開源 , 姚卯青說:“面對具身智能數據的荒漠 , 我們選擇栽下第一棵樹 , 愿其能成為一片森林”;同時 , 智元還發布行業首個通用具身基座模型——啟元大模型 , 擁有“一腦多形”能力 , 可適配其他異構機器人本體 , 正如姚卯青所言:“當大模型賦予機器人智慧與靈魂 , 物理智能涌現的命運齒輪就開始轉動” 。

此外 , 在場景端 , 智元機器人憑借“機器人+具身模型”技術重構了智能生產力范式 , 現已在工業制造、倉儲物流、電力巡檢、交互引導四大場景實現突破性落地 。



“世界模型讓一部分機器人先想象起來 , 不是在夢中數電子羊 , 而是可以預見未來” 。 論壇上 , 姚卯青高度評價了世界模型的價值 , 并代表智元機器人發布了行業首個真正面向真實世界雙臂機器人的世界模型開源平臺“Genie Envisioner”(以下簡稱 GE) 。 該平臺融合了預測、控制、評測三大核心能力 , 為機器人從“看見”到“行動”提供了端到端、一體化的解決方案 , 讓機器人在數字時空里先彩排、再上崗 。

GE平臺的核心 , 多視角視頻擴散模型GE-Base以AgiBot-World-Beta數據集為基礎 , 利用超過100萬條、近3000小時的頭部與雙臂腕同步視頻流 , 捕捉機器人操作任務中的空間布局、動作演化與語義意圖 。 160M參數級別的動作解碼器GE-Act , 可以幫助機器人完成從視覺感知到機器人動作執行的跨模態遷移 。

從“固定軌跡”到“自主決策” , 智元把柔性產線寫進機器人大腦 。 在真實平臺驗證中 , 搭載GE-Act的機器人先后完成“做三明治”“倒茶”“擦桌面”“使用微波爐加熱”“流水線裝箱”等五項任務 , 各項成功率均遠超行業平均值 , 展示了前所未有的精度與魯棒性 。

Genie Envisioner的發布 , 標志著機器人從被動執行向主動“想象—驗證—行動”的轉變 。 未來 , 將擴展更多傳感器模態 , 支持全身移動與人機協作 , 持續推動智能制造與服務機器人的落地應用 。

【智元機器人發布首個動作驅動世界模型,預告精靈G2本體升級】此外 , 姚卯青預告 , 精靈系列下一代機器人本體精靈 G2 即將發布 , 相較于上一代 , G2在運動精度、場景適配性上全面升級 , 具備原生數采能力 , 可勝任工業、商業、家庭等多元場景 , 進一步拓寬具身智能的應用邊界 。

    推薦閱讀