騰訊入局具身智能,宇樹首批用上“大腦”

騰訊入局具身智能,宇樹首批用上“大腦”

文章圖片

騰訊入局具身智能,宇樹首批用上“大腦”

文章圖片

騰訊入局具身智能,宇樹首批用上“大腦”

文章圖片

騰訊入局具身智能,宇樹首批用上“大腦”

文章圖片

騰訊入局具身智能,宇樹首批用上“大腦”

明敏 發自 凹非寺
量子位 | 公眾號 QbitAI
不造硬件、不量產、不做商業化 。
這是騰訊加入當下具身智能熱潮的姿勢 。
那要做什么?
一個具身智能的通用外接大腦 。 而且不是端到端 , 是模塊化提供能力 。 也就是各家機器人可以從中獲取自己想要的部分能力 。
效果be like , 搭載了該大腦的宇樹機器人 , 可以實時處理人類語音指令 , 閑聊、完成任務 , 還能判斷自己能干什么、不能干什么 。
比如它能看到桌子上比原先多了一個玩偶 , 但是它沒有靈巧手 , 所以并不能拿起玩偶 。

這就是具身智能Tarios平臺 , 在WAIC 2025期間正式亮相 。
它集成了目前騰訊在具身智能領域的軟件能力 , 包括多模態、規劃、感知算法 , 以及開發、仿真、數據等工具 。
包括宇樹、越疆、樂聚、帕西尼、擎朗、眾擎等大熱具身智能領域玩家 , 都已火速達成合作 。
而且還沒啥后顧之憂——騰訊再次強調了自己不下場做硬件本體、不搞量產、不搞商業化 。
這一波直接格局打開 , 誰都能來當“騰訊系”機器人了(doge) 。
爆火具身智能 , 需要“外接大腦”首先來拆解一下Tairos平臺本身 。

它核心包含兩個方面:
模型算法 云服務模型層面主要包含三部分:多模態感知模型、規劃大模型、感知行動聯合大模型 。 每個部分可以類比成人類大腦的一部分 。

云服務方面主要是以工具平臺形式提供 , 可以用于開發、訓練、測試和部署機器人應用 。
平臺通過標準化接口調用以及軟件開發工具包(SDK)的方式對外提供服務 。

騰訊強調 , Tairos是國內首個以模塊化的方式提供大模型、開發工具和數據服務的具身智能軟件平臺 , 即插即用的方式向機器人行業開放 。
這意味著機器人廠商能基于自身情況進行更靈活選擇 。
比如有的廠商在感知模塊上還有欠缺 , 那就可以直接使用Tairos上的感知大模型;如果是長線程規劃做得不夠好 , 那就可以使用規劃大模型 。
以及如果機器人廠商接入了開源模型 , Tairos也能提供后訓練一套完整流程能力 , 能讓廠商只需少量數據就能完成適配 。
簡而言之 , Tarios就是希望成為各家機器人的外接大腦 , 為不同廠商補齊關鍵軟件能力 。
目前首批合作的機器人廠商伙伴包括:越疆科技、樂聚機器人、帕西尼感知科技、擎朗智能、眾擎機器人科技、宇樹科技等 。
與此同時 , 騰訊首席科學家、騰訊RoboticsX實驗室主任張正友博士也再次重申了騰訊做具身智能的“三不原則”:
不做硬件、不做量產、不搞商業化 。
具身智能如火如荼 , 騰訊還是如此克制 , 背后又有哪些考量?
只考慮雙足人形、硬件本體 , 就限制發展了首先對于騰訊內部而言 , 對機器人的長期關注重點 , 始終都不是商業化、量產以及硬件本體 。
騰訊RoboticsX實驗室成立于2018年 , 由張正友領導創立 , 實驗室的目標是致力于機器人前沿技術的研究與應用 , 重點關注在人居環境的實際應用 。
張正友目前是騰訊首席科學家、騰訊Robotics X實驗室主任、福田實驗室主任 。 他是ACM Fellow和 IEEE Fellow , 也是國際上最早將計算機視覺與機器人結合研究的知名科學家 , 在計算機視覺、語音處理、多媒體技術和機器人領域都頗具影響力 。 在加入騰訊之前 , 張正友已經在微軟研究院工作20年 。

2018年 , 騰訊成為國內最早一批布局機器人技術的大廠 。
張正友最初制定的“A2G”指導方針包含7大方向 , 如今也是具身智能討論度最高的幾個維度:
人工智能(AI) 機器人本體(Body) 精準控制(Control) 發育學習(Developmental learning) 情感理解(EQ) 靈巧操控(Flexible manipulation) 守護天使(Guardian Angel)后面技術路線進一步收斂到三大方向:移動、操作和智能決策 。 這是因為實驗室認為最終要服務于人、走進千家萬戶的任何一類機器人都基本包含這三塊能力 。
目前騰訊RoboticsX發布的研究原型包括機器狗Max、人居環境機器人“5號”等 。

這些成果更多強調具身智能“通用大腦”層面的提升 , 并不是只局限在一個硬件本體上做迭代 。
比如在機器狗上研發的多模態感知-規劃技術 , 可以讓騰訊Max與宇樹Go 2兩款不同機器人根據人類語音指令在動態開放環境中自主完成多項交互任務 。
人居環境機器人“小五”則融合了四腿輪足設計、大面積觸覺皮膚、多指靈巧手以及安全人機物理交互等多項技術 。 可以在人居環境里行走、搬東西并和人交互 。
張正友解釋 , 他并不建議騰訊去聚焦做機器人硬件本體 , 因為具身智能本身存在更大的目標 , 比如養老 。 在這一命題下 , 觸覺傳感器、定制皮膚等方面能力能不能繼續前進?
假如我一開始就停留在Max腿輪一體化機器狗上面 , 那后面可能就沒有精力做其他東西了 。
同理 , 騰訊一直沒有做雙足人形機器人 , 也有類似的考量 。
【騰訊入局具身智能,宇樹首批用上“大腦”】一方面 , 雙足人形的形態已經存在 , 不需要花太多精力思考 , 只需要去控制它就好了 。
另一方面 , 雙足人形是幾千萬年下在復雜環境中逐漸進化出的形態 , 但現如今的人居環境已經大不相同 , 大部分都是平地 , 那么雙足就不再是必須 , 因為效率很低 。
騰訊做輪腿一體化不是為了仿生 , 而是想要探索在人居環境里有沒有更高效、更理想的形態?
以及現在假如以人形為標準 , 那么很多想象力就被限制了 。 比如 , 如果機器人的交流也像人一樣只基于語言 , 那么它的講話速度就限制在了每分鐘100個字左右 , 但是如果機器人有一個屏幕可以直接閱讀 , 一分鐘可以閱讀的文字是300字左右 , 效率直接提升3倍 。
所以 , 在具身智能還處于非常早期的階段時 , 騰訊還是希望更關注于基礎研究與前沿探索 , 不希望技術路線過早收斂 。
其次 , 結合外部趨勢來看 , 騰訊現在其實更不需要做硬件 。
張正友表示 , 在2018年時國內還很難找到做機器人硬件的廠家 , 所以騰訊不得不既做硬件又做軟件 , 各方面能力都要關注 。
現如今國內涌現出一大批機器人創業公司 , 騰訊走訪過的企業就高達60家 , 這意味著在硬件領域已經不缺好用可落地的方案 , 因此騰訊當下可以更加關注軟件層面 , 與硬件廠商一起打磨技術推動落地 。
此次發布Tarios也是希望和廠商們深層合作 , 進一步優化拓展平臺能力 。 騰訊強調 , 相較于商業化 , 他們認為這一步動作更應該被稱為“產品化” , 是將過去積累的能力包裝成外部可以直接使用的產品 。

此外 , 通過和廣大廠商的合作 , 騰訊可以更好洞察行業趨勢與痛點 。
比如張正友多次提到 , 具身智能當下還需要補足對3D世界、動態環境以及物體材料各方面的認知 。 這不是一句話、一張照片生成3D環境即可 , 而是需要讓機器人在仿真環境里能夠真正操作 。
以及現在很多方案都是基于大語言模型做規劃 , 但是針對現實世界 , 很多東西是文本所不能描述的 。 比如動物沒有語言 , 但是它們都能在3D世界里很好生活下來……
以上都是產業界亟需解決的問題 。
目前 , 騰訊已經提出了區別于業界端到端的解決方案——提出層次化學習解決方案 ,在SLAP框架下(感知、學習、行動、規劃) , 通過多個層次的不斷積累和更新知識 , 讓機器人更加智能 , 能夠與現實世界進行交互 , 實現真正的具身智能 , 包括反應式的自主和有意識的自主 。

張正友提到 , 未來具身智能的發展將圍繞“IDEAS”框架展開 , 包括虛實集成世界、技術門檻降低、智能演進、智能體化和感知拓展 。 這些方向將推動機器人在復雜場景下的應用 , 例如養老服務等需要安全復雜交互的領域 。
由此 , 從內到外 , 騰訊的具身智能戰略更進一步清晰明了 。
對于具身智能的時刻 , 張正友覺得距離“iPhone時刻”、“大哥大時刻”都還有一段距離 , 推出Tarios就是希望能推動行業更快進入到“大哥大時刻” 。
至于大家都好奇的終極形態 , 張正友則借用了唐朝智聰大師的一句話點明:
三身元我體 , 四智本心明 。 身智融無礙 , 應物任隨形 。

— 完 —
量子位 QbitAI
關注我們 , 第一時間獲知前沿科技動態

    推薦閱讀