高通組局,宇樹王興興說了一堆大實話

高通組局,宇樹王興興說了一堆大實話

文章圖片

高通組局,宇樹王興興說了一堆大實話

文章圖片

高通組局,宇樹王興興說了一堆大實話

文章圖片

高通組局,宇樹王興興說了一堆大實話

文章圖片


王興興的大實話 , 在高通攢的這場局上 , 全交代了 。
目前機器人領域技術路線都不一樣 , 導致看著熱鬧 , 但是進展沒那么顯著;
既然現在大家開發的模型都還不能部署直接用 , 那還不如開放出來 , 就像OpenAI開源GPT-1/2一樣;
宇樹前幾天開源的世界模型也無法直接在工廠中落地使用;
現在機器人和芯片廠商都忽視了芯片對于機器人的重要程度;
手機芯片等類似芯片用到機器人身上是非常有想象空間的 。
侯紀磊對話王興興
所有終端都被AI、Agent賦予新想象 , 因為足夠new , 具身智能成為被影響最大的那一個領域 。 但也因為足夠new , 具身智能的熱鬧下必然存在諸多爭議與挑戰 。
宇樹科技 , 長期站在聚光燈下的明星玩家 , 此時此刻將行業中的諸多難題直接剖開 。
或許不為別的 , 而是高通攢的這個局太難得 。 2025驍龍峰會·中國 , 聚集了國內外終端領域的核心玩家 , 覆蓋上下游產業鏈 。 在這開誠布公討論的問題 , 或許將馬上成為行業最關注的熱點 , 進而能更快得到解決 。
而不止王興興 , 來自硬件、模型、操作系統等層級的玩家 , 也都暢所欲言、應聊盡聊:
理想汽車副總裁、智能空間研發負責人勾曉菲
面壁智能CEO李大海
中科創達聯合創始人、執行總裁耿增強
侯紀磊對話實踐者
高通全球AI研發負責人侯紀磊與他們進行對話 。
為完整體現各位大咖的思考和理解 , 我們在不改變原意的基礎上將對話內容進行整理 , 希望您能從中有所收獲 。

算力散熱通信 , 說到底機器人應該加強對芯片的關注Agent落地終端的終極想象 , 或許就是具身智能 。
宇樹科技創始人、CEO、CTO王興興表示 , 他們的目標還是希望能夠有通用的AI放在通用的機器人上 , 干各種活 , 無論是在工廠還是家用 。
當機器人能在未見過的環境中 , 憑自然語言指令完成任務時 , 就是機器人的ChatGPT時刻 。
他將這個目標拆解為幾個階段分別完成:
1、固定動作演示 → 已實現(如舞蹈、武術) 。 2、實時生成任意動作 → 預計最快今年底/明年初實現 。 3、在陌生場景執行任務 → 預計明年底左右能做到(如拿水、整理桌子) 。 4、高成功率與精細操作 → 需要再數年 , 目標是接近99.9%成功率 , 能完成拆裝手機等細致任務 。
示意圖
如果想要機器人能夠做到這些 , 一個非常關鍵的問題是對物理環境、自然語言指令的實時理解和處理 , 這就對于端側AI的通信能力有更高要求 。
王興興表示 , 通信是非常重要的 。
目前我覺得包括很多機器人廠商或者芯片廠商 , 都有點點忽視芯片對于機器人的重要程度 。
就像新能源汽車一樣 , 最近十幾年最大的變化是隨著新通信協議出現 , 線纜數量減少了很多 。 早年間一輛油車的線纜數量是非常夸張的 , 可能一輛車里線纜重量就有100公斤 。
在機器人領域也是一樣的 , 一個通信線纜是4根或5根線 , 有時為了降低電線數量會花費很多時間和精力 。 因為對于一臺機器人來說 , 性能越來越好、機器人越來越可靠 , 降低線纜數量是很重要的 。 迄今為止 , 工業機器人最常見的故障就是線纜出問題 , 可能占到60-70% 。
對于一臺機器人來說 , 減少線纜數量的最大問題是要提高整體通信協議、提升通信質量 。
我相信未來機器人的終極想象是每一個手臂上就只有一根線纜 , 別的都沒有了 , 多干凈整潔 , 想要實現這個目標還有非常多工作要做 , 但這非常值得做 。
此外 , 在底層芯片上 , 王興興提到了終端難以部署大規模算力的難題 。
機器人本身的空間就那么大 , 很多時候高算力的芯片都裝不進去;同時電池容量、散熱 , 對于這么大的機器人來說都是很難解決的問題 。
示意圖
他覺得未來具身智能身上部署的算力 , 峰值功耗最好控制在100W以內 , 平均正常功耗可能只要20-30W , 可能就相當于幾個手機的功耗 。
太大是不行的 。 我覺得手機芯片等類似芯片用到機器人身上是非常有想象空間的 。
目前處在黎明前的前夜 , 前夜反而是比較麻煩的 。 最大的問題是行業內各家技術路線差別很大 , 都有各自的想法 , 這就會導致這個領域非常熱鬧 , 但整體進展沒那么快 。
當下想要真正把具身智能的通用AI模型做出來 , 在這個階段 , 大家還是可以保持更開放的態度 , 反正大家做出來的模型都沒法部署用 , 不如開放一點 。
前段時間宇樹開源了一個基于視頻生成的世界模型 , 不只是權重參數 , 包括模型本身、數據集、訓練源代碼、部署源代碼通通開源 。
宇樹開源模型
王興興說 , 這個模型真正放在工廠或者生活中是不能直接用的 , 那不如開源出來 。 這有一點像OpenAI早年間的時候 , 因為大模型的商業價值或者說距離落地還有點遠 , GPT-1、GPT-2都是開源的 。
我們也是希望更多開源能夠讓大家共同來推動這一領域共同進步 。
至于現在大家總是討論的VLA模型和世界模型之間的問題 , 說實在的很難講得非常清楚 , 因為哪怕就是VLA模型、世界模型本身也都有非常多變種 。 我們公司會保持開放的態度 , 嘗試各種模型 , 包括自己開發以及和第三方合作等 。
我個人覺得在AI領域要保持謙卑的態度 , 永遠有更聰明、更開放的人做更好的東西出來 , 我們保持謙卑的態度去學習 。
有時候我還希望應該把過去很多年的東西盡量忘掉 , 不要被過去限制了自己的邏輯 。
我們的目標是讓機器人真正在家庭和工廠里用起來 。 我認為無論是芯片、通信協議、算力、通信架構、甚至是整個無線通信架構可能都需要一些調整 。
包括安全問題 。 現在機器人賣得越來越多 , 有些黑客專門破解我們的機器人 , 這讓我們也非常頭大 。
在機器人領域還沒有那么成熟前 , 可以從很多其他領域借鑒學習 , 包括手機、新能源汽車等 , 去進行更加規范的體系建設、數據采集、模型訓練等 。
當下這個領域確實太新了 , 我們每時每刻都會面臨一些新的挑戰和問題 , 這不是單個公司能解決的 。 我們也希望更多人參與進來解決問題 , 比如我們一般用的Linux系統本身還有很多漏洞 , 我們在開發時需要把底層漏洞完全解決 , 這還是比較花時間的 , 如果有一家第三方公司能把這些問題解決 , 我們也非常愿意合作 , 這是一件非常有價值的事 。

端側模型將是Agent系統中最核心的編排者Agent根本上是大模型的應用形式 , 目前Agent的形態更偏向云端 , 但是隨著落地趨勢逐步推進 , 端云協同將是必然 。
面壁智能CEO李大海認為 , 端云協同現在已經是行業共識 , 這樣能提供更好的用戶體驗 。 云端相較于端側可以提供近乎無限的算力和資源 , 負責解決復雜問題;端側離用戶更近 , 它需要響應速度非常快、同時保障用戶隱私 。
端側有一個非常重要的優勢 , 就是“永遠在線” , 它可以持續感知世界、實現基于設備隱私的上下文理解、協同云端不同Agent區組織編排完成復雜任務 。
具體到實際的終端上 , 比如在汽車座艙里面 , 就應該有比較強的端側模型 , 它能夠理解用戶需求然后去和云側的模型溝通 。
舉一個簡單的例子 , 比如說如果在座艙里面通過端側模型感知到后面的小朋友有哭鬧的情況 , 就可以通過端側先去開啟一個云端比較強的語言交互模型 , 說要不要一起聊聊天 , 分散一下注意力 , 給他講一個故事 。 但這個開啟的過程一定是要通過端側來判斷 , 而不是讓云側隨時有一個模型在觀察我們的座艙里面在做什么 , 這對隱私的暴露是非常大的 。
示意圖
我認為終端的端側模型未來其實是整個Agent系統里最核心的編排者 。
那么未來AI行業對于端側模型的需求是什么?
李大海認為 , 永遠要去提高端側模型的知識密度 。
因為端側模型部署在各種硬件設備、走入千家萬戶和不同用戶場景發生交互 , 它需要具備很好的自主學習能力 , 尤其是基于探索的內容進行自我迭代和個性化發展 。 所以端側模型提升知識密度非常重要 , 面壁智能提出了知識密度每三個月提升一倍的觀點 。 相對而言 , 云側模型會更關注智能水平的提升 , 這二者之間的差異還是很大的 。
在模型自我發展的同時 , 和芯片、終端、系統之間也應該更深度協同 。
在這之中 , 李大海提到了深度合作非常重要 。
站在作為端側模型公司角度講 , 我們跟高通這樣的芯片廠商有非常深度的合作 , 只有這樣深度合作才能夠把端側模型的知識密度能夠真正發揮出來 , 能夠去用更低的功耗去做到同樣的工作 。
另外在應用側 , 他認為現在只有MCP這一種智能體協作方式肯定是不夠的 , 還需要有更多基于用戶認證的、安全的協同方式 , 這些是原來在移動互聯網時代建設過的基礎設施 , 現在需要在AI時代重新做一遍 。

Agent的核心是提供服務的能力終端硬件是Agent的物理載體 , 因為Agent的到來 , 手機、PC、汽車等硬件終端都煥發新活力 。
對于汽車而言 , 它本身就已處在智能化升級進程中 , Agent的到來使這種升級更加全面深入 。
理想汽車副總裁、智能空間研發負責人勾曉菲認為 , 汽車能夠實現自動駕駛是行業基本共識了 , 實現自動駕駛后 , 汽車空間內能夠提供怎樣的服務就會變成各家車企的差異化競爭手段 。
示意圖
AI孕育了一個非常大的機會點 , 它有機會把看似割裂的生態集中起來 。 其實很多終端現在都是一個生態的孤島 , 比如PC的交互是鼠標鍵盤+圖形界面 , 手機的交互是基于觸控 , AI這種基于對話的、更加自然的交互會是一個跨終端的統一交互模態 。
現在大家都在談論Agent , Agent是什么?
今天當大家談論Windows時 , 默認Windows背后有一大堆服務;在談論安卓的時候 , 也默認安卓背后有一大堆服務 。 同理 , 在未來大家選擇使用哪個Agent其實是看它到底能帶來多少服務 。
今年理想汽車也在聚焦做這樣的事 , 理想同學作為理想汽車的Agent , 它接入了大量和汽車出行相關的服務 。 今年我們也開始接入車內空間以外的生活場景和服務 , 比如讓理想同學點一杯咖啡、交一下水電費、叫一個代駕等 。 它會覆蓋更多、更廣泛的服務 , 我們相信未來用戶選擇Agent的核心和現在選擇操作系統的邏輯是一樣的 。

Agent需要形成行業標準而談到Agent的服務能力 , 滿足用戶需求是一方面 , 更關鍵在于如何讓Agent應用、操作系統和底層硬件之間緊密協同 , 從而進一步提升應用體驗 。
中科創達聯合創始人、執行總裁耿增強認為 , 現階段AI在不同設備上的應用高度碎片化 。 底層芯片不同、運行操作系統各異、上層模型和Agent框架也不統一 。 這導致行業內存在非常多組合方案 , 重復開發成本高 , 缺乏統一標準 。
核心問題還是缺乏一個跨終端通用的AI OS或者統一的Agent Framework 。 盡管目前MCP、A2A已經取得了一定進展 , 但距離形成行業公認的標準還很遠 。
示意圖
不過可以確定的是 , 未來在Agent的“穿針引線”下 , 還是可以形成一個跨終端的操作系統 , 提供流轉的智能服務 。
這種新時代OS的架構 , 可以將云端視作一個巨大的Cloud OS , 各個終端就是Agent , 與Cloud OS協同工作 , 跨平臺的一部分由Cloud OS來實現 。 從單設備來看 , 傳統的Linux、Android等系統將被視為虛擬化層 , AI是一種全新的UI , 必然催生新的AI OS 。
聚焦到廠商該如何做 , 其實還是產業共建、協同合作 。
耿增強認為 , 很多事需要“自然發生” , 但行業可以共建一些基礎設施 。 比如中科創達已經和高通共建了智能汽車創新中心、智能物聯網創新中心 , 通過這兩個創新中心支持智能汽車和智能物聯網不同設備里終端廠商共同的客戶以及生態的合作伙伴 。
在AI方面 , 中科創達和火山引擎成立了理想智能汽車混合AI聯合實驗室 , 將火山引擎的云上AI和中科創達的端側AI形成一個混合式AI方案 , 經過高通平臺優化后可以更好支持設備廠商、客戶創新 。
目前還聚焦在單設備智能 , 但是下一步將走向設備之間的Agent協作 。
【高通組局,宇樹王興興說了一堆大實話】本文來自微信公眾號“量子位” , 作者:關注前沿科技 , 36氪經授權發布 。

    推薦閱讀