
文章圖片

作者|張鵬
編輯| 鄭玄
半年前 , 我寫過一篇火山引擎的戰略方向分析 , 當時我判斷 , 火山引擎已經被明確為字節的一個戰略目標:因為字節在 AI 時代需要有最好的底層技術和基礎設施 , 那么這件事必須不能只是自造自用 , 而是要通過「外循環」來驗證和放大 , 所以火山引擎要做好 , 也必須是 「AI 云原生」 。
其實過去兩年 , 所有云業務的企業 , 都已經意識到云的未來 , 不再是舊賽道里賣服務器、賣帶寬的存量博弈 , 而是 AI 能力帶來的全新需求 。 在這個新時代 , 云廠商賣的不再是底層的「資源」 , 而是經過封裝的「能力」 。
有趣的是 , MaaS(模型即服務)過去 2 年被提出 , 但是經歷了早期「嘗鮮」后 , 也一度被業界懷疑過 , 當時主要的原因是模型如果本身不行 , 不能真正解決企業問題 , 這個模式就不能真正成立 。
不過這半年火山引擎死磕 MaaS 的一些更具體的業務發展 , 我覺得 MaaS 這件事已經可以不用討論了 , 它絕對就是未來的云服務的核心業務 。
為什么說火山是在「死磕」MaaS 呢?先說個最近在媒體上看到了一個火山的「八卦」 , 大概意思是說火山引擎內部 , CDN 這種傳統業務的銷售權重被降到了很低;而 AI 的 Token 調用量 , 直接成了核心指標 。 甚至有的銷售 CDN 等其他傳統云業務做得挺好 , 但因為 MaaS 賣不出去就最終淘汰出局 。
這個「八卦」如果換個視角看 , 反而說明火山引擎對 AI 云原生和 MaaS 的重視相當貫穿到執行層 , 確實在用 組織架構的調整、用考核機制的引導來推動戰略。
壓強夠了 , 事情就會有突破 。 從我在業界了解的消息看 , 更重要的是火山引擎 2025 年相當突飛猛進 , 業績上非常火 。 而這個火也確實來自于 MaaS 驚人的高速增長 。 結合 12 月 18 號的 Force 大會上我看到的一些信息 , 感覺又值得分析下這個 AI 云原生領域的大玩家「火從何來」了 。
01MaaS 的核心是
「與商業世界的需求對齊」
想要讓銷售勸客戶把預算從傳統 IT 轉給 AI , 前提是手里的模型和工具得真能解決業務問題 , 而不是讓客戶當「小白鼠」 。 這次 Force 大會 , 給我的最大感受是: 火山引擎展示的不僅是模型 , 也相對更全面的展示了為了讓 AI 能真正落地 , 他們過去所積累的「家底」 。
企業 AI 下一階段是讓 Agent 真正創造業務價值丨來自:2025 原動力大會·冬
未來的大模型 , 理解和執行是統一的 。 我們現在看到的 AI 大多還在「理解」階段——用戶向 AI 提出需求 , 它可以幫忙寫寫文案、聊聊天 。 但現實世界的需求其實已經要求模型必須能直接操控軟件、調用 API、完成復雜的企業級 RPA 任務 。
不知道大家是否注意到了 , 豆包 1.8 有一個明顯的進化方向 , 就是 Agentic 代理能力 。 豆包在這個版本里重點增強了 Tool Use(工具調用)和 OS Agent(屏幕操控)等能力 。 這和 Gemini 3.0 Pro 等全球頂尖模型的進化路徑是完全一致的: 讓模型這個大腦不僅「能理解」 , 還要長出「能干活的手」 。
舉例來看 , 豆包 1.8 現在支持 OS Agent , 意味著它可以像人一樣「看懂」電腦屏幕 , 去點擊按鈕、填寫表單 。 天下絕大部分的公司都不是「AI Native」的 , 所以這次升級對于企業內部大量陳舊的、沒有 API 接口的 ERP 系統來說 , 這就是讓 AI 接管繁瑣工作的關鍵鑰匙 。
以前大家關注模型的能力聚焦在追求智能上限 , 我相信這一點是字節內部的基礎模型團隊一直在做的 。 而火山引擎是字節跳動「內循環」+「外循環」的好處 , 就是一方面可以依托字節基礎模型團隊 , 既支持與字節的業務發展 , 同時也連接著更大真實世界的需求 。
有了需求目標 , 從基模能力到可用的模型技術的發展 , 才變得更有方向感 , 比如「理解和執行一體化」的能力 , 就是可以對現在非「AI Native 企業」AI 進化關鍵的落地點 , 而前段時間火爆的豆包手機助手 , 其實就是這個能力的「內循環」 , 而火山引擎現在把這種能力同步開啟「外循環」 , 會讓技術創新變得更有意義 。
MaaS 過去一段時間能賣的那么火 , 以及未來可以繼續看漲 , 本質上還是因為這個 「雙循環」帶來的目標與能力和真實商業世界的對齊 。
另外 , 從這次火山引擎正式發布了 Agent 開發套件「Agentkit」來看 , 其具備 8 個核心模塊依舊是在「與現實商業世界對齊」 。 這次火山提供了 Agent 在開發、部署、運維、調優等各個階段所需要的工具和基礎設施 。 其中讓我印象很深刻的有兩個模塊: Identity(身份與權限)和 Evalution(評估) 。
Agent 落地到企業里 , 一個很細節但是關鍵的問題就是怎么給 Agent 設定清楚它的身份——比如一個客服 Agent 能接觸到哪些數據 , 可以回答什么樣的問題;比如一個實習生的 Copilot , 和高級副總裁的個人助理 , 怎么避免二者的信息權限混淆 。 規避實習生可以通過 AI 輕松拿到公司敏感信息這種情況出現 。 這些都是看似細節基礎 , 但實際上做起來復雜 , 而一旦出現問題卻有可能給企業造成重大損失的實干問題 。
還有就是 Evalution(評測)的能力 。 做過 Agent 開發的人都知道 , 最大的痛點不是怎么搭建環境訓出一個 Agent , 而是不知道怎么評估一個 Agent 在業務場景里的能力 , 畢竟不能把一個剛訓出來還不知深淺的 Agent , 隨便就丟進生產環境里測試 。
而 Agentkit 的 Evalution(評測) , 其實就是一系列評測 Agent 在真實場景中工作能力的測試集 。 這個一直是個沒有被很好解決的問題 , 如果對標一下其他國際云大廠 , 其 Agent 開發工具內置的評測集好像也只有十幾套 。 而火山這次一口氣發布了超過 50 套評估測試集 。
場景積累的意義在這里就體現了 。 顯然字節跳動內部本身就有幾萬個 Agent , 每天進行幾十萬次的評測 , 所以火山是個巨大的基礎資產 。 從抖音電商的客服機器人 , 到 TRAE 的 Coding 助手 , 這些業務的需求倒逼火山團隊必須建立有效的 Agent 評測能力 。 這些為了支撐內部龐大業務而磨練出的「基建能力」 , 現在成了火山 MaaS 服務的底座 。
02多模態一定是云廠商競爭的「新賽點」
除了基模和基建的扎實推進 , 在這次 Force 大會上 , 我們還看到了一個信號: 多模態(視頻、語音、圖像)的理解和生成能力 , 正在成為 MaaS 增長的新賽點。
據我了解 , 火山內部也已經形成了一個認知 :每增加一種多模態模型能力 , MaaS 的銷售就能帶來顯著的百分比增長 。
這不難理解 , 今天商業世界的大量場景是視覺的 。 視頻帶貨、在線教育、娛樂社交 , 這些才是用戶和需求最集中的場域 , 而要讓 AI 和 Agent 在這些場域發揮作用 , 不論是與用戶對話交互、生成內容 , 還是理解這些場景里的內容 , 解決用戶或者創作者的問題 , 都離不開多模態模型的能力 。
而多模態能力恰恰也是字節跳動的「主場」 。 豆包是最早具備圖像識別能力的大模型之一 , 還記得 2025 年高考時 , 豆包在看圖解題上的表現就讓人印象深刻 。 而在今年 IF 大會上做出精彩分享的張楠 , 其領導的即夢在今年國內「產業級 AI 視頻生成」落地競賽里處于領先地位 , 這背后其實都是同源的技術棧 。
而這次發布的 Seedance 1.5 Pro , 解決的核心問題不是「生成」 , 而是「可用性」 。 它重點突破了音畫高精同步和多語種對白 , 尤其擅長中文方言和對口型等 。 做過影視創作或短視頻的人都知道 , 這才是從「玩具」變成「生產力」的關鍵 。 這意味著 , 未來的短劇、廣告片 , 甚至是一部分的電影鏡頭 , 真的可以用 AI 直接生成了 。
豆包 Seedance 1.5 Pro 丨來自:2025 原動力大會·冬
同時 , 豆包 1.8 的視覺理解能力也大幅提升 , 支持 90 分鐘長視頻的低幀率快速理解 , 并且支持調用工具對關鍵片段進行高幀率處理 。 這意味著模型不再是只能看懂一張圖 , 而是能像人一樣看完半場籃球賽 , 并分析出戰術布局 。
簡單總結一下就可以看出 , 火山引擎未來一段的發展戰略和主要焦點 , 就是在「與商業世界對齊」的工具環境和模型能力上 。 而多模態能力的領先 , 恰恰將給火山引擎帶來重要的戰役制高點 。
03客戶實際上在買
字節跳動的「技術溢出」
要理解為什么火山引擎今年這么火 , 其實值得換個客戶視角看看他們買單的深層邏輯到底是什么?
由于極客公園接觸創業者比較多 , 至少從他們的視角 , 我聽到了一個有趣的觀點: 今天企業用火山引擎 , 本質上其實就是在「薅字節跳動的技術羊毛」 , 享受其技術外溢的紅利 。
我們來看一組震撼的數據 。 在這次 Force 大會上 , 火山公布了一個核心數字: 豆包大模型的日均 Tokens 調用量已經突破了 50 萬億。
這是什么概念?作為對比 , 谷歌此前剛剛宣布今年 9 月的全月 Tokens 消耗量為 1.3 千萬億 , 也就是日均 43.3 萬億 。 換句話說 , 火山引擎如果沒吹牛 , 那么每天處理的 AI 調用量 , 已經站在了全球云平臺的第一梯隊 , 甚至在某些維度上實現了超越 。
這 50 萬億的調用量似乎是有水分呢?我覺得如果考慮到字節跳動內部龐大的「內循環」需求 , 大概率是差不多的 。
2025 Force 大會上火山引擎發布全景圖丨來自:2025 原動力大會·冬
字節跳動的特點是 , 模型悶頭做 , 然后自己的狗糧自己猛吃 。 其內部大量的應用和場景 , 模型調用早就無處不在 , 每天都在產生海量的 Tokens 調用 。 這種天然的環境就必然帶來一個原生的能力——為了支撐這個體量的內循環 , 為了讓字節自己的業務能跑通、能賺錢 , 字節的技術團隊必須把推理成本壓到極致 , 必須把 AI 云原生的能力做好 。
其實今天我接觸的優秀創業團隊和投資人們都有個共識 ,無論什么形態的產品 , 今天都是個「容器」:一個在場景里贏得用戶 , 形成「數據飛輪」的容器 。 它的形態會不斷演化 , 甚至終將走向「產模一體」(也就是需要有自己的最優模型)。 但是今天的核心不是探討模型是誰的 , 基礎設施是誰的 , 而是最高效構建可以拉進用戶 , 產生數據飛輪的進程 。
所以這個時候 , 就可以理解為什么創業者們一方面「怕字節」做和自己類似的產品 , 但是又很堅決的會選擇火山引擎的 MaaS 服務 。 核心是他們希望抓住字節跳動內部技術能力的溢出 , 就算隨著發展和能力積累肯定要自己的有模型 , 那今天也要堅決薅「字節的技術羊毛」 。
顯然更多的真實商業世界里的企業 , 也開始想清楚了這個問題 。 目前火山引擎日均 Tokens 調用量突破一萬億的企業客戶已經超過了 100 家 , 這個數字還在快速上升 。
【火山引擎的「火」,是怎么點起來的】火山引擎這種在 AI 時代支持字節「內循環」+商業世界「外循環」的雙循環模式 , 確實有點勢不可擋 。 接下來幾年 , 是國內商業世界非常值得關注的一個新變量了 。
推薦閱讀
- 商湯科技的選擇:擁抱AI國產化,做那個「修塔」的人
- 愛國者星璨EC850電源評測:一款全日系電容的入門級PPLP金牌產品
- 能點外賣、能減脂,美團要用AI解決外賣黨的健康憂慮
- 最好的芯片,讓你感覺不到它的存在,第五代驍龍8至尊的隱身智慧
- 短短五年 盤點出現在我們身邊的那些AI黑科技
- 火山引擎發布豆包大模型1.8,多模態Agent能力進入全球第一梯隊
- 谷歌發布Gemini 3 Flash,口述即原型,速度堪比搜索引擎
- 充一次電用三天!10000mAh手機終于要來了,剛公布的中端機真狠啊
- Meta再爆大瓜,氣走楊立昆的Wang也受不了小扎了?
- 具身智能的數據難題,終于有了可規模化的解法
