點評Gartner全球AI平臺魔力象限:火山引擎被贊,谷歌高過OpenAI

點評Gartner全球AI平臺魔力象限:火山引擎被贊,谷歌高過OpenAI

文章圖片


作者 | 高   飛



【點評Gartner全球AI平臺魔力象限:火山引擎被贊,谷歌高過OpenAI】剛看到Gartner發了首份《AI應用開發平臺魔力象限》(Gartner MQ)(見圖) , 讀了一下 , 報告信息量還是不小的 , 翻譯解讀一下 。



該圖片來自火山引擎公眾號 , 已獲得火山引擎轉載授權
先做個背景介紹 。

Gartner MQ是什么?它從“落地能力”和“戰略完整性”兩個維度給全球廠商打分畫象限 , 分成領導者、挑戰者、遠見者、利基玩家四個陣營 。 這套方法論可以追溯到1980年代 , 創始人Gideon Gartner最初只是在內部會議上用來做市場速覽 , 1994年才正式對外發布 。 魔力象限是企業CIO等群體選型時參考權重很大的第三方報告之一 , 有上百個技術領域 。

但是評價AI應用開發平臺 , 可能是一個信號:全球大模型市場已經從“混戰期“進入“分化期” , 需要被正式排座次了 。
10個要點
1
中國廠商存在感很強 , 火山引擎在挑戰者象限的位置很亮眼

中國廠商在這份報告中表現突出 , 火山引擎、阿里云、騰訊云均入選挑戰者象限 。 其中 , 火山引擎在該象限中“落地能力”得分最高;在“多模態應用開發能力”上 , 全球第四 。

值得注意的是 , 這份報告的入選門檻極高:AI應用開發平臺年營收至少1億美元 。 這意味著很多知名的AI創業公司都被擋在門外 。 Cohere(企業級大模型明星公司)、CrewAI(Agent框架新銳)、Dify(開源LLMOps平臺)均因營收未達標而落選 。 CoreWeave雖然入選 , 但因為剛完成對Weights & Biases的收購、整合尚未完成 , 被歸入利基玩家 。

換句話說 , 入選的廠商都是在和全球最成熟的玩家同臺競技 。

我覺得可以補充的一個背景是 , 之前根據斯坦福大學HAI的2025年AI指數報告 , 在中國(83%)、印度尼西亞(80%)等亞洲國家 , 大多數民眾認為人工智能產品和服務帶來的好處多于危害 。 相比之下 , 在加拿大(40%)、美國(39%)和荷蘭(36%) 。 也就是說 , 中國比美國高出44個百分點 , 這種樂觀是是否是一種加持?


2
火山引擎不是傳統云廠商 , 它是字節跳動的技術外溢

所以單獨說一下火山引擎 , 揣測一下為什么火山引擎能在報告中拿到這個位置 。

2020年火山引擎成立時 , 它的核心能力來自字節跳動在內容平臺上的積累:推薦算法、高并發處理、視頻編解碼、A/B測試方法論 。 這些能力被產品化 , 對外輸出給企業客戶 。

到了大模型時代 , 這種外溢也隨之變化 。 豆包大模型本身就是字節跳動內部業務(豆包APP、抖音、飛書)的底座 , 火山方舟則是把這套AI基礎設施開放給外部企業 。 所以火山引擎的邏輯始終是“內部先用、驗證有效、再對外輸出” 。 它不是從IaaS層往上打 , 而是從應用層往下延伸 。 這個基因決定了它天然懂:“如何讓AI創造業務價值” , 而不僅僅是“如何提供算力” 。
3


這份報告的核心命題:模型強≠平臺強

報告中 , OpenAI是遠見者 , 不是領導者 。 估計是很多人看報告會困惑的點 。 但是 , 我覺得其實一點都不奇怪 。 因為在我的印象中 , OpenAI其實更像一個互聯網公司 , 而非AI平臺公司 。 印象中 , 山姆·奧特曼出來做訪談 , 常說DAU這些數字 , 而且也認命了消費業務CEO , 還拉來蘋果前首席設計師Ivy做消費硬件 。

從開發者的角度 , Anthropic的存在感早就強過OpenAI了 。 但是Anthropic并不在象限中 。 我想是因為雖然 Anthropic 提供了強大的 Claude 模型 API 和 Workbench(工作臺) , 但在 Gartner 的評估周期內 , Anthropic 更多被視為一家基礎模型供應商(Model Vendor) 。 其主要的應用開發功能(如復雜的 RAG 編排、多模型路由、企業級治理)通常是依賴合作伙伴(如 AWS Bedrock 和 Google Vertex AI)來實現的 , 而不是通過 Anthropic 自身的獨立平臺提供的全棧服務 。

繼續說OpenAI , Gartner也提出 , OpenAI的企業級支持結構比同類精簡(沒有正式的客戶顧問委員會) , 缺乏混合云/私有化部署能力 , 且部分客戶表示正在尋找替代平臺 。

換句話說 , OpenAI “企業級開發平臺”的味道也比較淡 。 但對財富500強的CIO來說 , 24/7專屬支持、SLA保障、數據主權 , 這些“乏味”的東西比模型MMLU得分重要得多 。

這個判斷框架也適用于理解整份報告:Gartner評估的不是“誰的模型最聰明” , 而是“誰能讓企業把AI用起來” 。
4


接下來說一下 , 四大領導者各有什么特點?

AWS的亮點是在Bedrock Guardrails中引入了“神經符號AI”的自動推理 , 用數學驗證而非概率判斷來對抗模型幻覺 , 號稱準確率99% 。 這解決了金融、醫療等行業對確定性的剛需 。

Google力推Agent2Agent協議 , 想成為AI智能體時代的“TCP/IP制定者” 。 如果未來不同廠商的智能體需要互相通信、協作 , Google希望這個協議是標準 。

微軟的優勢在于Azure AI Foundry的開發者體驗 , 特別是Visual Studio Code的深度集成 。 但報告也指出 , 微軟的很多重要發布基于OpenAI的技術 , 且在Gartner Peer Insights上的服務支持評分低于其他領導者 。

IBM則走了一條“開放路線” , 把所有Granite模型以Apache 2.0許可開源 , 并推出了開源的BeeAI智能體框架 。 感慨一下 , IBM和微軟真是從IT時代走過數字化轉型時代 , 再到大模型時代 , 代表老牌公司的企業級底蘊 。

四家領導者的共同點是:都在試圖定義某種“標準” 。 AWS定義安全標準 , Google定義協議標準 , 微軟定義開發者體驗標準 , IBM定義開源標準 。
5


火山引擎的技術護城河:一套解決“從模型到應用”的組合拳

再說回火山引擎 , 報告特別提到了火山引擎的三個核心產品:veRL、HiAgent、PromptPilot 。

其實 , 這三個產品不是并列關系 , 而是一條完整的價值鏈:

veRL解決的是“模型怎么變聰明” 。 它是火山引擎開源的強化學習框架 , 讓企業能夠用自己的業務數據和目標函數 , 把通用大模型訓練成懂行業的專用模型 。

HiAgent解決的是“智能體怎么搭建” 。 它支持“意圖驅動的智能體創建” , 開發者用自然語言描述需求 , 比如“創建一個能根據用戶位置推薦餐廳并完成預訂的助手” , HiAgent能自動將其轉化為可測試、可部署的服務 。

PromptPilot解決的是“應用怎么調優” 。 它把提示詞工程變成了一個正經的IDE , 支持版本控制、A/B測試、效果對比 。 在AI應用里 , 提示詞就是源代碼 , 需要被嚴肅管理 。

這套組合拳的邏輯是:先用veRL讓模型具備行業能力 , 再用HiAgent快速搭建智能體應用 , 最后用PromptPilot持續優化效果 。 從模型層到應用層到運維層 , 全覆蓋 。
6



veRL:強化學習框架為什么是最硬核的一環

報告把RL作為一個相當的要點去提 。

當然也很合理 。 畢竟AI競爭正在從“預訓練”轉向“后訓練” 。 預訓練給模型打基礎 , 但要讓模型真正具備復雜推理能力、理解業務目標 , 需要強化學習(RL) 。

問題是 , 大規模RL訓練是一項工程浩劫 。 需要同時維護Actor、Critic、Reward、Reference四個模型 , 頻繁進行數據交換和狀態同步 。

veRL的核心論文HybridFlow被系統領域頂會EuroSys 2025接收 。 它的關鍵技術是3D-HybridEngine 。 在RL訓練中 , 模型需要在“生成階段”和“訓練階段”之間頻繁切換 , 傳統架構會產生大量顯存冗余和通信開銷 。 3D-HybridEngine通過高效的actor model resharding , 消除了這種冗余 , 實現了SOTA級別的吞吐量 。 說人話就是:同樣的GPU資源 , veRL能比其他框架多訓練好幾倍的數據 。

不過 , 雖然這個工具很不錯 , 但對很多企業而言 , 到底是把資源投入到模型微調 , 還是上下文工程 , 應該是一個比較難抉擇的題目吧 。
7


永久授權 , 這一個容易被忽視的商業模式差異

再說到商業模式 , 火山方舟支持公有云SaaS、私有化部署 , 以及永久授權(Perpetual License) 。

這在當前訂閱制盛行的SaaS市場中是一個亮點 。 對于金融等偏好一次性資本支出(CapEx)而非長期運營支出(OpEx)的行業 , 永久授權是殺手锏 。

另外 , 報告還提到 , 火山引擎的直銷團隊執行效率極高 , 平均交易閉環時間僅為數周 。

相比于依賴漫長咨詢流程的傳統IT廠商 , 這種“短平快“的銷售節奏反映了其產品的高標準化程度 。 (這也是互聯網基因起作用吧)
8



火山引擎的行業版圖 , 藏著字節跳動的底色

上邊我們講過 , 火山引擎是字節跳動的技術外溢而創立的 , 報告談到 , 火山引擎增長最快的兩個垂直領域是“科技公司(包括設備制造商和機器人)”和“零售電商” , 也能體現這個基因 。

科技硬件方面 , 機器人和智能硬件對網絡延遲極其敏感 , 火山引擎在邊緣計算和低延遲上的優勢 , 結合其能夠部署在端側的模型能力 , 使其成為“具身智能”廠商的理想合作伙伴 。 據公開信息 , 全球Top10手機廠商有9家和火山引擎深度合作 。

零售電商也是火山引擎的“主場”之一 。 它在電商推薦、智能客服、營銷內容生成方面擁有實戰經驗 。

利用veRL框架 , 零售企業可以訓練出具備“推銷技巧”的AI導購 , 而不僅僅是處理售后問題的客服 。

此外 , 據火山引擎披露的數據 , 其在汽車行業覆蓋超九成主流車企 , 在金融行業服務八成頭部券商和系統重要性銀行 , 在教育行業與超七成985高校達成合作 。
9


飛輪效應:調用量、收入、產品三個維度的正向循環

除了Gartner這份報告 , 還有一些公開數據可以交叉驗證這個領域市場飛輪效應的重要性 。

IDC數據顯示 , 2025上半年中國公有云大模型服務市場 , 火山引擎占49.2%份額 。 按此計算 , 中國公有云上每兩個Tokens中有一個由火山引擎生產 。

這里解釋一個概念:大模型公有云服務市場 。 這個市場指的是企業通過云平臺調用大模型API的服務 。 你不需要自己買GPU、自己部署模型 , 而是按調用量付費 。 這是目前大多數企業使用大模型的主流方式 , 也是AI商業化的一個核心戰場 。

所以:調用量大→業務場景豐富→模型迭代快→產品體驗好→收入高→有資源持續投研發→調用量更大 。 從目前了解到的情況看 , 這種飛輪效應是火山引擎當前增長勢能的核心來源 。
10


深層信號:AI開發平臺的競爭進入工程化階段

最后 , 這份報告釋放的核心信號是:大模型競爭已經從“拼參數”進入“拼工程” 。

因為對AI行業落地而言 , 模型能力重要 , 但它是前提條件之一 , 而不是唯一的決勝因素 。 在模型能力趨于同質化的背景下 , 企業客戶開始更關注:你的智能體框架是否完善?多模態交互是否穩定?能否過合規審查?成本能否算得過賬?

這份Gartner報告本質上是在說:大模型時代的云計算格局正在被重塑 。 一些競爭發生在IaaS層 , 另一些競爭則發生在MaaS層 。

對行業來說 , 這或許意味著“AI云“正在成為一個獨立的賽道 , 而不是傳統云計算的附屬品 。


    推薦閱讀