中國GPU云,正在走向全棧競爭

中國GPU云,正在走向全棧競爭

文章圖片

中國GPU云,正在走向全棧競爭

文章圖片




中國自研GPU云正在換擋 。
文|趙艷秋 周享玥
編|?;?br /> 1月4日 , 國際咨詢機構沙利文發布《2025 年中國 GPU 云市場研究報告》 。 報告顯示 , 在中國自研GPU云市場中 , 百度智能云以40.4%的市場份額位居第一 。 幾乎同一時間 , 多家媒體披露 , 百度旗下芯片公司昆侖芯已向港交所主板提交上市申請 。 昆侖芯于2011年組建團隊 , 經歷“十余年磨一劍” , 成為這一輪AI云競爭中的關鍵變量 。
過去一年 , “GPU云”頻繁出現在產業與資本討論中 , 但對不少用戶而言 , 這個概念仍略顯模糊 。 簡單來說 , GPU云構成了當前AI云最核心的算力底座 , 隨著AI走向規模化落地 , 云計算競爭焦點已從以CPU為核心的通用計算 , 轉向以GPU為核心的AI基礎設施 , 它決定了大模型能否被高效訓練、推理和規?;渴?。
沙利文在報告中對“中國GPU云”給出三個明確界定條件:廠商需同時具備自研AI加速芯片能力、自主建設并管理大規模AIDC集群的能力 , 以及通過公有云、專有云或混合云形式 , 對外提供端到端AI算力服務的能力 。 在這一標準下 , 盡管國產AI算力參與者眾多 , 但真正具備從芯片、集群到云服務完整閉環能力的廠商仍然稀缺 。 百度智能云在該市場取得領先份額 , 也源于其將這一閉環能力持續落地到金融、能源、汽車等核心行業 , 并在真實業務場景中反復驗證與迭代 。
回看2025年 , AI云市場一度陷入價格戰與算力規模競賽 , 甚至在機場廣告位正面交鋒 , 形成白熱化局面 。 但隨著AI落入千行百業 , 行業逐漸形成共識 , AI云的終局 , 一定將從資源規模與價格博弈 , 下沉至芯片乃至全棧競爭 , 從而實現極致性價比 , 爭奪更多客戶 。 為此 , 海內外頭部云廠商無一例外 , 都在加速向下整合 , 推動芯片、系統軟件、調度平臺與上層模型服務的深度協同 。
沙利文同時指出 , 中國自研GPU云市場已邁入萬卡級別 , 從“能用”進入“好用、可持續”的新階段 。 不過 , 報告也指出 , 短期內 , 其商業化仍高度依賴政策與關鍵行業需求 , 尚未完全實現市場自驅 。 在高端GPU受限、國產方案生態成熟度仍待提升的背景下 , 中國GPU云并未選擇單純性能對標路線 , 而是聚焦自主可控、軟硬一體與場景適配的發展路徑 , 市場也將向具備全棧能力和長期投入能力的頭部廠商集中 。
01
算力:從卷資源和價格走向卷系統工程
【中國GPU云,正在走向全棧競爭】2025年 , 中國市場算力結構發生巨大轉變 。 背后是產業應對多重危機的結果 。 其中 , 中美科技競爭直接沖擊全球GPU供應鏈穩定性 , 國內企業面臨算力緊缺、成本飆升的雙重壓力 。 根據IDC最新數據 , 2025年AI服務器出貨量僅增長16.8% , 銷售額卻激增近90% , 先進算力獲取成本大幅攀升 。 沙利文報告更舉例 , 用特供芯片H20完成同等規模AI訓練 , 相較H100需增加40%-60%的計算時間和35%以上的電力成本 , 企業運營支出陡增 。 與此同時 , AI工作負載本身呈現的新特征 , 也進一步放大了對算力調度和系統穩定性的要求 。
在這樣的現實挑戰下 , 2025年頭部云廠商已將自研GPU的采購比例提升至30%–40%區間 , 自研算力從戰略備選 , 轉變為AI云核心支柱 。 更重要的是 , 這一輪自研圍繞推理、視頻編解碼、大數據分析等進行深度定制 , 并通過從芯片到系統軟件、再到上層框架的全棧優化 , 在真實業務中實現了比通用GPU更顯著的性價比 。

中國自研GPU云的技術路徑和格局也逐步清晰:百度形成“昆侖芯+百舸AI異構算力平臺+飛槳(PaddlePaddle)框架”的組合;華為云構建了“昇騰芯片+CANN+MindSpore”的軟硬協同體系;阿里云則以“神龍計算架構+飛天操作系統+PAI 平臺”推進全棧整合 。 沙利文預計 , 到2026年 , 具備完整全棧能力的廠商將占據60%以上的高端市場 , 并在自動駕駛、生物制藥、科學計算等新興領域形成顯著優勢 。
在這輪演進中 , 百度智能云的市場進展 , 與其在AI基礎設施上長期和系統布局相關 。 百度集團執行副總裁、百度智能云事業群總裁沈抖透露 , 昆侖芯經歷了“十余年磨一劍”的過程 。 2025年上半年 , 昆侖芯P800的3.2 萬卡集群正式點亮 , 成為國產算力重要里程碑 。 沈抖透露 , 百度目前絕大多數推理任務已運行在P800集群之上 , 并基于其構建了5000卡單一集群 , 訓練完成一個多模態模型 , 目前訓練集群規模已擴展至萬卡以上 。
今年11月 , 百度還發布了“五年五芯”技術路線圖 , 涉及針對大規模推理場景優化的昆侖芯M100、針對超大規模多模態大模型訓練和推理優化的昆侖芯M300、全新一代P800超節點天池256、天池512 , 以及基于昆侖芯M系列的千卡、四千卡超節點 。

芯片是AI基礎設施的關鍵一環 , 而算力如何被組織和調度則是云廠商的核心能力 。 百度通過百舸算力管理平臺 , 將昆侖芯、GPU、存儲與網絡整合為統一的算力系統 , 目前已支撐3.2萬卡自研集群的穩定運行 , 并正向百萬卡級調度能力演進——按照官方路線圖 , 目標是在2030年點亮百萬卡昆侖芯單集群 。 在大模型訓練與推理場景下 , 百舸通過“解耦、自適應、智能調度”三大機制 , 實現異構算力的動態優化分配 , 在萬卡單任務中訓練有效運行時間超過98%;同時引入智能故障自愈機制 , 將過去依賴人工的故障恢復壓縮至分鐘級 。
在AI Infra之上 , 百度智能云進一步將能力延展至Agent Infra 。 當前模型已具備極高智力水平 , 但要在產業場景中發揮價值 , 還需要一套組織、調用的系統能力 。 通過千帆平臺 , 百度提供文心大模型及150多個主流模型 , 提供數據服務、工具調用、模型定制能力 , 并提供數字員工、智能客服、多模態視覺平臺等通用產品 , 與客戶打造服務核心業務的企業級Agent 。
這條路徑也是各大自研GPU云廠商的共同選擇 , 背后邏輯是AI云的競爭正走向軟硬一體、系統能力的深水區 。 大廠都在加速跑通全棧能力、垂直優化 , 從而將AI云服務推入到千行萬業的深處 。
02
行業:AI從應用創新走向系統重構
2025年 , 中國自研GPU云的價值開始在關鍵行業中集中顯現 。 金融、能源、交通、汽車、制造等行業落地AI , 更強調長期可控、穩定交付、系統可靠與成本可預期 。 這使得通用GPU或單點云服務 , 難以支撐核心業務的規?;\行 。 自研GPU云通過全棧能力 , 成為支撐行業智能化升級的底座 。 隨著大模型與智能體深入生產系統 , 這類能力已變為行業落地必選項 。
央國企是2025年AI探索落地主力軍 , 超65%的央企、全部系統重要性銀行、95%的主流車企、50%以上的游戲廠商及主流具身智能企業 , 都選擇百度智能云合作落地AI 。
在運營商領域 , 三大運營商均加大算力投資 , 數智前線統計的超200個億元級數據中心相關大單中 , 運營商占比近三成 , 推理算力建設提速、國產加速芯片普及成顯著趨勢 。 這一背景下 , 2025年8月 , 昆侖芯中標中國移動十億級推理型通用計算設備集采訂單 , 一度帶動百度股價大漲 。 百度智能云還聯合中國移動推出“一云三智”解決方案 , 支撐個人、家庭及政企數智化轉型 。
在金融行業 , AI應用從零星試驗邁向規模化部署 , 全球近半數金融機構已啟動大模型、智能體應用建設 , 如工商銀行上線1000多個智能體 。 IDC報告顯示 , 百度智能云以12.2%的份額位居2024年中國金融行業生成式AI市場第一 。 算力上 , 招商銀行基于昆侖芯P800、32臺服務器即完成千億參數模型訓練 。 應用端 , 行業已形成員工與客戶雙主線 。 銀河證券與百度智能云打造“場外交易Agent” , 客戶從詢價到下單轉化率提升3倍;泰康與其合作打造培訓助手 , 持證上崗培訓時間縮短一半 。 更核心的風控領域 , 中信百信銀行智能風控 , 特征挖掘效率提升100% , 風控模型風險區分度提升2.41% 。
汽車是擁抱AI最積極的行業之一 。 Omdia報告顯示 , 2025年上半年 , 23家中國500強整車企業平均每家使用3.8個供應商服務 。 其中 , 百度智能云已滲透至19家頭部車企 , 市場覆蓋率達83.7% , 成為車企首選 。 場景上 , 代碼和智能座艙落地最快 。 如蔚來近400名員工用代碼智能體提效 , AI代碼占比超30%;自動駕駛已演進至VLA范式 , 需實現視覺、語言、動作三模態對齊 , 參數量達百億至千億級 , 百舸平臺、一站式測評工具鏈等賦能研發落地 。 更廣泛場景中 , 頭部車企已形成體系化布局 , 如吉利汽車搭建AIOS體系 , 基于百度昆侖芯與智能體工具 , 員工已開發超3000多個個人Agent 。

具身智能被視為堪比手機、汽車的下一個戰略性關鍵市場 。 2025年全行業機器人本體與靈巧手單品出貨量預計均首次超過萬臺 。 百度智能云自2023年下半年入局 , 圍繞具身大小腦、數據和本體研發 , 已支持具身智能“國家隊”及產業鏈上超20家重點企業 。 模型層面 , 百舸平臺已成為國內首家全面適配RDT、π0和GR00T N1.5三大主流VLA模型的云服務平臺 , 使北京人形機器人創新中心具身模型研發效率提升約2倍 。 數據層面 , 與多家企業共創真機與仿真數據采集方案 。 場景落地方面 , 正與企業合作遷移復用智駕時期的超低延時遙操方案 , 降低商業化門檻 。
能源電力領域 , 頭部企業正積極擁抱行業大模型 。 百度智能云聯合國家電網打造光明電力大模型 , 已覆蓋百余個應用場景 , 減少40%巡檢中人工登塔;它也支持南網電力大模型研發 , 助其2025年建成算力新集群 , 而合作開發的“配電網監視Agent”能在1分鐘內完成告警分析并通知站點 。
此外 , 在出行領域 , 數字員工“東東”已上線中國東方航空App , 覆蓋訂票、值機等核心流程 。
而針對如工業中的排產調度、資源分配、路徑規劃等“硬骨頭”場景 , 百度還推出了全球首個可商用自演進超級智能體“伐謀” , 快速尋找全局最優解 , 自2025年11月發布以來 , 已有超數千家企業申請試用 , 在汽車研發領域將獨立汽車設計科技公司阿爾特的單次風阻驗證時間從10小時縮至1分鐘;在科研領域 , 助力北京工業大學將PEM電解槽制氫系統的新模型科研探索周期從周級縮至小時級 。
在千行百業落地AI的進程中 , 中國自研GPU云開始發揮越來越關鍵的支撐 , 而全棧能力成為行業智能化快速演進的基礎條件 。 2026年 , 云廠商之間的競爭進入全棧的深度較量階段 。 誰能跑通和持續優化芯片、系統與行業場景閉環 , 誰就更有可能在下一階段的AI云競爭中 , 占據主動權 。

    推薦閱讀