昆侖芯超節點正式啟用

昆侖芯超節點正式啟用

文章圖片


即使是1萬億參數的開源模型 , 也只需要幾分鐘、1個云實例 , 就可以輕松跑起來 。
2025百度云智大會 , 百度智能云正式發布百度百舸AI計算平臺5.0全新版本 , 對AI計算基礎設施進行了全面升級 。

此次升級在網絡、算力、推理系統及訓推一體系統等四大方向實現全面能力提升 。

  • 高速互聯:VPC、RDMA、X-link三張網實現全面升級 , 通信更快 , 延遲更低 , 模型訓推效率得到提升;
  • 超節點:昆侖芯超節點上線公有云服務 , 超級算力正式可用 。 最新測試顯示 , 超節點性能達到上一代實例8倍 , 單卡吞吐提升近一倍 , 比國內的同類產品高出15% 。
  • 推理系統:通過算子解耦、自適應并行策略及分布式KV Cache等創新 , 將DeepSeek R1的推理吞吐效率提升50% , 大幅降低長文本響應延遲;
  • 強化學習框架:百舸強化學習框架 , 提升訓練、推理效率 。
昆侖芯超節點是百度智能云面向大規模算力場景推出的產品 , 目前業界最大的開源模型參數已經達到1萬億 , 借助昆侖芯超節點 , 只需要幾分鐘、1個云實例 , 任何人都可以輕松把它跑起來 。
相比傳統的8卡服務器算力交付方式 , 昆侖芯超節點將64張昆侖芯XPU放到同一個機柜 , 卡間互聯帶寬提升8倍 , 單整機柜訓練性能提升了10倍 , 單卡推理性能提升了13 倍 。 從性能上講 , 一個機柜就能頂過去上百臺機器 。
昆侖芯超節點的創新設計昆侖芯超節點基于百度天池系列AI高密液冷整機柜 , 支持整柜一體化的交付模式 。 同時采用水、電、網3盲插設計 , 在無需精準對準的條件下實現組件快速可靠對接的技術 。 昆侖芯超節點機柜在空間利用上發揮了極致 , 實現了超高密度的算力水平 。
昆侖芯超節點的計算節點基于 21 寸標準 1U 計算節點架構 , 前窗 I/O 高度集成 , 可靈活支持百度太行 DPU、4 張網卡、4 塊 NVMe、2 個 M.2、HBA 卡或 RAID 卡等多種配置 , 滿足復雜多樣的算力場景需求 。 計算節點采用模塊化設計 , CPU 板、PCIe Switch 板與 GPU 板相互解耦 , 支持國產化 CPU 平臺 , 具備極高的靈活性與可擴展性 。 每個節點配備雙 PCIe Switch 芯片 , 通過雙上行鏈路與 CPU 高速互聯 , 構建 1:1 無阻塞互聯結構 , 實現了高效調度與低延遲通信 , 徹底消除數據瓶頸 。
昆侖芯超節點在設計上突破了傳統單機8卡互聯的架構限制 , 創新性地引入多 Switch 通信結構 。 以 32 卡為例 , 可以通過 4 臺 Switch Tray 模塊實現算力全互聯 , 構建出一個Scale-Up域規模為32卡的統一算力池 。 在Scale-Out網絡設計上 , 每個計算節點預留4張PCIe網卡擴展位 , 實現XPU與NIC的1:1綁定設計 , 單節點最高支持4張400G網卡 。
在供電單元 , 昆侖芯超節點將電源模塊PSU與計算節點解耦 , 所有電源集中放置于Power shelf中 , 為整機進行集中供電 , 以便實現昆侖芯超節點的高密部署 。 昆侖芯超節點的單個Power shelf高度2U , 內置12個PSU電源單元 , 支持10+2電源冗余 , 采用雙輸入ATS技術 , 相比傳統單輸入電源PSU, 電源數量節省40% 。
昆侖芯超節點采用液冷和風冷相結合的混合散熱架構 , 解決高功耗、高密度散熱挑戰 。 在液冷系統中 , 采取了微通道冷板液冷技術及并聯水路設計 , 通過精準調控冷卻液流量與流速 , 最大化 XPU 和 CPU 的散熱效率 。 在風冷系統中 , 做了進一步優化設計 , 將計算節點的RDMA網卡、VPC網卡等均部署在冷通道 , 減少網卡和光模塊由于散熱問題導致的故障頻率 , 使得集群整體更加穩定可靠 。
昆侖芯超節點采用業界領先的雙層帶外管理架構 , 由機柜級 RMC與節點級 BMC協同組成 , 覆蓋計算節點、互連模塊、電源模塊與散熱模塊 , 實現全鏈路智能運維 。
昆侖芯今年的重要進展今年 , 昆侖芯接連宣布重要進展:2月 , 新一代產品昆侖芯P800萬卡集群成功點亮 。 此次點亮突破了硬件擴展性瓶頸 , 如卡間互聯的拓撲限制 , 避免通信帶寬成為瓶頸;同時 , 圍繞芯片及集群功耗 , 基于萬卡規模常規方案功耗可達十兆瓦或更高 , 采用創新性散熱方案 , 從而解決萬卡集群的能效與散熱問題;完善模型的分布式訓練優化 , 采用高效并行化任務切分策略 , 訓練主流開源模型的集群MFU提升至58% 。
3月 , 搭載昆侖芯P800的昆侖芯服務器中標招商銀行AI芯片資源項目 。 昆侖芯P800將圍繞多個核心業務場景 , 全面支持招商銀行落地大模型應用 。 根據項目實測 , 昆侖芯P800對Qwen系列性能支持遠超同類型國產芯片 , 部分多模態模型推理性能達到全行業領先水平 , 可快速提升多模態數據分析、客服、代碼助手等場景的應用效能 。
4月 , 發布昆侖芯超節點產品 , 宣布正式點亮昆侖芯P800三萬卡集群 。 李彥宏稱 , “這是國內首個全自研的3萬卡集群 , 可同時承載多個千億參數大模型的全量訓練 , 支持1000個客戶同時做百億參數的大模型精調 。 ”
【昆侖芯超節點正式啟用】7月 , 昆侖芯完成新一輪股權融資 , 華興資本旗下華興證券擔任本輪獨家財務顧問 。 華興資本集團旗下華興證券董事總經理、硬科技負責人阮孝莉表示:“本輪融資成功引入重量級產業方與國家級資本 。 當前AI產業已進入大規模商業落地的關鍵階段 , 智能算力正成為科技競爭的核心驅動力 。 相信昆侖芯將持續以'芯片+集群+生態'的全棧優勢 , 夯實中國智能時代的硬科技根基 。 ”
8月 , 昆侖芯宣布中標中國移動集采項目十億級訂單 , 并在三個標包均排名第一 。 中國移動《2025年至2026年人工智能通用計算設備(推理型)集中采購項目》招標圍繞“類CUDA生態”及“CANN生態”的AI通用計算設備展開 , 在“類CUDA生態”標段中 , 基于昆侖芯的AI服務器產品中標份額排名第一 。
*聲明:本文系原作者創作 。 文章內容系其個人觀點 , 我方轉載僅為分享與討論 , 不代表我方贊成或認同 , 如有異議 , 請聯系后臺 。
想要獲取半導體產業的前沿洞見、技術速遞、趨勢解析 , 關注我們!

    推薦閱讀