液冷不再“冷”,它正成為AI開放底座關鍵變量

液冷不再“冷”,它正成為AI開放底座關鍵變量

文章圖片

液冷不再“冷”,它正成為AI開放底座關鍵變量

文章圖片




液冷對于AI , 為何是“剛需”?
文|牛慧
編|趙艷秋
在2025年世界智能產業博覽會上 , 中科曙光聯合20余家上下游企業 , 共同發布了國內首個AI計算開放架構、同步推出基于該架構的AI超集群系統 , 并依托國家先進計算產業創新中心啟動“AI計算開放架構聯合實驗室” 。 該超集群將為萬億至十萬億級參數大模型訓練提供貼身服務 , 同時支撐并發式推理與全新科研范式場景 。

在這一架構中 , 液冷被明確為AI基礎設施的關鍵能力 。 在近幾年AI加速演進的浪潮中 , 算力基礎設施正從“硬件堆疊”邁向“系統協同” 。 液冷在這一轉型中被重新定義 , 不再是單一散熱組件 , 而是“算-存-網-電-冷”一體化系統中的關鍵底座 。
要讓液冷真正走向普惠 , 唯有擁抱標準開放與生態協同 。 開放架構正成為推動液冷從“定制化”走向規模化、普惠化的核心路徑 。 誰能率先構建可持續的液冷生態 , 誰就將在下一代AI基礎設施的競爭中贏得先機 。
01
液冷 , 正成為AI關鍵變量
在國家深入實施人工智能+過程中 , AI大模型迎來爆發期 。 今年 , 萬億參數MoE模型、深度推理模型、多模態模型已成為市場焦點;各行業加快落地人工智能 , 行業大模型爆發 , 多智能體協作興起 , 具身智能熱帶動了世界模型訓練熱潮 , 這些都推動算力需求激增 。 2025年中國智算規模將達到1000EFLOPS 。
傳統單機、單卡性能已難以滿足這樣的算力爆發 , 產業轉向發展更大規模、更高效率的AI集群 。 通過系統級優化 , 彌補單卡性能差距 , 已成為行業共識 。
AI集群規模快速擴大的同時 , 風冷已接近極限 。 “液冷技術對于AI , 尤其是萬卡、十萬卡的大集群 , 是一個剛需 。 ”曙光數創副總裁兼CTO張鵬在智博會上說道 。
這種轉變極為迫切 。 AI集群的密度躥升 , 機柜功率普遍突破80kW , 甚至超過100kW , 傳統風冷在40kW以上便難以應對 。 同時 , GPU功耗已超過1000瓦 , 并邁向2000瓦、3000瓦 , 風冷難以支撐 。 散熱跟不上導致GPU空閑、電費飆升 。 相比之下 , 液冷有更高效的冷卻能力 。 此外 , 液冷具備顯著能效優勢 , 傳統風冷PUE通常在1.3~1.6之間 , 意味著每帶走100個單位熱量 , 需額外花費30到60個單位熱量 。 而曙光數創的液冷方案目前可將PUE降至1.04 , 每百單位熱量僅需4單位能耗 , 節能效益可觀 。
進一步來說 , AI行業迭代越來越快 , 大模型訓練周期已從“月級”壓縮到“天級” , 推理也需支撐低延遲、高并發要求 , 對存算一體等提出高要求 。 在這種情況下 , 液冷已不僅是技術選型 , 更是面向未來AI基礎設施的戰略選擇 , 散熱不再是一個“后勤問題” , 而成為直接決定AI算力利用率和投資回報的核心變量 。
為此 , 國際大廠如Meta、微軟已啟動浸沒式液冷部署試點 。 國內中國移動、阿里等也在布局液冷數據中心 。 其中 , 中國移動呼和浩特建成全球最大單體液冷智算中心 , 阿里仁和數據中心為全球最大全浸沒式液冷部署 。 工信部等多部門出臺各項政策 , 推動液冷標準制定和落地應用 。
然而 , 液冷技術雖然早就存在 , 過去卻難以走向大規模落地 , 主要受制于成本高、標準缺、運維復雜、安全性不足等問題 。 業內意識到 , 液冷落地的最大障礙 , 已不再是單點技術能力 , 而是生態體系的協同水平 。
曙光數創作為國家先進計算產業創新中心AI開放架構聯合實驗室的重要參與方 , 承擔起液冷技術標準化與生態構建的責任 。 從開放架構出發 , 曙光數創聚焦液冷標準建設、組件通用與生態協同 , 破解液冷過去“各自為政、自研閉環”形成的生態孤島問題 , 推動生態鏈融合 , 為液冷突圍 , 成為普惠AI基礎設施奠定基礎 。
02
液冷生態 , 從理想走進現實
【液冷不再“冷”,它正成為AI開放底座關鍵變量】在最新發布的AI超集群中 , 選擇了曙光數創的冷板液冷技術 , 作為系統向高密、高效演進的重要支撐 。
該方案不僅提升了系統的性價比 , 也借助其技術成熟度和開放架構理念 , 吸引更多合作伙伴加入生態共建 。 同時 , 通過芯片、整機到系統層的功耗協同管理 , 實現集群能效的全面提升 。

實際上 , 作為國內最早布局液冷的企業之一 , 曙光數創自2011年開始布局液冷 , 2015年量產TC40冷板液冷服務器 , 2017年落地512節點液冷集群 。 長期服務大型機和高端計算系統的經驗 , 使其在液冷系統與整機系統融合方面具備深度的積淀 , 也為其推動液冷走向標準化、規模化落地 , 奠定基礎 。
圍繞開放需求 , 曙光數創在冷板液冷方案中實現了“服務器與機柜解耦”、“模塊化總線設計”和“盲插接口”等能力 , 支持分階段升級 , 兼容不同品牌型號設備 , 實現快速部署 , 提升運維效率超30% 。 面對更高熱通量挑戰 , 今年推出的C7000-F相變間接液冷方案 , 首次實現該技術產品化落地 , 自研環保冷媒SFP-1025F , 綠色高效、能長期穩定運行 , 解決了傳統液冷在水質與安全方面的顧慮 , 滿足AI服務器高強度運行需求 。
在實現冷板液冷大規模應用的同時 , 曙光數創牽頭編制《數據中心冷板式液冷系統技術規范》國家標準 , 聯合運營商、互聯網企業等頭部單位共建液冷生態 , 形成從芯片散熱、服務器制造到冷卻系統集成的完整液冷技術應用鏈條 , 助力液冷市場規模化發展 。 下一階段 , 曙光數創將開放浸沒式液冷技術 , 促進領先技術普及 。
03
液冷“開放之路” , 重塑AI算力底座
在AI基礎設施走向“系統協同”后 , 液冷的角色正在被重新定義 , 從單一的散熱組件 , 躍遷為支撐系統協同的關鍵底座能力 。 它要融入整個AI平臺的協同、能效調度、運維體系 , 成為支撐存算一體、綠色智算多元場景的系統組成部分 。
然而 , 液冷的普及之路并不輕松 。 多廠商各自為政 , 接口標準不統一、系統封閉難兼容 , 導致液冷長期停留在“小規模、定制化”階段 。 唯有推動標準開放、生態協同 , 才能打破“冷卻孤島” 。
業界看到 , 液冷的開放之路 , 是一條“難而正確”的道路 。 它不僅是產業演進的必然邏輯 , 更是國家AI戰略實現普惠算力的時代選擇 。 誰能率先構建起繁榮且可持續的液冷生態 , 誰就能在下一代AI基礎設施競爭中占據戰略高地 。

以曙光發布的AI計算開放架構為契機 , 液冷正加速邁向標準化與開放化 。 在2025智博會“開放普惠智能計算生態”論壇上 , 曙光數創CTO張鵬表示 , 曙光數創正在通過能力開放、標準共建、跨界融合等模式 , 積極推動液冷生態體系建設 。
依托長期對液冷技術的積累與開放架構的推進路徑 , 曙光數創正引領中國液冷技術從實驗室走向規模化落地 , 推動AI基礎設施走向更加開放和普惠的新階段 。

    推薦閱讀