中科曙光發布國內最大AI4S集群:60000卡國產超智融合算力巔峰

中科曙光發布國內最大AI4S集群:60000卡國產超智融合算力巔峰

文章圖片


4月14日 , 在河南鄭州國家超算互聯網核心節點 , 中科曙光正式發布了6萬卡AI4S(AI for Science)計算集群并宣布投入使用 , 這是目前國內規模最大的AI4S計算集群 , 沒有之一 。
本次發布的6萬卡集群 , 具備六大特征:強大算力、全面精度、高速互連、存算協同、靈活調度、穩定可靠 。
算力層面 , 6萬卡集群的超算算力、AI算力雙雙達到了全球頂級水平 , 能夠滿足軟件模型優化、科研應用效率到科學智能體開發的多維需求 。
精度層面 , 集群支持8/16/32/64位寬全精度計算;互連層面搭載國內首款類InfiniBand無損高速網絡的scaleFabric系列產品 , 可充分滿足AI4S計算集群對高帶寬、低時延網絡的極致需求 。
存儲層面曙光通過存、算、傳協同優化 , 給出了三層協同、五檔加速的方案 , 包括芯片、系統到應用的三層傳輸協同 , 核心就是避免存儲IO瓶頸 。
調度層面集群實現了每秒10000+次并發作業調度效率 , 通過多元融合調度策略加上數據親和性算法 , 讓超算和智算的資源可以在同一套系統里靈活調配 。
浸沒相變液冷加上穩定可靠依托智能化運維、數字孿生系統 , 穩定性上系統可用性達到99.99% 。
整個核心節點還采用了湖水冷卻加余熱回收方案 , 從湖中多點取水 , 退水溫度升高控制在1℃以內 , 余熱還能用于供暖和生活熱水 , 等效WUE≈0 , 年減排二氧化碳4萬噸 。
硬件參數再強 , 也要能落地使用 , 曙光配套推出了國內首個科學大模型一站式開發平臺OneScience , 集成數十個AI4S熱點模型及數據集 , 覆蓋地球科學、生物信息、流體仿真、材料化學等多學科 。
【中科曙光發布國內最大AI4S集群:60000卡國產超智融合算力巔峰】通過自然語言交互 , 用戶只需說出科研需求 , 系統便能自動拆解任務并調度算力 , 將科研任務完成時間從天級直接壓縮到小時級。

目前集群已落地多個科研場景 , 覆蓋生命科學、材料科學和流體力學等AI4S最核心的應用場景:
3萬卡規模蛋白質折疊模擬 , 較傳統算法加速超1000倍;
4.5萬卡萬億原子液態水分子動力學模擬 , 打破世界模擬規模紀錄 , 提升3個數量級以上;
智能湍流直接模擬 , 規模擴展至百萬億網格 。
另外隨著6萬卡集群的落地 , 國家超算互聯網平臺已經構建起國內規模最大的AI4S計算基礎設施 , 總計鏈接超300萬CPU核和超20萬GPU卡 , 接入全國一體化算網調度體系 。

    推薦閱讀