華為和DeepSeek手拉手邁出一大步

華為和DeepSeek手拉手邁出一大步

文章圖片

華為和DeepSeek手拉手邁出一大步

9月18日 , 上海舉行的華為全聯接大會(HC大會)上 , 華為輪值董事長徐直軍一上臺 , 就提起了年初由DeepSeek引起的這場全民狂歡 。
“從今年春節開始到4月30日 , 經過多團隊的協同作戰 , 終于使昇騰(Ascend )910B/910C的推理能力達成了客戶的基本需求 。 ”徐直軍說到 , DeepSeek橫空出世吼 , 一時間眾多政府機構、央企響應接入DeepSeek , 作為算力提供商 , 華為也必須跟進響應 。
華為自2018年首次發布昇騰310芯片、2019年推出昇騰910芯片以來 , 持續投入AI基礎算力的研發與創新 。 雖然DeepSeek開創的模式大幅減少了算力需求 , 但徐直軍認為 , 要走向AGI和物理AI , 華為認為 , 算力 , 過去是、未來也將繼續是人工智能的關鍵 。

1、華為發布多款芯片產品 , 規劃已經設到了2028年徐直軍宣布 , 面向未來 , 華為已規劃三個系列的昇騰芯片 , 包括950、960和970系列 。
其中 , 昇騰950系列包含兩顆芯片:950PR和950DT , 950PR將于2026年一季度上市 , 950DT將于2026年四季度上市 。
昇騰960芯片將于2027年四季度上市 , 昇騰970芯片則預計是2028年四季度上市 。
華為昇騰芯片發布規劃;圖片由作者拍攝
與上一代相比 , 昇騰950在多個方面實現根本性技術提升:新增支持FP8/MXFP8/HIF8、MXFP4等低精度數據格式 , 算力分別達到1 PFLOPS和2 PFLOPS , 大幅提升訓練與推理效率;大幅提升向量算力 , 支持更精細粒度內存訪問;互聯帶寬提升2.5倍 , 達到2TB/s;并搭載自研HBM技術HIBL1.0和HIZQ2.0 。
在通算領域 , 華為規劃了鯤鵬950與鯤鵬960 , 分別將于2026年第四季度和2028年第一季度上市 , 圍繞支持超節點和更多核、更高性能持續演進 。
此外 , 華為正式發布了面向超節點的互聯協議——靈衢 , 并開放靈衢2.0技術規范 。 自2019年開始研究 , 靈衢1.0已開啟商用驗證 , 如今靈衢2.0的開放 , 旨在邀請產業界基于靈衢研發相關產品和部件 , 共建靈衢開放生態 。

2、發布全球最強算力超節點由于國際政治等復雜原因 , 徐直軍也在發布會上直言 , 華為單片芯片的算力表現比不過英偉達 , “但華為有三十年在連接技術的積累 , 華為的超節點計算機 , 能做到世界上算力最強 , 滿足全世界在AI訓練推理上的巨大需求 。 ”
超節點(SuperPod)是眼下是智算發展的重要趨勢 。 徐直軍認為 , 超節點在物理上由多臺機器組成 , 但邏輯上以一臺機器學習、思考、推理 。
【華為和DeepSeek手拉手邁出一大步】在具體的超節點業務進展上 , 華為發布了Atlas 950 SuperPoD和Atlas 960 SuperPoD 。 其中基于昇騰950芯片的Atlas 950超節點支持8192卡規模 , 由128個計算柜和32個互聯柜組成 , 占地面積約1000平方米 , FP8算力達8EFlops , FP4算力達16EFlops , 互聯帶寬高達16 PB , 相當于當前全球互聯網總帶寬的10倍以上 。
華為發布了Atlas 950 SuperPoD展示;圖片由作者拍攝
昇騰950超節點將于2026年第四季度上市 , 徐直軍強調 , Atlas 950超節點將是2026~2028年間全球算力最強的AI超節點 。
而另外的Atlas 960超節點 , 支持15488卡 , 由176個計算柜和44個互聯柜組成 , 算力、內存和帶寬在Atlas 950基礎上再度翻番 , 計劃于2027年四季度上市 。
徐直軍特別提到 , 超節點的價值不僅限于制造、通信和計算等傳統業務領域 。 在互聯網產業廣泛應用的推薦系統方面也有重要作用 。 華為基于泰山950和Atlas 950可構建混合超節點 , 為下一代深度推薦系統開創全新的架構方向 。
不過 , 大規模超節點雖然將智能計算和通用計算能力大大提升 , 但其中的互聯技術仍有不成熟的地方 。
例如 , 如何實現8192卡乃至15488卡規模的可靠互聯 , 就是行業亟待解決的技術難題 。 目前產業界許多已發布的超節點方案未能實現大規模部署 , 其核心瓶頸并非芯片本身 , 而是互聯技術尚未成熟 , 具體體現是兩方面的挑戰:
一是如何做到長距離而且高可靠 。 大規模超節點機柜多 , 柜間聯接距離長達1000至2000米 。 當前電互聯技術在高速信號傳輸時距離受限 , 最多僅支持兩個機柜互聯;而光互聯技術雖能滿足長距離連接需求 , 卻無法達到單一計算機系統所要求的高可靠性 。
二是如何實現超大帶寬與超低時延 。 當前跨機柜卡間互聯帶寬與超節點需求存在5倍以上差距 , 時延最好僅能達到3微秒左右 , 與Atlas 950/960設計目標仍有24%的差距 。 在時延已逼近物理極限的情況下 , 每0.1微秒的提升都極具挑戰 。
徐直軍闡述了兩方面的解決途徑 。
華為在超節點層面的技術積累;圖片由作者拍攝
首先 , 為了解決長距離且高可靠問題 , 華為在互聯協議的物理層、數據鏈路層、網絡層、傳輸層等每一層都引入了高可靠機制;同時在光路引入了百納秒級故障檢測和保護切換 , 當出現光模塊閃斷或故障時 , 讓應用無感;并且 , 華為重新定義和設計了光器件、光模塊和互聯芯片 。 這些創新和設計讓光互聯的可靠性提升100倍 , 且互聯距離超過200米 , 實現了電的可靠和光的距離 。
其次 , 為了解決大帶寬且低時延問題 , 華為突破了多端口聚合與高密封裝技術 , 以及平等架構和統一協議 , 實現了TB級的超大帶寬 , 2.1微秒的超低時延 。
“正是因為一系列系統性、原創性的技術創新 , 我們才攻克了超節點互聯技術 , 滿足了高可靠、全光互聯、高帶寬、低時延的互聯要求 , 讓大規模超節點成為了可能 。 ”徐直軍說到 。

    推薦閱讀