昇騰950首發!華為自研HBM內存正式公布:最大144GB 帶寬4TB/s

昇騰950首發!華為自研HBM內存正式公布:最大144GB 帶寬4TB/s

文章圖片

昇騰950首發!華為自研HBM內存正式公布:最大144GB 帶寬4TB/s

文章圖片

昇騰950首發!華為自研HBM內存正式公布:最大144GB 帶寬4TB/s

文章圖片

今日舉辦的華為全聯接大會2025上 , 華為輪值董事長徐直軍首次公布了昇騰芯片演進和目標 。

他表示 , 未來三年 , 華為已經規劃了昇騰多款芯片 , 包括昇騰950PR、950DT以及昇騰960、970 。 其中昇騰950PR 2026年第一季度對外推出 , 該芯片采用了華為自研HBM 。

根據現場公布的信息 , 昇騰950PR芯片架構新增支持低精度數據格式 , 其中FP8/MXFP8/HIF8: 1 PFLOPS , MXFP4: 2 PFLOPS , 重點提升向量算力 , 提升互聯寬帶2.5倍 , 支持華為自研HBM高帶寬內存 , 分為HiBL 1.0和HiZQ 2.0兩個版本 。
規格方面 , HiBL 1.0容量128GB , 帶寬1.6TB/s;HiZQ 2.0容量144GB , 帶寬4TB/s 。


其中 , 昇騰950PR芯片采用950核心+HiBL 1.0內存 , 可提升推理Prefill(預填充)性能 , 提升推薦業務性能 。
昇騰950DT采用HiZQ 2.0內存 , 可提升推理Decode(解碼)性能 , 提升訓練性能 , 提升內存容量和帶寬 。

延伸閱讀:
在大模型推理中 , Prefill階段負責接收完整輸入數據(如文本或圖像) , 并計算緩存 。 這一過程需要強大的算力支持 , 通常由高性能芯片完成 。該階段強調算力而非內存帶寬 , 因此更適合在HBM(高帶寬內存)芯片上運行 。 相比之下 , 后續的Decode階段更依賴高速內存傳輸和互聯方案 。
【昇騰950首發!華為自研HBM內存正式公布:最大144GB 帶寬4TB/s】HBM(High Bandwidth Memory , 高帶寬內存)是一種基于3D堆疊技術的先進DRAM解決方案 , 多層DRAM芯片垂直集成 , 顯著提升數據傳輸效率 。 具有超高帶寬與低延遲、高容量密度、高能效比等優勢 , 能協助快速處理數據密集型的AI任務 。
美國國際戰略研究中心(CSIS)AI專家艾倫(Gregory Allen)解釋 , HBM對于制造先進AI芯片至關重要 , 價值約占整體芯片的一半 。
AI推理需頻繁調用海量模型參數(如千億級權重)和實時輸入數據 。 HBM的高帶寬和大容量允許GPU直接訪問完整模型 , 可避免傳統DDR內存因帶寬不足導致的算力閑置 。 對于千億參數以上的大模型 , HBM可顯著提升響應速度 。
當下 , HBM已成為高端AI芯片的標配 , 訓練側滲透率接近100% , 推理側隨模型復雜化加速普及 。

    推薦閱讀