英偉達下一代AI服務器平臺GB300量產進行中

英偉達下一代AI服務器平臺GB300量產進行中

文章圖片

英偉達下一代AI服務器平臺GB300量產進行中

【英偉達下一代AI服務器平臺GB300量產進行中】本文由半導體產業縱橫(ID:ICVIEWS)綜合
ODM們準備好了 。

2025年3月的英偉達 GTC大會上 , 英偉達首次公開了GB300的架構和產品 , 宣布計劃于2025年第二季度開始工程樣品出貨和小量測試訂單 , 并計劃于2025年第三季度實現量產和首批出貨 。

英偉達 GB300 NVL72 采用全液冷機架式設計 , 將 72 個Blackwell Ultra GPU 和 36 個基于 Arm架構 的 Grace CPU整合到一個平臺上 , 并針對測試時間擴展推理進行了優化 。 采用 GB300 NVL72 的AI 工廠使用Quantum-X800 InfiniBand 或 Spectrum-X 以太網 , 搭配 ConnectX-8 SuperNICS , 相比NVIDIA Hopper? 平臺可將推理模型推理的輸出提升 50 倍 。
GB300 NVL72 平臺帶來的全新 AI 推理性能 。 與 Hopper 相比 , GB300 NVL72 的用戶響應速度提升了 10 倍 , 吞吐量(每兆瓦 TPS)提升了 5 倍 。
由于發布會當時GB200系列尚未實現量產 , 有人擔心此舉會不會造成市場蠶食或推遲GB300的出貨 。 同時 , 由于制造工藝技術、液冷系統和熱管理等關鍵挑戰 , GB200 產品的量產時間從 2024 年 9 月推遲到 2025 年第二季度 。 許多供應商隨后預計 , GB300 也可能因此面臨延遲 。
2025年4月 , 有報道稱 , GB300最初計劃采用的Cordelia架構將被GB200現有的Bianca架構取代 。 這一變化增強了業內人士對GB300計劃在2025年第四季度批量出貨的信心 。
近日 , 據供應鏈消息人士透露 , 英偉達已開始限量生產其下一代人工智能服務器平臺GB300 , 預計將于 2025 年 9 月開始批量出貨 。 業內人士預計 , 得益于減輕制造商負擔的戰略轉變 , 英偉達下半年的生產軌跡將平穩 。
英偉達的一項重要舉措是 , 選擇在GB300 上沿用其當前 GB200 平臺(即 Bianca 主板)的主板設計 。 這種重復使用大大縮短了供應商的學習曲線 , 過去許多供應商都難以跟上英偉達迅猛的產品更新周期 。
一位ODM代表表示:“目前GB300沒有出現什么大問題 。 下半年的出貨應該會很順利 。 ”
目前 , GB200 的需求依然強勁 , 盡管其對液體冷卻的依賴導致了大量冷卻劑泄漏的報道 。 盡管問題尚未解決 , 但企業客戶仍然渴望部署該系統 , 并選擇了泄漏測試和局部停機等臨時解決方案 。 在人工智能開發中保持競爭力的緊迫性促使數據中心運營商優先考慮速度而非技術完善 。
一位業內高管表示:“英偉達在AI服務器領域的升級步伐就像軍事閃電戰 。 競爭對手甚至連尾燈都看不到 , 但供應鏈卻感受到了壓力 。 ”
英偉達的快速迭代——從 Hopper 到當前的 Blackwell 架構——持續帶來翻天覆地的變化 。 例如 , GB200 大幅壓縮了服務器布局 , 導致量產屢屢延期 。 然而 , 由于 GB300 可重復利用現有基礎設施 , 供應商不再面臨同樣嚴峻的產能提升挑戰 。
ODM廠商目前正在積極測試GB300 , 早期生產結果令人鼓舞 。 預計過渡將順利進行 , 預計第三季度出貨量將保持穩定 , 第四季度出貨量預計將進一步回升 。 計算板供應商緯創資通已確認 , 由于代際重疊 , 本季度收入將不會環比增長——這間接證實了GB300的生產正在進行中 。
展望未來:Rubin系列將帶來新的挑戰雖然供應鏈暫時得到緩解 , 但下一個架構飛躍的準備工作已在進行中:英偉達的Rubin平臺 。
2025年6月 , 德國萊布尼茨超算中心確認全新超級計算機 Blue Lion , 將在 NVIDIA Vera Rubin 架構上運行 。 在推理性能方面 , Rubin實現了驚人的50 petaflops , 是當前Blackwell芯片的2.5倍 。 據報道 , SK 海力士在尚未進入量產階段的情況下就向英偉達少量供應了用于下代 Rubin GPU 樣品的 HBM4 12Hi 內存堆棧 。
Rubin將引入與臺積電合作設計的基于 chiplet 的 GPU , 并采用全新設計的 Kyber 機架 (VR300 NVL 576) , 取代目前的 Oberon 機架 。 新的設計將提升GPU密度 , 從而需要更強大的散熱解決方案 。 液冷技術在GB200中已得到更顯著的應用 , 而Rubin也將因此成為核心 。
目前 , GB200 液冷系統中最脆弱的部件是快速連接配件 , 即使在工廠進行壓力測試后 , 也容易發生泄漏 。 ODM指出 , 實際部署場景的水壓和管道設計差異很大 , 因此很難完全消除泄漏 。 發貨后的維護工作耗費了大量人力 。
盡管面臨這些挑戰 , ODM廠商仍然對GB300的推出充滿信心 。
客戶端對AI服務器的需求依然強勁 , 廠商加班加點地支持客戶交付 。 富士康、緯創、廣達等GB200出貨量主要龍頭企業及其相關供應鏈預計將繼續受益于市場對AI算力日益增長的需求 , 預計2025年下半年營收將實現增長 。
*聲明:本文系原作者創作 。 文章內容系其個人觀點 , 我方轉載僅為分享與討論 , 不代表我方贊成或認同 , 如有異議 , 請聯系后臺 。
想要獲取半導體產業的前沿洞見、技術速遞、趨勢解析 , 關注我們!

    推薦閱讀