
文章圖片

文章圖片

當地時間 10 月 28 日 , 在英偉達秋季 GTC 大會上 , 英偉達首席執行官黃仁勛展示了最新的 Vera Rubin 超級計算平臺 , 英偉達直呼其為“超級芯片(Superchip)” 。
圖 | 黃仁勛展示最新的 Vera Rubin 樣品(來源:英偉達)
Vera Rubin , 這一名稱來自著名天文學家薇拉·魯賓(Vera Rubin) , 象征著對探索宇宙與科學前沿的致敬 。
該平臺由全新的 Vera CPU 與 Rubin GPU 共同組成 , 目標是同時支撐人工智能大模型訓練、科學計算與國家級超級計算任務 。
首批系統將部署在美國洛斯阿拉莫斯國家實驗室(Los Alamos National Laboratory , LANL) , 并由惠普企業(HPE)協助英偉達構建兩臺新一代超級計算機“Mission”和“Vision” , 分別用于國家安全和開放科研任務 。
Vera Rubin 的亮相頗具戰略意味 。 英偉達的老對手 AMD 剛剛贏得美國能源部的 10 億美元超算合同 , 在高性能計算市場中給英偉達帶來了不小的壓力 。
從架構層面看 , Vera Rubin 是英偉達迄今最復雜的計算平臺 , 由 Vera CPU 和 Rubin GPU 組成 , 分為普通版 Vera Rubin NVL144 和 Ultra 版 NVL576 。
Vera Rubin NVL144 平臺將采用兩顆全新芯片 。 Rubin GPU 將采用兩顆 Reticle 大小的芯片 , FP4 性能高達 50 PFLOP , 并配備 288 GB 的下一代 HBM4 顯存 。 此外 , NVL144 平臺還將搭載一顆 88 核 Vera CPU , 該 CPU 采用定制的 ARM 架構 , 擁有 176 個線程 , 以及高達 1.8 TB/s 的 NVLINK-C2C 互連 。
(來源:資料圖)
性能擴展方面 , NVL144 平臺將具有 3.6 Exaflops 的 FP4 推理算力和 1.2 Exaflops 的 FP8 訓練算力 , 比 GB300 NVL72 提升 3.3 倍 , 13 TB/s 的 HBM4 內存和 75 TB 的快速內存 , 比 GB300 提升 60% , 并且 NVLINK 和 CX9 功能的額定速度分別達到了 260 TB/s 和 28.8 TB/s 。
NVL144 主要面向 AI 模型的極大規模訓練與實時推理 , 預計將在 2026 下半年問世 。 更高端的 NVL576 平臺預計將在 2027 年推出 , 其 FP4 推理性能將達到 15 Exaflops 級別 , FP8 訓練性能達 5 Exaflops 。
(來源:資料圖)
黃仁勛表示 , Rubin 平臺“并非單純為AI 設計 , 而是兼顧了科研與 AI 的雙重任務” 。 因此 , 它并未為低精度AI 性能犧牲傳統高性能計算能力 , 依舊支持高精度 FP64 科學計算 , 確保物理模擬、氣候模型、量子化學等科研任務能夠獲得充分性能 。
洛斯阿拉莫斯實驗室的Vision 系統將率先部署 Vera Rubin 架構 , 用于開放科學研究與 AI 模型開發;Mission 系統則面向國家核安全任務 , 計劃在 2027 年正式上線 。 按計劃 , Vision 的性能將至少比其前代系統 Venado(約 98.5 PFLOPS FP64)提升一倍以上 。
英偉達指出 , AI 模型規模的迅速增長 , 正在迫使計算平臺在內存帶寬、互連速率與能效比上取得平衡 。
圖 | 英偉達路線圖(來源:英偉達)
Rubin 平臺支持 NVLink Gen6 與 CX9 網絡 , 可在節點間提供 260 TB/s 與 28.8 TB/s 的總帶寬 , 使數千 GPU 能以接近單機的延遲進行協同計算 。 這一特性對訓練超大規模多模態模型尤為關鍵 。
不過 , 英偉達尚未公布完整的Vera Rubin 系統功耗、散熱方案與軟件棧兼容細節 , 尤其是在與 CUDA、HPC SDK、OpenACC 以及科學模擬軟件的適配層面 。 Vera CPU 的微架構信息同樣有限 , 外界推測其或基于 Grace 的進化版本 , 但尚未確認 。
會上 , 英偉達還推出一種名為NVQLink 的互連技術 , 黃仁勛將其稱為是“連接量子和經典超級計算機的羅塞塔石碑” , 它將量子和傳統超級計算機整合成了一個統一、連貫的系統 , 標志著量子 GPU 計算時代的到來 。
(來源:資料圖)
NVQLink 將量子處理器和控制硬件系統的多種方法直接連接到 AI 超級計算機上 , 能夠幫助量子從業人員克服在擴展硬件時所面臨的集成難題 。 作為一種開放系統架構 , 它可以將 GPU 計算與量子處理器進行緊密結合 , 從而為量子超級計算機帶來加速 。
據了解 , 量子比特是一種讓量子計算機能以普通計算機無法做到的方式處理信息的信息單位 , 它不僅非常精密而且容易出錯 , 因此需要使用復雜的校準技術、量子誤差校正技術和控制算法才能正常運行 。 此前 , 這種算法必須依托傳統超級計算機極其苛刻的低延遲和高吞吐量進行連接 , 只有在這時才能控制量子比特誤差 , 從而實現相關的量子應用 。
而 NVQLink 則提供了上述過程所需要的互連能力 , 為打造一些跨行業的應用提供了所需的環境 。 黃仁勛公開表示 , 在不久的將來 , 每臺基于英偉達 GPU 的科研型超級計算機都將擁有混合型的特點 , 并能與量子處理器緊密結合 , 從而能夠擴展計算的可能性 , 最終為未來打造混合量子·經典超級計算機做好準備 。
目前 , 用戶可以通過與英偉達CUDA-Q 軟件平臺的集成來訪問 NVQLink , 從而實現 CPU 和 GPU 的無縫利用 , 以及創建關于量子處理器的應用程序 。
眼下 , NVQLink 已經為 17 個量子行業機構、5 個控制器行業機構、9 家實驗室實現了量子和 GPU 計算的互連 。 英偉達稱這一技術還能讓量子處理器連接到一些超級計算實驗室的設備上 , 目前 NVQLink 已經被用于美國布魯克海文國家實驗室等實驗室 , 正在幫助量子從業人員實現大規模量子計算和量子糾錯所需的控制算法 , 助力構建混合型量子經典系統 , 加速實現化學領域和材料領域的下一代應用 。
參考資料:
https://nvidianews.nvidia.com/news/nvidia-nvqlink-quantum-gpu-computing
【老黃發布Vera Rubin超級芯片!算力狂飆3倍,鎖定美國核武實驗室】https://gizmodo.com/nvidia-supercomputers-for-trump-2000678264
推薦閱讀
- 逼近5萬億美元!英偉達GTC深夜爆拉市值,Vera Rubin超級芯片露面
- 「美隊」老黃深夜扔出地表最強GPU!算力百倍狂飆,下次改演雷神
- 巴可發布QDX-N4K系列旗艦投影機,以原生4K與智能傳輸重塑行業標準
- iQOO新機最后預熱:10月30日,正式發布
- 灑拖新品發布會暨分眾戰略簽約儀式成功,擦窗技術再升級!
- 小米17 Ultra將提前發布 無背屏依舊是圓形鏡頭模組
- 今年的一加有些不一樣
- 小米 17 Air 版曝光:eSIM+超薄機身,預計明年發布?
- 360發布企業級智能體構建與運營平臺,解決企業級智能體落地三大難題
- 今天,小米發布了一個價值25億的“新品”
