NVIDIA發布LLM專用GPU:3倍注意力提升,26年發布

NVIDIA發布LLM專用GPU:3倍注意力提升,26年發布

文章圖片

【NVIDIA發布LLM專用GPU:3倍注意力提升,26年發布】NVIDIA發布LLM專用GPU:3倍注意力提升,26年發布
NVIDIA已經在GTC 2025上公布了下一代Rubin GPU的部分消息 , 不過現在看起來AI實在是太過于火爆 , 導致NVIDIA即使沒有正式發布Rubin GPU , 但是產品先給大家安排上 。 就在今天 , NVIDIA發布了為LLM中上下文處理所打造的專用GPU——Rubin CPX , 將會采用下一代的架構設計 , 能夠實現數倍的性能提升 , 當然需要到2026年才能跟大家正式見面 。

NVIDIA表示在文本推理方面 , 包括了AI提示以及生成響應 , 其中隨著提示詞越來越多和復雜 , 導致GPU的算力有些跟不上 , 因此需要一款特別打造的專用GPU來專門負責提示詞與上下文本的理解 , 而Rubin CPX就是這樣一款產品 。 未來Rubin CPX將會成為下一代Vera Rubin平臺的一部分 , 搭載Vera CPU以及Rubin GPU , 滿血Vera Rubin平臺最高擁有8EFLOPS的AI算力 。

Rubin CPX能夠擁有128GB的GDDR7顯存 , 在專注力性能上與上代相比提升3倍 , 同時NVFP4算力可以達到30PFLOPS , 當然NVIDIA還表示Rubin CPX除了硬件之外 , 還將獲得NVIDIA打造的一整套軟件棧 , 包括開放模型 , 專門為企業AI任務打造 。

只不過雖然今天NVIDIA已經發布了這款產品 , 但是具體發售需要等到2026年 , 至于為什么這么早就發布這款產品 , 很顯然NVIDIA希望盡早獲得相關廠商的訂單 , 畢竟現在AI硬件供不應求 , 早點給訂單 , NVIDIA就可以早點去生產相關的產品 。

    推薦閱讀