
z17和LinuxONE5將在10月28日支持Spyre , Power11則預計12月初實現兼容 。
IBM宣布其AI推理加速器Spyre將于本季度正式投入商業使用 。 根據規劃 , z17和LinuxONE5將在10月28日支持Spyre , 而Power11則將在12月初實現兼容 。
Spyre加速器采用PCIe AIC卡形態 , 單卡功耗為75瓦 , 集成32個加速核心 , 基于5納米工藝制造 , 晶體管數量達到256億 。 在部署能力方面 , z17與LinuxONE 5單臺設備最高可支持48張Spyre加速卡 , Power11系統則可集成16張附加卡 。
IBM指出 , Spyre的推出使企業能夠在本地環境中高效運行多模態AI推理任務 , 在提升業務處理效率的同時 , 確保關鍵數據、交易流程及核心應用的安全可控 。
Spyre基于三星5nm制造 , 擁有256億個晶體管據介紹 , Spyre基于三星5LPE 制程工藝制造 , 核心面積為330平方毫米 , 整合了256億個晶體管 , 是一款專門構建的企業級AI 芯片 , 為復雜的AI 模型和生成式AI用例提供可擴展的功能 。 其擁有32個加速器核心 , 被整合在75W 功耗的PCIe 擴展卡上 , 多個Spyre芯片可以通過PCIe 連接到IBM Z 的I/O 子系統 。
5nm制程工藝的采用 , 使得Spyre加速器在性能和功耗之間取得了理想的平衡 。 更小的晶體管尺寸意味著更高的集成度 , 從而在更小的空間內實現更強大的計算能力 。 這對于需要處理海量數據的AI應用來說至關重要 。 此外 , 較低的功耗也降低了運營成本 , 并減少了對散熱系統的需求 。 這種技術進步 , 也預示著未來AI加速器在性能和能效方面將持續提升 。
該產品核心優勢在于支持多模態AI推理任務的本地化部署 。 企業客戶無需將核心數據上傳至云端 , 即可在自有數據中心完成圖像識別、自然語言處理等復雜AI運算 , 有效保障交易數據、應用程序等關鍵信息的安全性 。
Spyre的應用場景如今 , IT環境正在從傳統的邏輯工作流程轉變為代理人工智能推理 。 AI代理需要低延遲推理和實時系統響應 , 大型機和服務器需要在不影響吞吐量的情況下運行人工智能模型以及最苛刻的企業工作負載 。
Spyre加速器通過本地AI加速提供快速、安全的處理 , 企業能夠大規模利用人工智能 , 同時保留IBM Z、LinuxONE和Power系統上的數據 。 在大型機系統中 , 結合用于IBM Z和LinuxONE的Telum II處理器 , Spyre提供了增強的安全性、低延遲和高事務速率處理能力 。 利用這種先進的硬件和軟件堆棧 , 企業可以使用Spyre擴展多個AI模型 , 以支持高級欺詐檢測和零售自動化等商業預測用例 。
同時 , 在基于IBM Power的服務器上 , Spyre客戶可以利用一系列AI服務 , 為企業工作流程實現端到端的AI 。 客戶只需點擊一下即可從目錄中安裝AI服務 。 Spyre Accelerator for Power與片上加速器(MMA)相結合 , 還可以加速生成AI的數據轉換 , 為深度過程集成提供高吞吐量 。 此外 , 它的提示大小為128 , 可以在一小時內接收800多萬份文檔進行知識庫集成 。 這種性能與IBM軟件棧、安全性、可擴展性和能效相結合 , 支持客戶將生成式人工智能框架集成到企業工作負載中 。
IBM基礎設施首席運營官兼IBM系統總經理Barry Baker表示:“我們的一個關鍵優先事項是推進基礎設施建設 , 以滿足新興人工智能工作負載的需求 , 借助Spyre Accelerator , 我們正在擴展系統的功能 , 以支持多模型人工智能 , 包括生成和代理人工智能 。 這項創新使客戶能夠以毫不妥協的安全性、彈性和效率擴展其支持人工智能的關鍵任務工作負載 , 同時釋放其企業數據的價值 。 ”
【IBM AI推理加速器Spyre即將正式商用】想要獲取半導體產業的前沿洞見、技術速遞、趨勢解析 , 關注我們!
推薦閱讀
- 算力成本大降!馬爾可夫思考機來了,LLM推理成本直接降為線性
- DeepSeek發布稀疏注意力技術降低AI推理成本
- 700萬參數擊敗DeepSeek R1等,三星一人獨作爆火,遞歸顛覆模型推理
- IBM新款AI加速器Spyre上市:三星5nm制造,擁有256億個晶體管
- 田淵棟與Russell團隊,證明Transformer在訓練中自然學會疊加推理
- 推理token減少46%!Meta新方法縮短思維鏈,告別重復推導
- 又一推理新范式:將LLM自身視作改進操作符,突破長思維鏈極限
- 邁入1T模型陣營 螞蟻開源首個萬億參數推理大模型 代碼生成超GPT-5
- SALMONN 音視頻理解大模型霸榜回歸!推理增強、高幀率全線突破
- 8.9ms推理速度新紀錄!1元百萬token,浪潮信息加速智能體產業化
