
文章圖片
【高通發布兩款數據中心AI芯片,股價一度暴漲22%】
當地時間10月27日 , 高通公司宣布推出其面向數據中心的新一代人工智(AI)推理芯片Qualcomm AI200 和 A250, 以及基于這兩款AI芯片的加速卡及機架級解決方案 。
高通表示 , 憑借公司在 NPU 技術方面的領先優勢 , 這些解決方案可提供機架級性能和卓越的內存容量 , 以極高的性價比實現快速的生成式 AI 推理 , 標志著在跨行業實現可擴展、高效且靈活的生成式 AI 方面邁出了重大一步 。
受該利好消息影響 , 高通股價在10月27日的美股盤中一度暴漲近22% , 收盤漲幅回落至11.09% 。
具體來說 , Qualcomm AI200 是一款專用機架級 AI 推理解決方案 , 旨在為大型語言和多模態模型 (LLM、LMM) 推理及其他 AI 工作負載提供低總擁有成本 (TCO) 和優化的性能 。 它支持每卡 768 GB LPDDR內存 , 可提供更高的內存容量和更低的成本 , 從而為 AI 推理提供卓越的擴展性和靈活性 。
Qualcomm AI250 解決方案將首次采用基于近內存計算的創新內存架構 , 通過提供超過 10 倍的有效內存帶寬和更低的功耗 , 為 AI 推理工作負載帶來效率和性能的跨越式提升 。 這不僅支持分解式 AI 推理 , 還能高效利用硬件資源 , 同時滿足客戶對性能和成本的要求 。
兩種機架解決方案均采用直接液體冷卻以提高熱效率 , 采用 PCIe 進行縱向擴展 , 采用以太網進行橫向擴展 , 采用機密計算以確保安全的 AI 工作負載 , 機架級功耗為 160 kW 。
高通技術公司高級副總裁兼技術規劃、邊緣解決方案和數據中心總經理 Durga Malladi 表示:“憑借 Qualcomm AI200 和 AI250 , 我們正在重新定義機架級 AI 推理的可能性 。 這些創新的全新 AI 基礎設施解決方案使客戶能夠以前所未有的總體擁有成本 (TCO) 部署生成式 AI , 同時保持現代數據中心所需的靈活性和安全性 。 我們豐富的軟件棧和開放的生態系統支持 , 使開發者和企業能夠比以往更輕松地在我們優化的 AI 推理解決方案上集成、管理和擴展已訓練的 AI 模型 。 憑借與領先 AI 框架的無縫兼容性和一鍵式模型部署 , Qualcomm AI200 和 AI250 旨在實現無縫應用和快速創新 。 ”
高通表示 , 其超大規模級 AI 軟件棧 , 端到端覆蓋從應用層到系統軟件層 , 并針對 AI 推理進行了優化 。 該棧支持領先的機器學習 (ML) 框架、推理引擎、生成式 AI 框架以及 LLM/LMM 推理優化技術(例如分解式服務) 。 開發者可以通過 Qualcomm Technologies 的 Efficient Transformers Library 和 Qualcomm AI 推理套件 , 享受無縫模型導入和 Hugging Face 模型的一鍵部署 。 高通的軟件提供即用型 AI 應用程序和代理 , 以及全面的工具、庫、API 和服務 , 助力 AI 落地 。
高通在新聞稿所嵌入的關于Qualcomm AI200 和 AI250 的詳細資料的介紹頁面目前尚未正式上線 。
不過 , 高通已經宣布 , Qualcomm AI200 和 AI250 預計將分別于 2026 年和 2027 年實現商用 。 高通還承諾 , 致力于制定數據中心路線圖 , 每年更新一次 , 專注于實現業界領先的 AI 推理性能、能效和業界領先的 TCO 。
關于高通自研數據中心CPU和AI芯片的消息 , 其實高通早就已經對外預告 。
早今年5月13日 , 高通就宣布與沙特阿拉伯AI公司HUMAIN簽署了一份諒解備忘錄 (MOU) , 旨在達成戰略合作 , 合作開發下一代人工智能數據中心、基礎設施和云到邊緣服務 , 以滿足全球對人工智能快速增長的需求 。 其中 , 就包括開發和供應高通公司最先進的數據中心 CPU 和 AI 解決方案 , 為 HUMAIN AI 云基礎設施中的數據中心提供支持 。
隨后在今年7月高通的第三財季(截至今年6月29日)財報會議上 , 高通CEO Cristiano Amon進一步指出 , 高通正在開發“通用的數據中心CPU” , 并且“非常專注于超大規模企業” , 因為“他們擁有兼容 Arm架構CPU的工作負載” 。 同時 , 高通還正在開發的另一款數據中心產品 , 并將描述為“推理集群的主機” 。 “我們一直在構建AI加速卡 , 我們還將構建一個機架 。 ”Amon說道 。
Amon當時還透露:“我們正在與一家領先的超大規模企業進行深入討論 。 如果成功 , 我們預計(來自數據中心市場的)收入將在 2028 財年開始 。 ”
編輯:芯智訊-浪客劍
推薦閱讀
- 《原點Talk》欄目發布:打造“AI創業者專屬思想碰撞場”
- 一加新機最后預熱:10月27日,正式發布
- 一加15與一加Ace6均已發布:對比上代機型,到底提升了多少?
- 24GB+1TB!新機預熱:全面屏+7500mAh,即將發布
- 上交、清華、微軟、上海AI Lab等聯合發布數據分析智能體綜述
- 努比亞Z80 Ultra發布:同檔唯一真全面屏Ultra 4999元起
- REDMI K90系列發布:中端價格享受旗艦體驗,2599元起售!
- 三星Galaxy26系列旗艦或晚于計劃,2026年2月發布?
- 雙X3D旗艦將至,AMD銳龍9000X3D兩款新品曝光
- 華為擎云發布TVC《讓安心觸手可及》:用人文關懷重塑科技價值
