英偉達的GPU陣地,群雄割據

英偉達的GPU陣地,群雄割據

文章圖片


本文由半導體產業縱橫(ID:ICVIEWS)編譯自eetimes
下一個主要的競爭挑戰將出現在半導體芯片連接領域 。
過去十年 , 英偉達一直主導著用于機器學習/人工智能領域的高性能計算機芯片市場 。
英偉達憑借其專有的CUDA軟件和快速創新 , 已成為人工智能處理器的代名詞 。 該公司市值預計將在2025年短暫達到5萬億美元 。 2025年2月至10月期間 , 支持人工智能發展的硬件(包括半導體芯片和網絡連接)的收入達到1478億美元 。
英偉達最新、最強大的處理器“Grace Blackwell”系列一經推出便迅速售罄 , 但其市場主導地位正在逐漸消退 。 隨著行業向更加專業化的硬件方向發展 , 英偉達如今面臨的挑戰不再僅僅局限于與一家公司競爭 , 而是來自多個方面 。
英偉達的強勁銷售和高利潤率主要得益于有限的產量稀缺 , 高端芯片的主要瓶頸在于臺積電在芯片封裝(CoWoS)先進封裝方面的產能有限 。
英偉達正在利用大部分有限的產能 , 但半導體供應的競爭正在加?。鹤鳛槲ㄒ恢圃焐痰呐_積電計劃到 2026 年將其產能擴大到每月 10 萬片晶圓 。 隨著供應限制的緩解 , 谷歌和 AMD 等公司將從中受益 。
隨著業界從試驗大規?;A模型轉向優先發展大規模、高性價比的推理 , 英偉達面臨著巨大的風險 。
主要的云服務提供商正在擺脫對英偉達 CUDA 生態系統的依賴 , 并投資開發自己的芯片用于高容量推理 , 因為在高容量推理中 , 運營成本超過了訓練成本 。
英偉達的主要客戶變成了“競爭對手”北美四大超大規模數據中心運營商——谷歌、亞馬遜網絡服務、微軟和 Meta——是該領域最大的資本支出者之一 , 它們集體轉向定制芯片是一項旨在確保競爭優勢的戰略舉措 。
Alphabet旗下的谷歌已開始向定制人工智能芯片轉型 , 其首款產品是張量處理單元(TPU) 。 最新版本——第七代TPU Ironwood——針對推理進行了優化 。 它擁有大量的共享內存 , 單個SuperPOD最多可連接9216個芯片 , 從而解決了大型混合專家(MoE)模型的內存限制問題 。
谷歌TPU的主要特性 來源:谷歌
Meta Platforms公司可能從2027年開始租賃或采購谷歌的TPU芯片用于其數據中心 , 這標志著谷歌正轉型成為一家商業芯片供應商 。 據估計 , 谷歌可能會占據英偉達年總收入的10% , 這筆收入可能高達數十億美元 。
亞馬遜網絡服務 (AWS) 正致力于進一步提升性價比 , 以吸引那些尋求英偉達高價芯片替代方案的企業 。 AWS 聲稱 , 其“Trainium”芯片與 GPU 相比 , 可將訓練成本降低高達 50% , 并且主要面向中等規模的 AI 工作負載 。
AWS 還在擴展其 Graviton5 定制芯片 , 該芯片采用 3nm 工藝 , 據稱在通用任務中比上一代產品性能提升高達 25% 。 Anthropic 等合作伙伴正在使用 Trainium2 進行模型訓練 , 這充分展現了 AWS 的 Trainium 軟件和 Neuron 軟件開發工具包 (SDK) 的價值 。
Meta 采用了一種獨特的方法:其 Meta 訓練和推理加速器 (MTIA) 專為 Facebook 和 Instagram 等平臺的推薦系統等高容量任務而設計 。 通過將這些任務卸載到其定制芯片上 , 該公司可以將 英偉達H100 芯片用于更高級的 AI 研究 。
微軟的定制芯片項目遭遇挫折 。 該公司下一代芯片Maia(代號Braga)的發布已被推遲至2026年 , 這使其處境艱難 。 此次延期意味著微軟必須繼續采購昂貴的英偉達Blackwell GPU來滿足OpenAI的計算需求 。 為了降低成本 , 微軟也使用了AMD的Instinct MI300X GPU , 并且是AMD最大的客戶之一 。
AMD的目標是成為“英偉達的替代選擇”隨著各大云廠商紛紛開發自有系統 , AMD 繼續鞏固其在眾多市場中與 英偉達抗衡的關鍵地位 。 AMD 的 MI300X 芯片配備 192GB 的 HBM3 顯存 , 遠超 英偉達的 H100 , 使其成為降低大規模模型推理成本的理想之選 。 AMD 預計其數據中心 GPU 的年銷售額將達到數十億美元 , 從而與 英偉達展開直接競爭 。
AMD 之前的軟件限制現在已通過 OpenAI 的 Triton 編譯器得到解決 , 該編譯器允許開發人員編寫與 英偉達和 AMD 硬件兼容的高性能代碼 , 而無需深入了解 CUDA 或 AMD 的 ROCm 。
Triton 提高了硬件兼容性 , 簡化了從 CUDA 的遷移 , 降低了成本 , 使制造商更容易采用其他供應商 。
【英偉達的GPU陣地,群雄割據】英偉達承認 , 由于臺積電產能受限 , 公司難以維持高利潤率 , 因此正在投資新市場 , 包括諾基亞等電信基礎設施制造商 。
盡管面臨這些挑戰 , 預計英偉達將在2026年之前保持其在高利潤、高性能模型訓練領域的領先地位 。 然而 , 更廣泛的大規模推理市場可能由主要云提供商的定制芯片主導 。
下一個主要的競爭挑戰將出現在半導體芯片連接領域 。 隨著電氣連接的局限性日益凸顯 , 商用產品開始采用光纖連接 。 Marvell 收購 Celestial AI , 以及 Lightmatter 等公司提供用于更快芯片連接的 3D 光子晶圓 , 都表明到 2026 年 , 光纖連接將成為人工智能芯片的主要標準 。 這一轉變將使 Broadcom 和 Marvell 等公司成為關鍵供應商 。
英偉達如今面臨的挑戰是如何在快速向專用硬件轉型的行業中保持盈利能力并鞏固市場份額 。 人工智能計算的未來將不再由任何一家公司壟斷 , 而是由專業化、高度互聯的系統融合而成 。
*聲明:本文系原作者創作 。 文章內容系其個人觀點 , 我方轉載僅為分享與討論 , 不代表我方贊成或認同 , 如有異議 , 請聯系后臺 。


想要獲取半導體產業的前沿洞見、技術速遞、趨勢解析 , 關注我們!

    推薦閱讀