英偉達“丟掉”的1000億,國產平替還能繼續賺嗎?

英偉達“丟掉”的1000億,國產平替還能繼續賺嗎?

文章圖片


“我們可能無法全部恢復先前的庫存減計損失 , 但大多數庫存是可以恢復的 。 新的客戶需求和我們現有的庫存產品是可以匹配的 , 所以不能說100%恢復 , 但也不是完全沒有可能 。 ”
這是英偉達創始人黃仁勛對H20芯片解禁后的最新表態 。 他在鏈博會上的上述講話 , 無疑給了英偉達國產平替們一記悶棍 。
此前 , 在2025年一季度財報電話會上 , 黃仁勛對外提到 , 因中國芯片出口限制帶來的計提損失一季度55億美元 , 二季度有望升至80億美元 , 總損失達到近1000億元人民幣 。
作為對比 , 2024年 , 英偉達在中國交付了超過100萬張H20芯片 。 按照彼時單芯片1.2萬美元到1.3萬美元的售價計算 , 僅H20就為英偉達貢獻了超過120億美元的營收 , 超過上一財年英偉達中國區的整體營收 。
近千億的潛在虧損 , 直接影響著英偉達在中國芯片江湖的市場地位 。 5月份參加Computex 2025期間 , 黃仁勛對外表示英偉達在中國AI芯片的份額已經從2022年出口管制期間的95% , 下降至50% 。 伴隨而來的 , 則是英偉達在中國的市場的營收占比從2022年的約40% , 下降到不到20% 。
國產芯片廠商們 , 成了英偉達中國市場份額下滑中的最大贏家 。 以DeepSeek R1為代表的推理模型的到來 , 更是為國產芯片瓜分英偉達平添了一份助力 。
2025年前 , 大模型行業更多處在預訓練階段 , 一眾國產芯片廠商都難以在訓練效率和結果上匹敵英偉達芯片 。 但進入后訓練階段的推理模式后 , 調用大模型過程中 , 隨著客戶對芯片性能的要求直線下降 , 落后英偉達好幾代的國產芯片廠商們 , 終于等來一次難得的平替機會 。
據字母榜(ID:wujicaijing)了解 , 華為在昇騰芯片加持下 , 一度在今年一季度的DeepSeek一體機市場 , 占據了超70%的份額 。
寒武紀更是憑借飆漲的訂單量 , 罕見地完成了扭虧為盈 。 沐曦股份和摩爾線程等初創芯片公司 , 更是在蜂擁訂單助力下 , 紛紛開啟了上市沖刺 。
但H20芯片解禁消息一出 , 處在加速度中的國產芯片廠商 , 不可避免將迎來新一輪業務震蕩期 。

A除了搶占以DeepSeek一體機為代表的推理市場 , 華為還瞄準了英偉達占據核心的訓練市場 , 發起進攻 。
在單卡性能不如英偉達的顯示前提下 , 華為采取了以量取勝的笨辦法 , 借助比英偉達更多的多卡集群來補上差距 。
4月份 , 華為對外推出CloudMatrix 384超節點 , 官方稱其已在蕪湖數據中心規模上線 。 據“科創板日報”報道 , 華為內部人士稱其為核彈級的產品 , 或將徹底終結算力焦慮 。
傳統AI服務器通常包括8張算力卡 , 一臺服務器稱為一個節點 。 在ChatGPT掀起大模型浪潮 , 并驗證了縮放法則(Scaling Law)的正確性后 , 更大的算力集群 , 便成了訓練出更優模型的必備條件 。
為此 , AI廠商不得不構建起包括成千上萬張GPU算力卡的算力集群 , 這便帶來了卡與卡之間互聯和通信的新麻煩 。
針對上述難題 , 2024年3月 , 英偉達率先發布了NVL72超節點 , 支持把72張算力卡組成一個超節點 , 為萬億參數的大模型訓練和推理提供服務 。
作為對比 , 華為CloudMatrix 384顧名思義便是以384張昇騰算力卡組成一個超節點 , 從而在規模、性能和可靠性上對標英偉達的NVL72 。
華為的野心時刻被黃仁勛看在眼中 。 在談及國產芯片競爭時 , 黃仁勛再度提及華為 , “任何低估華為、低估中國制造能力的人 , 都是極其天真無知的 。 華為是一家非常強大的公司 , 我以前見過他們開發出的技術……他們能夠做到和我們接近 , 這說明了一切 。 ”
華為之外 , 作為當前GPU芯片上市第一股的寒武紀 , 則用更直觀的財報數據 , 向外界展示了是如何瓜分英偉達蛋糕的 。
2025年一季度 , 寒武紀實現營業收入11.11億元 , 同比暴漲4230.22% , 接近去年全年營收 。 歸屬于上市公司股東的凈利潤3.55億元 , 上年同期為虧損2.27億元 , 實現歷史性的扭虧為盈 。 這也是寒武紀連續第二季度實現盈利 , 去年第四季度寒武紀歸母凈利約為2.81億元 。
更多創業公司也在暴漲訂單助力之下 , 開始搶奪上市窗口期 , 包括沐曦股份和摩爾線程在內 , 都于年內提交了IPO申請 。

B但在國產芯片廠商紛紛爭當英偉達平替的另一面 , 則是他們受限于產能等因素 , 還無法把到手的訂單全部消化 。
以寒武紀為例 , 盡管其一季度營收暴漲超40倍 , 但絕對值上也只有約11億元人民幣 , 相比英偉達一季度55億美元的計提損失 , 占比不到3% 。
就在國產芯片還在等待產能提升的當下 , 英偉達H20芯片值此解除禁售 , 等于反過來又搶了一波國產芯片的空窗期 。 這一變動 , 將直接影響三季度后的國產芯片廠商整體營收規模 , 也將搶占國產芯片原本就不大的市場空間 。
年初DeepSeek爆火帶動一眾科技大廠加碼To C應用時 , 尤其是騰訊元寶因接入DeepSeek流量暴漲 , 有報道稱騰訊、字節等向英偉達緊急下單了一批H20芯片 , 以滿足AI應用的算力消耗 。
但隨著4月份H20被禁 , 上述訂單也不了了之 。 近期H20解禁后 , 外界很快傳出字節、騰訊等廠商已經向英偉達下單 。 對此 , 黃仁勛否認稱 , 自己還沒來得及與任何客戶會面 。 “需要一些時間來提升H20供應鏈的產能 , 未來幾個月 , 英偉達將努力加速這一過程 。 ”
之所以仍有一眾廠商愿意等待英偉達H20芯片 , 關鍵原因之一在于 , 英偉達芯片在多卡串聯的并行計算環節 , 仍然存在較大優勢 。
微軟大中華區Azure事業部總經理陶然便曾對外解釋道 , 很多廠商沒有能力去實現多卡連接 , 但多卡并行運算卻直接決定著大模型訓練所需花費的時間成本 , “同樣的一套模型 , 如果訓練一次需要花費一周成本為100萬美元 , 但如果帶寬太小最終耗時兩周 , 那成本就將乘以2 。 ”
在崇尚效率的大模型賽道 , 時間有時比金錢更重要 。 更糟糕的是 , 即便是在更換國產GPU的過程中 , 國內AI廠商眼下也面臨無法使用更先進制程工藝芯片的挑戰 。 美國相關部門已經將壁仞、摩爾線程等國產GPU公司列入實體清單 , 這意味著在沒有獲得許可的情況下 , 它們既不能進口含有美國公司的任何技術或產品 , 也不能通過臺積電等代工廠生產14nm以下的先進芯片 。
對國產芯片廠商來說 , 算得上好消息的一點是 , 從2022年開始的英偉達芯片禁令 , 把控方向正變得越來越嚴格 , 且政策還往往易變 。 即便H20芯片解禁 , 從供應鏈穩定和安全的角度考量 , 部分AI廠商也需要這些國產芯片廠商繼續供貨 。

C英偉達的麻煩并未隨著H20的解禁而告一段落 。 相比上半年近千億的損失 , 更令英偉達擔憂的 , 則是大客戶紛紛自研芯片的現狀 。 這一景象已經在美國陸續發生 。
為了降低用云成本 , 微軟、谷歌等美國頭部云廠商開始加速自研服務器芯片和云端AI芯片 。
“如果你能制造出針對AI進行優化的硅 , 那前方等待你的將是巨大的勝利 。 ”研究公司Forrester分析師格倫·奧唐納形容道 。
谷歌曾是最早大規模采購GPU來進行AI計算的公司 , 但后來研發自己的AI專用芯片 , 在2016年就已經發布了第一代TPU(張量處理單元) 。 如今 , 從AI繪圖公司Midjourney , 到AI獨角獸公司Anthropic , 都開始使用起了谷歌的算力 。
亞馬遜也借助2015年收購的以色列芯片初創公司Annapurna Labs , 在2018年前后推出了基于Arm的服務器芯片和AI芯片 , 并開始將自研算力服務器兜售給包括OpenAI、Anthropic等在內的AI大客戶 , 從而擠占英偉達的市場份額 。
就連一貫英偉達強綁定的OpenAI , 也在內部籌劃著自研芯片的事情 。 至少從2022年開始 , OpenAI就已經討論了各種方案 , 希望能解決芯片又貴又短缺的問題 , 自研芯片便是方案之一 。
對需求量大的國內科技大廠而言 , 成本壓力也是華為、阿里、百度、字節、騰訊等自研芯片的原因之一 。 國信證券在一份研報中稱 , 處理器芯片占服務器BOM(物料清單)成本約40% 。
在阿里、百度相繼推出各自的平頭哥和昆侖芯計劃之后 , 2021年3月 , 媒體曝出字節跳動正在自主研發云端AI芯片和Arm服務器芯片 。 字節跳動隨后證實 , 正在組建芯片團隊 。
幾乎在同一時間 , 騰訊也被曝出多個芯片研發崗位的招聘信息 。 官方隨后回應 , 騰訊正在研發的并非通用芯片 , 而是基于一些業務需要 , 在特定領域展開的協處理器研發嘗試 , 比如AI加速和視頻編解碼等 。
類比當前智能手機領域的芯片競爭格局 , 展望未來的AI芯片領域 , 未必不會達成部分復雜場景用英偉達芯片 , 部分簡單場景用自研和國產芯片的混合計算架構局面 。
【英偉達“丟掉”的1000億,國產平替還能繼續賺嗎?】但想要維持上述局面的一大前提是 , 黃仁勛得避免讓英偉達芯片再度迎來出口禁令 。

    推薦閱讀