商湯科技的選擇:擁抱AI國產化,做那個「修塔」的人

商湯科技的選擇:擁抱AI國產化,做那個「修塔」的人

文章圖片

商湯科技的選擇:擁抱AI國產化,做那個「修塔」的人

文章圖片

商湯科技的選擇:擁抱AI國產化,做那個「修塔」的人

文章圖片


12月18日早間 , 商湯科技在港交所發布公告 , 根據一般授權配售新B類股份 。 此次配售不少于六家機構積極認購 , 充分反映市場對商湯科技長期價值的堅定信心 。 公告顯示 , 此輪配售款項較多比例用于持續擴大AIDC“大裝置”的規模和提高國產化比例 。
值得關注的是 , 在本周(12月15日)寒武紀宣布完成對商湯日日新Seko系列多模態模型的適配 , 且是“Day 0”級別的同步支持 。 在寒武紀的官方適配名單中 , 能做到Day 0響應的 , 此前只有兩家:一家是主攻大語言模型的DeepSeek , 另一家就是商湯“日日新”多模態大模型 。
這一細節意味深長 , 亦是中國AI產業迎來了一個看似靜水流深、實則波瀾壯闊的節點 。 如果說適配DeepSeek代表的是國產芯片在文本邏輯處理上的成熟 , 那么商湯“日日新”Seko模型系列的適配 , 則標志著國產算力在高帶寬、高并發的多模態場景中實現了關鍵跨越 。
從客觀技術條件來看 , 這首先是為了抵抗Scaling Law遭遇的供應鏈約束、以及單純依賴堆疊算力的線性增長路徑的失效 。
從商業視角來看 , 這比“國產芯片+國產模型”的技術握手更加深遠 , 因為它預示著AI產業的下半場不再是參數的規模競逐 , 而是要回歸物理現實 。 與此同時 , 原生AI企業正在成為國產芯片成熟化的“加速器” 。
不難發現 , 過去一年的時間里 , 中國AI行業的目光逐漸從云端收回 , 開始審視一個棘手的灰犀牛:AI進化的重心 , 已經悄然下沉到算力層的自主可控 。
然而 , AI的“國產化突圍”不是簡單的硬件替代 , 而是一場意味著“重塑”的系統工程 。 因此 , 在“算力主權時代”的前夜 , 從業者面臨的并非坦途 。
雖然國產芯片力量正如雨后春筍般涌現 , 但中國芯的生機之下 , 卻也伴隨著不可避免的熵增:硬件架構的不統一 , 形成了一座座孤島 , 導致訓練與推理的遷移成本極高 , 形成了一座新的“巴別塔” 。
面對這一現狀 , 商湯科技選擇了一條極具長期主義色彩的路徑:全面擁抱國產化 , 做那個“修塔”的人 。

大裝置 , 國產芯片的“練兵場”中國AI的突圍 , 真的只能死磕納米級的芯片制程工藝嗎?
這是一塊長期盤旋在行業上空的陰云 。 限制擺在眼前 , 我們似乎撞上了一堵墻 , 而商湯這些AI廠商則看到了墻上的另一扇門 。
這家公司給出的答案是:當下比和工藝同樣重要的 , 是生態的“可戰性” 。
而商湯大裝置(SenseCore)在這一戰略中扮演的角色 , 已經超越了傳統的算力中心 , 而是一個巨大的異構調度與適配平臺 。 它更像是一個國產芯片的“練兵場”和“試飛中心” 。

為什么說它是練兵?。 懇蛭揮性諫燙勒庋б誆問?、超大规模并发祼梨实业务场景?, 國產芯片的潛能和優化空間才能被極限激發出來 。
在練兵的同時 , 商湯大裝置又做出了像飛機一樣精密靈活的產品:在原本異構的國產硬件之上 , 商湯抽象出了一層統一的軟件介質 , 實現了跨異構加速卡的統一訓練 , 為上層應用留出了一個標準化的接口 , 開發者可以在不同品牌的芯片之間無縫切換 , 讓端側用戶能夠簡單地獲取高性能、高性價比的國產算力 。
看起來只是“算力服務化” , 其實背后是由一個“多維共生”的算力生態支撐起來的 。
商湯與寒武紀的合作 , 一開始就沒有只停留在硬件采購的維度 , 而是進入了深度耦合的深水區 。 商湯利用自身在大模型研發、基礎設施構建上的經驗 , 反哺芯片設計 , 雙方共同構建了“階梯式產品創新體系” , 實現了真正意義上的軟硬協同 。 相比單一的芯片銷售 , 國產算力目前的一大優勢恰恰在于提供完整的生態服務 。
面對擁有全功能GPU屬性的摩爾線程 , 商湯的合作模式更像是一種互補的“技術共生” 。 摩爾線程提供AI計算能力 , 其在圖形渲染領域的積累 , 恰好滿足商湯在AIGC視頻生成中的復合算力需求 。
面對剛剛登陸科創板的新興算力勢力沐曦 , 商湯也通過在具體業務場景中的適配廣度 , 驗證了新架構芯片在特定高難度任務上的潛力 , 雙方確立了“算力集群+行業拓展”的全方位合作 。 針對沐曦曦云C系列GPU的高性能與生態兼容性 , 雙方打通了從需求到供給的優化閉環:商湯的大裝置為沐曦提供了日日新大模型的豐富場景驗證 , 而沐曦的高性價比算力則有效降低了商湯的建設成本 。
值得注意的是 , 商湯在國內市場首次完成了華為昇騰910C的超節點全面適配 , 不是簡單的單卡跑通 , 而是基于384卡超大規模集群的系統級協同 。 在這樣的規模下 , 芯片間的通信延遲、帶寬瓶頸、穩定性等方面的挑戰 , 也會被指數級放大 。 這是國產GPU首次在千億參數級大模型的訓練與推理中 , 通過了工業級標準的嚴苛考驗 , 成功通過了大模型時代的“高壓測試” 。 這一突破也意味著國產算力和國產架構在以一體化的方式 , 從“可用”走向“好用” 。
商湯用大裝置SenseCore和日日新大模型體系全面適配為國產芯片“練兵”的戰略 , 解決了AI國產化進程中關鍵的應用基礎設施難題 。
至此 , 商湯的“大裝置-大模型-應用”三位一體戰略 , 也越來越具有含金量 。 它在試圖論證一個核心邏輯:國產AI的野心 , 不應止步于降低落地成本 。 在算力主權時代 , 系統級協同能力 , 有能力重塑生產力 。

在創新中 , 驗證效率最優解國產化大裝置適配與協同只是第一步 , 就像路修好了 , 還要想辦法讓車跑得更快 。
對于中國的AI從業者而言 , 國產芯片在短期內與頂尖水準仍存在客觀差距 , 而國產硬件的優勢則在于更好的生態 , 與原生AI企業長期磨合、聯手從工程化走向商業化的長期定力 。
這也是寒武紀與商湯“日日新”Seko系列多模態模型適配的戰略級價值 。 文本模型尚且處于國產算力的淺水區 , 而在視頻生成與多模態交互上想要跑出極致性價比 , 則需要攻克更多挑戰——不僅算力消耗巨大 , 對帶寬和顯存的要求更是苛刻 。
這不只是技術問題 , 也是商業化的“勝負手” 。
商湯展示出來的工程化能力 , 暗示了未來五到十年內的趨勢:在計算方式和架構創新的加持下 , 國產算力集群完全有能力實現效率上的反超 , 為商業化落地找到極具競爭力的成本優勢 。
更具前瞻性的一個案例是 , 商湯與記憶張量合作 , 攻克了“GPGPU架構適配難度遠高于NPU”的行業難題 , 雙方實現了PD(Prefill-Decoding)分離技術的首次大規模商用落地 , 通過將預填充與解碼過程在物理上分離并異構部署 , 如同將一條擁堵的混合車道拆解為兩個高速并行的專用車道 。 結果是驚人的:國產GPU的推理性價比提升了150% 。
離“未來”最近的領域 , 則是視頻生成 。 這既是當下AI競爭的新高地 , 也是一個公認的“算力黑洞” 。 商湯開源了LightX2V推理框架 , 這是行業首個能實現實時視頻生成的框架 , 目前下載量已突破350萬次 。
LightX2V的戰略意義在于它的國產化適配插件模式 , 體現出了可觀的兼容性——不僅支持昇騰910B、海光DCU等主流國產芯片 , 還在設計之初就引入了低比特量化、稀疏注意力等硬件友好機制 , 在幾乎不損失畫質的前提下 , 將推理性能提升了3倍以上 。
這種設計極大地釋放了國產算力的優勢 , 打破了過去“國產算力只能做好文本推理 , 做不了復雜視頻生成”的刻板認知 。 國產芯片同樣可以承載高帶寬、高算力的多模態任務 。
【商湯科技的選擇:擁抱AI國產化,做那個「修塔」的人】如果說推理框架是工具 , 那么模型能力就是試金石 。
在長視頻生成中 , 保持人物、場景的一致性是最大的挑戰之一 。 商湯的Seko系列模型作為行業首個多劇集生成智能體 , 在視頻一致性上的突破 , 依托的正是商湯自研技術底座與國產算力的長期磨合 。
而這一能力的呈現 , 與商湯三位一體的戰略密不可分 。 商湯“全面國產化”的定力 , 為國產大模型的規?;涞?, 尤其是處理高維、動態、復雜數據等高價值密度賽道的任務 , 提供了更多可行性 。
此外 , 這家公司目前正在通過開源生態 , 將復雜的硬件適配工作封裝在底層 。 上層應用開發者不需要關心芯片差異 , 只需要關注應用的效率和效果 。

最后一公里 , 走向“交付級”所有的技術決策 , 最終都要回歸到商業的“最后一公里” 。
如何徹底驗證國產化的“三位一體”具有優越性 , 而不是退而求其次的無奈之舉?終局 , 還是應用落地 。
因此 , 商湯戰略觸角中很重要的一環就是“應用” 。 它們并沒有止步于云端大裝置 , 而是延伸到了端側世界 。 目前 , 商湯的產品矩陣涵蓋了從大裝置到日日新多模態模型、再到端側應用的全棧生態 。
以小浣熊這款AI辦公應用為例 , 不僅完成了國產芯片適配 , 其端側模型精度能夠對標云端 。 “國產算力難以在終端普及”的魔咒被打破 。 AI數字人生成平臺如影 , 也在國產算力底座上實現了高效運行 , 為視頻內容創作提供了自主可控的生產力工具 。

商湯智能辦公助手—辦公小浣熊Raccoon
未來 , 高性能AI會像普惠的水電煤一樣 , 走入尋常百姓家 。
特別是在城市管理、金融、醫療等對數據主權極其敏感的業務上 , 無論是企業還是個人客戶 , 幾乎都面臨著高性能、便捷性、自主可控的不可能三角 。 公有云更便捷 , 但數據安全得不到保障;私有部署更安全 , 但國產硬件適配難度大、性能不穩定 。 商湯提供的全棧國產化私有化部署方案 , 精準地擊中了這一痛點 。
目前 , 商湯已經在這些領域實現了對國產芯片的全面適配與正式交付 。 這也意味著 , 基于國產算力和國產大模型的解決方案 , 已經從技術驗證走向了真正的商業化 。
商湯正在走出一條屬于中國科技企業的長期主義之路 。 將“算力國產化”的宏大敘事轉化為每個人都看得見、用得起的生產力工具 , 需要用實打實的應用層交付量來書寫信心 。 這不僅是中國AI產業走向獨立自主的一張技術信任票 , 也是商湯“三位一體”模式的最后一公里 。

    推薦閱讀