DeepSeek新模型MODEL1曝光


【TechWeb】1月21日消息 , DeepSeek的下一代旗艦模型疑似提前曝光 。 在其官方GitHub代碼庫的更新中 , 一個名為“MODEL1”的新模型名稱在多個技術文件中頻繁出現 , 引發了人工智能社區的廣泛關注 。
根據對代碼庫的深入挖掘 , “MODEL1”的蹤跡橫跨了114個文件 , 共計被提及28次 。 尤為關鍵的是 , 它在代碼邏輯中與當前已發布的“V32”(即DeepSeek-V3.2模型)并列出現 , 表明它并非現有模型的簡單迭代 , 而極有可能是一個獨立的新模型序列 。
技術分析顯示 , MODEL1與V3.2在底層架構上存在顯著差異 。 代碼對比指出 , 二者在KV(鍵值)緩存布局、稀疏性處理方式以及FP8精度解碼等核心模塊上采用了不同的實現方案 。 特別是在內存優化方面 , MODEL1顯示出多處針對性改進 , 這通常意味著它在處理效率或支持更長上下文方面可能有新的設計目標 。
此前有消息稱DeepSeek計劃在2026年春節前后發布其下一代重量級模型 。 因為 , 不少行業分析人士認為 , 此次MODEL1在開源代碼中意外現身 , 就如同之前DeepSeek發布的優化殘差鏈接“mHC”和AI記憶模塊“Engram”兩篇論文中提到的新技術一樣 , 很可能正是為這次發布進行的技術準備 。
【DeepSeek新模型MODEL1曝光】目前 , DeepSeek官方尚未對此事發表任何公開評論 。 所有信息均來源于對公開代碼的非官方分析 , 模型的具體技術細節、性能指標及正式名稱仍需等待官方的最終揭曉 。

    推薦閱讀