DeepSeek V3.2雙版本齊發:推理比肩GPT-5,Speciale版奪國際奧賽金牌

DeepSeek V3.2雙版本齊發:推理比肩GPT-5,Speciale版奪國際奧賽金牌

文章圖片

DeepSeek V3.2雙版本齊發:推理比肩GPT-5,Speciale版奪國際奧賽金牌

太平洋科技快訊】12 月 2 日消息 , 深度求索公司昨日發布 DeepSeek V3.2 正式版 。 此次發布包含兩個版本:適用于日常場景的 DeepSeek-V3.2 , 以及目標將開源模型推理能力推向極致的長思考增強版 DeepSeek-V3.2-Speciale 。 官方網頁端、 App 及 API 均已更新為 V3.2 正式版 , 而 Speciale 版本目前僅通過臨時 API 開放 , 供社區評測與研究 。
【DeepSeek V3.2雙版本齊發:推理比肩GPT-5,Speciale版奪國際奧賽金牌】DeepSeek V3.2 旨在平衡推理能力與輸出長度 , 適合日常使用 , 如問答及通用 Agent 任務場景 。 在公開推理基準測試中 , 其性能達到 GPT-5 水平 , 略低于 Gemini-3.0-Pro 。 相比同類長思考模型 , V3.2 大幅降低了輸出長度與計算開銷 。
表1:DeepSeek-V3.2 與其他模型在各類數學、代碼與通用領域評測集上的得分(括號內為消耗 Tokens 總量約數)DeepSeek V3.2 是該公司推出的首個將思考融入工具使用的模型 , 并同時支持思考模式與非思考模式的工具調用 , 通過大規模 Agent 訓練數據合成分發 , 顯著提升模型的泛化能力 , 在相關評測中達到開源模型最高水準 。
表2:DeepSeek-V3.2 與其他模型在各類智能體工具調用評測集上的得分DeepSeek-V3.2-Speciale 集成了長思考與 DeepSeek-Math-V2 的定理證明能力 , 專注于探索模型推理邊界 。 它在 IMO 2025、CMO 2025、ICPC World Finals 2025 及 IOI 2025 等頂級國際競賽中均斬獲金牌 , 其中 ICPC 成績相當于人類選手第二名 。 該版本在高度復雜任務上表現大幅優于標準版 , 但計算成本更高 。 目前僅用于研究 , 不支持工具調用 , 也未針對日常對話優化 。
V3.2 的思考模式新增對 Claude Code 的支持 , 用戶可通過更改模型名或快捷鍵開啟 。 但該模式尚未充分適配 Cline、RooCode 等非標準工具調用組件 , 官方建議在此類場景下使用非思考模式 。

    推薦閱讀