性能大幅領先R1!DeepSeek V3.1免費上線官網和App:回答更快

性能大幅領先R1!DeepSeek V3.1免費上線官網和App:回答更快

文章圖片

性能大幅領先R1!DeepSeek V3.1免費上線官網和App:回答更快

文章圖片

【性能大幅領先R1!DeepSeek V3.1免費上線官網和App:回答更快】性能大幅領先R1!DeepSeek V3.1免費上線官網和App:回答更快

文章圖片

就在剛剛 , 深度求索宣布DeepSeek-V3.1正式發布 。 經查 , 目前新版模型已經默認同步上線官網、App , 面向C端用戶完全免費 。


據介紹 , DeepSeek-V3.1具備128K超長上下文處理能力 , 支持混合推理架構(一個模型同時支持思考模式與非思考模式) 。
此外 , 新版模型擁有更高的思考效率 , 相比R1能在更短時間內給出答案 。
不僅如此 , DeepSeek-V3.1擁有更強的Agent(智能體)能力 , 通過Post-Training(后訓練)優化 , 新模型在工具使用與智能體任務中的表現有較大提升 。


比如 , 在代碼修復測評SWE與命令行終端環境下的復雜任務(Terminal-Bench)測試中 , 以及在需要多步推理的復雜搜索測試(browsecomp)與多學科專家級難題測試(HLE)上 , DeepSeek-V3.1均大幅領先DeepSeek-R1-0528 。
另外 , DeepSeek-V3.1思考效率提升有了巨幅提升 。 經過思維鏈壓縮訓練后 , V3.1-Think在輸出token數減少20%-50%的情況下 , 各項任務的平均表現與R1-0528 持平 。

對于DeepSeek R2發布延遲的原因 , DeepSeek總結稱 , 主要由于采用國產昇騰芯片進行訓練時遇到技術挑戰 , 以及公司對模型質量的高標準要求 。 雖然之前有8月發布的傳聞 , 但已被官方否認 。 目前看來 , 我們可能需要再等待幾周的時間 , 但具體日期還需以官方消息為準 。

    推薦閱讀