DeepSeek新大招曝光:下一步智能體

【DeepSeek新大招曝光:下一步智能體】DeepSeek新大招曝光:下一步智能體

文章圖片

DeepSeek新大招曝光:下一步智能體

文章圖片

DeepSeek新大招曝光:下一步智能體

文章圖片

DeepSeek新大招曝光:下一步智能體

文章圖片


魚羊 發自 凹非寺
量子位 | 公眾號 QbitAI
DeepSeek下一步 , 被曝劍指智能體 。
知情人士透露 , DeepSeek正在開發具有更強大AI Agent能力的新模型 , 預計在今年年底就會推出 。

△圖片由AI生成
官方尚無回應 , 但這一爆料并非無跡可尋 。
在DeepSeek 8月的最近一次更新中 , DeepSeek-V3.1上線 。 官方發布的升級公告中就提到:
DeepSeek-V3.1具備更強的Agent能力 , 通過Post-Training優化 , 新模型在工具使用與智能體任務中的表現有較大提升 。
邁向Agent時代的第一步

“R2”將造更強智能體?彭博社援引知情人士消息 , 爆料DeepSeek的下一個模型 , 僅需少量提示 , 就能幫用戶執行復雜操作 , 并且還能根據歷史操作自我進化和學習 。
這一模型將在今年最后一個季度面世 。
此前 , 業內普遍推測 , 按照DeepSeek V3和DeepSeek R1的發布節奏 , 在被期待已久的“R2”之前 , DeepSeek應該會先一步推出新一代V系列的基礎模型 。
而從去年12月到今年8月的近9個月時間里 , DeepSeek V系列的版本號只從V3來到了V3.1 。
看上去僅僅是小版本的改進 , 但從DeepSeek官方后來公布的測試結果來看 , 似乎又暗藏玄機 。
DeepSeek-V3.1的主要升級包括3點:
混合推理架構 , 就是把思考模式和非思考模式都集成到了一個模型里 。 更高的思考效率 , 比DeepSeek-R1想得更快 。 更強的Agent能力 , 新模型在工具使用與智能體任務中的表現有較大提升 。具體來看提升效果 。
編程智能體方面 , 在代碼修復測評SWE和命令行終端環境下的復雜任務(Terminal-Bench)測試中 , DeepSeek-V3.1相較V3和R1有明顯提高 。

而在搜索智能體測評中 , 相較于DeepSeek-R1-0528 , DeepSeek-V3.1也展現出了全面的性能提升 。

下一個DeepSeek時刻DeepSeek R1將推理模型推向發展新高潮 , 成了攪動全球大模型行業格局的一尾鯰魚 。
Manus讓智能體的概念火爆出圈 , 被稱為“第二個DeepSeek時刻”——
來到2025年的下半年 , 幾乎沒有大模型產品不談智能體 。 吳恩達也在最新Andrew’s Letters中提到:并行智能體正在成為提升AI能力的新方向 。

早早預定2025年年度熱詞的DeepSeek和智能體一疊加 , 立刻又觸動了人們興奮的神經 。
已經有人開始期待:如果是DeepSeek來做這件事 , 那智能體的價格門檻 , 真的要被打下來了 。

但也有人保持懷疑:這個時候入局智能體 , 還算好時機嗎?

不管怎么說 , 可以確定的是 , 在2025年余下的最后1/3時間里 , 大模型領域的熱鬧依然將每天持續 。
最后的最后 , 小小One More Thing一下 , 信源來自官方 , 妥妥靠譜:

Qwen 3 max也要來了嗎?
歡迎一起 , 見證下一個歷史時刻 。
— 完 —
量子位 QbitAI · 頭條號
關注我們 , 第一時間獲知前沿科技動態簽約

    推薦閱讀