月之暗面放王炸!開源Kimi新模型:超新版DeepSeek R1全球第一

月之暗面放王炸!開源Kimi新模型:超新版DeepSeek R1全球第一

文章圖片

月之暗面放王炸!開源Kimi新模型:超新版DeepSeek R1全球第一

快科技6月17日消息 , 月之暗面推出了針對軟件工程任務的全新開源代碼大模型——Kimi-Dev-72B 。
該模型在SWE-bench Verified編程基準測試中取得了全球最高開源模型水平 , 以僅72B的參數量 , 超越了剛發布不就、參數量達671B的新版DeepSeek-R1 。
該模型通過大規模強化學習進行優化 , 能夠自主修補Docker中的真實存儲庫 , 并且只有當整個測試套件通過時才會獲得獎勵 , 從而確保了解決方案的正確性和穩健性 。
Kimi-Dev-72B的設計理念和技術細節包括BugFixer和TestWriter的組合、中期訓練、強化學習和測試時自我博弈 。
其中 , BugFixer和TestWriter的互補設計奠定了模型的基礎 , 使其在修復錯誤和編寫測試方面表現出色 。
中期訓練則通過約1500億個高質量的真實數據 , 增強了模型對實際Bug修復和單元測試的理解 。
強化學習階段則專注于提升其代碼編輯能力 , 使其在文件本地化和代碼編輯方面表現出色 。
【月之暗面放王炸!開源Kimi新模型:超新版DeepSeek R1全球第一】目前 , Kimi-Dev-72B已在Hugging Face和GitHub上提供下載和部署 , 包括模型權重、源代碼等 。

    推薦閱讀