
文章圖片
【真夠卷的!DeepSeek更完智譜更:GLM-4.6,代碼國內最強】
文章圖片

文章圖片

文章圖片

文章圖片

文章圖片
金磊 發自 凹非寺
量子位 | 公眾號 QbitAI
好好好 , 都趕著國慶節之前開卷是吧 。
前腳DeepSeek更新到了V3.2 , 現在智譜又更新了——
正式推出GLM-4.6 , 代碼能力直接推到了國內最強 。
根據智譜的測試結果 , 他們在Claude Code環境下進行了74個真實場景編程任務測試:GLM-4.6實測超過Claude Sonnet 4 , 超越其他國產模型 。
類似的結果還出現在了其它測評中 。
例如在通用能力評測上 , GLM-4.6在AIME 25、GPQA、LCB v6、HLE、SWE-Bench Verified、BrowseComp、Terminal-Bench、τ^2-Bench、GPQA , 這八大榜單中大部分都已經對齊了Claude Sonnet 4 , 國內第一 。
分數高還只是一方面 , 智譜的GLM-4.6甚至還把“平均token消耗”給打了下來——比GLM-4.5節省30%以上 , 為同類模型最低 。
而且智譜這次還大大方方地把全部測試題目與Agent軌跡亮了出來 , 方便大家復現驗證:
https://huggingface.co/datasets/zai-org/CC-Bench-trajectories
有一說一 , 卷 , 是真的卷 。
實測GLM-4.6根據量子位的老傳統 , 新模型一出 , 那必須是得安排一波實測 。
我們先小試牛刀地來一道題:
生成一個射擊類的小游戲 。
從實測體驗來看 , 代碼生成的速度是相當之快 , 不到一分鐘 , 游戲就被設計出來了 。
進階一下 , 我們再讓GLM-4.6再做一個交互動畫:
用p5js創建多彩的可交互動畫 。
可以看到 , 鼠標點到哪里就會產生交互效果 。
編程這塊 , 我們最后來測一道經典的題目:
顯示球在旋轉的六邊形內彈跳 。 球應該受到重力和摩擦力的影響 , 并且必須逼真地從旋轉的墻壁上反彈 。
嗯 , 小球是按照物理規律在運轉 。
在編程能力之后 , 我們再來測試一下GLM-4.6的數學能力 。
請聽一道AIME 2025的試題:
在這次測試中 , 我們是直接把題目截圖“喂”給了GLM-4.6 , 不僅考察了解數學題的能力 , 同時還檢測了一下它識圖的多模態能力 。
可以看到 , GLM-4.6完美地給出了正解:70 。
整體來看 , 智譜這次新模型能力提升可以概括如下:
高級編碼能力:在公開基準與真實編程任務中 , GLM-4.6的代碼能力對齊Claude Sonnet 4 , 是國內已知的最好的Coding模型 。 上下文長度:上下文窗口由128K→200K , 適應更長的代碼和智能體任務 。 推理能力:推理能力提升 , 并支持在推理過程中調用工具 。 搜索能力:增強了模型在工具調用和搜索智能體上的表現 , 在智能體框架中表現更好 。 寫作能力:在文風、可讀性與角色扮演場景中更符合人類偏好 。 寒武紀、摩爾線程都跟進了昨晚DeepSeek更新的時候 , 一個新現象伴隨著誕生——
很多國產芯片公司立即宣布“Day0適配” 。
這一現象在GLM-4.6身上也是發生了 。
據了解 , GLM-4.6 已經在寒武紀的國產芯片上實現了FP8+Int4的混合量化部署 , 這是國產芯片上第一次真正落地的FP8+Int4模型芯片一體化方案 。
在保證精度不受影響的同時 , 還大幅降低了推理成本 , 也為國產芯片本地運行大模型提供了一條可行的新路徑 。
在vLLM推理框架的支持下 , 摩爾線程新一代GPU能夠用原生FP8精度穩定運行GLM-4.6 , 這充分體現了MUSA架構和全功能GPU在生態兼容性和快速適配上的優勢 。
接下來 , GLM-4.6將與寒武紀、摩爾線程的國產芯片組合 , 通過智譜MaaS平臺正式對企業和大眾開放服務 。
最后 , 劃個重點 。
智譜在能力提升的同時 , 還把價格給打下來了!
智譜同步升級的GLM Coding Plan(最低20元包月暢玩套餐):用1/7的價格 , 可以享受到Claude的9/10智商 。
GLM-4.6體驗地址:chat.z.ai
智譜MaaS平臺:bigmodel.cn
— 完 —
量子位 QbitAI · 頭條號
關注我們 , 第一時間獲知前沿科技動態
推薦閱讀
- 4499元的iPhone新機確定,買嗎?
- 可以“閉眼買”的紅米手機!6200mAh+IP68防水,現已跌至1193元
- 7500mAh+雙屏顯示+驍龍8Elite Gen5,這可能是今年最爽的手機
- 你的手機,正在成為電影機
- “小黑”突然變“小白”,ThinkPad的AI野心藏不住了
- 中小企業辦公的破局之道,華為坤靈如何賦能數智化新未來?
- 驍龍賦能終端!旗艦體驗背后的科技力量
- ??深度思考:iPhone 17四機連發,也治不好蘋果的“創新內耗”??
- 目前“最值得撿漏”的華為手機,16G+512G降價4600元,價格大跳水
- intel+AMD不再獨大,國產CPU,已拿下了25%的市場
