剛剛，阿里首個超萬億參數新王登基！Qwen3-Max屠榜全SOTA_deepseek

文章圖片

阿里迄今為止，參數最大的模型誕生了！

昨夜， Qwen3-Max-Preview（Instruct）官宣上線，超1萬億參數性能爆表。

直接用成績說話——

在全球主流權威基準測試中， Qwen3-Max-Preview狂攬非推理模型「C」位，直接碾壓Claude-Opus 4（Non-Thinking）、Kimi-K2、DeepSeek-V3.1 。

甚至，它把自家Qwen3-235B-A22B-Instruct-2507狂甩身后，堪稱「AI卷王本王」。

· 知識推理評測（SuperGPQA）拿下64.6分
· 數學推理評測（AIME25）拿下80.6分，斷崖式領先
· 競爭性編程評測（LiveCodeBench V6）拿下57.5分
· 復雜問題解決和人類偏好對齊評測（Arena-Hard v2）拿下86.1分，優勢巨大
· 被稱為「無法被操控的」評測（LiveBench）拿下79.3分

驚艷的性能表現再次證明了， Scaling仍然有效，參數越大模型性能越強。

總的來說， Qwen3-Max-Preview有以下幾大亮點：性能更強、知識更廣、更擅長對話、任務處理、指令遵循。

新模型可支持100+語言，還針對RAG、工具調用進行優化。

模型一出，全網立即開始了實測。

@karminski-牙醫實測中， Qwen3-Max-Preview前端能力明顯超越DeepSeek-V3.1 。

比如，在一個杯子流體模擬中， Gemini 2.5在傾倒前杯子底部有嚴重bug ， DeepSeek-V3.1杯子中物體倒出的狀態（最后有一條線）不對，而Qwen3-Max-Preview比較符合物理常識。

Qwen3-Max-Preview還能完美生成一個騎自行車的鵜鶘SVG、一鍵直出精美前端網頁，一張照片做出像素花園。

【剛剛，阿里首個超萬億參數新王登基！Qwen3-Max屠榜全SOTA】
目前，模型已正式上線阿里云百煉平臺，可通過API直接調用。同時， Qwen Chat也同步上線新模型，支持免費使用。

在百煉平臺上，最大支持256k上下文，依token數階梯計費：

· 0-32k token：輸入0.006元/千token；輸出0.024元/千token
· 32k-128k token：輸入0.01元/千token；輸出0.04元/千token
· 128k-252k token：輸入0.015元/千token；輸出0.06元/千token

剛剛，阿里首個超萬億參數新王登基！Qwen3-Max屠榜全SOTA

推薦閱讀

621492開頭是什么銀行

如何在線打印廣東省職稱證書

九月英語怎么說

什么是虹吸原理無限循環什么是虹吸原理

如何使用計算器開多次根號

鋼化膜怎么貼鋼化膜如何貼

微信企業聯系人怎么刪除

杯和盞的區別

布達拉宮在哪里布達拉宮位于哪里

互聯網是什么行業待遇互聯網是什么行業

失信被執行人如何買高鐵票

三月份的泰國大概是多少溫度，泰國整年的常溫是幾度啊

全國會計資格評價網查詢成績，怎么查詢以前年度的會計初級職稱考試成績

索尼愛立信st18i rom 索尼愛立信st18i

老公出軌我把第三者打了，我把第三者打得頭破血流

山東高鐵什么時候通車的，山東煙臺龍口高鐵火車什么時候通客運