消費級顯卡可跑!剛剛,阿里Qwen3.5又開源3款新模型

消費級顯卡可跑!剛剛,阿里Qwen3.5又開源3款新模型

文章圖片

消費級顯卡可跑!剛剛,阿里Qwen3.5又開源3款新模型


機器之心編輯部

剛過完年 , 阿里又卷起來了 。

2 月 25 日 , 繼除夕開源 Qwen3.5-397B-A17B 之后 , 阿里繼續開源千問 3.5 系列模型 , 而且是一口氣開源三款中等規模的新模型 , 分別是 Qwen3.5-35B-A3B、Qwen3.5-122B-A10B、Qwen3.5-27B 。



此次開源的三款千問 3.5 模型 , 憑借架構創新和訓練突破 , 均創下中等尺寸模型的性能新高 , 不僅超越了更大尺寸的上代旗艦模型 Qwen3-235B-A22B 和 Qwen3-VL , 更在多榜單表現上均明顯優于 GPT-5 mini 。

千問 3.5 新模型甚至可直接部署于消費級顯卡 , 對開發者極為友好 。 目前 , 基于 Qwen3.5-35B-A3B 的托管模型 Qwen3.5-Flash 已上線阿里云百煉 , 每百萬 Token 輸入低至 0.2 元 。

更小的參數 , 更強的性能

千問 3.5 模型采用混合注意力機制 , 結合高稀疏的 MoE 架構創新 , 并基于更大規模的文本和視覺混合 Token 上訓練 , 新模型以更小的總參數和激活參數量 , 實現了更大的性能提升 。

Qwen3.5-122B-A10B 與 Qwen3.5-35B-A3B , 就是這一新范式在中等規模下的最新模型成果 , 在指令遵循(IFBench)、博士級別推理(GPQA)、數學推理(HMMT 25)、多語言知識(MMMLU)、Agent 工具調用(BFCL v4)、Agentic Coding(SWE-bench Verified)等多個權威榜單上 , 新模型均超越了遠大于其規模的 Qwen3-235B-A22B 模型及 Qwen3-VL , 以及 GPT-5 mini、gpt-oss-120b 等模型 。



更緊湊的模型 , 更好的性能 , 千問 3.5 家族中的首個密集(Dense)模型 Qwen3.5-27B 此次驚艷亮相 。

Qwen3.5-27B 同時擁有更強的 Agent 能力和原生多模態能力 , 在工具調用、搜索、編程等多個 Agent 評測中均超過了 GPT-5 mini , 在視覺推理、文本識別和理解、視頻推理等多項視覺理解能力榜單中超過了 Qwen3-VL 旗艦模型和 Claude Sonnet 4.5 。

Qwen3.5-27B 可運行于單個 GPU , 對于本地部署極為友好 。
阿里開源再次引爆AI社區

此前 , 基于 Qwen3.5-397B-A17B 的 Qwen3.5-Plus 模型已上線阿里云百煉 , 性能媲美 Gemini 3 但 API 價格僅為其 5% , 適用于高性能的 AI 編程、Agent 等場景 。

此次 , 百煉上線基于 Qwen3.5-35B-A3B 的 Qwen3.5-Flash , 支持 1M 的上下文長度 , 提供官方的內置工具調用 , 企業和開發者每百萬 Token 輸入成本低至 0.2 元 。 Qwen3.5-Flash 響應速度快、性價比高、門檻低 , 適合處理工作、生產、生活的日常 AI 任務 。

此外 , Qwen3.5-35B-A3B 的基座(Base)模型也一并開源 。

千問 3.5 的系列開源引發全球 AI 開源社區熱議 , 有開發者指出 , 這將加速機器人產業的 VLA 模型發展 , 或將衍生出一批基于 Qwen3.5 的多模態模型 。

【消費級顯卡可跑!剛剛,阿里Qwen3.5又開源3款新模型】據了解 , 除夕開源的 Qwen3.5-397B-A17B 模型已登頂 Hugging Face 全球榜首 , 截至目前 , 阿里已開源千問模型超 400 個 , 全球下載量突破 10 億次 , 衍生模型數超 20 萬 , 千問穩居全球第一開源模型 。

    推薦閱讀