阿里發布三款中型千問3.5新模型,每百萬Token低至0.2元

阿里發布三款中型千問3.5新模型,每百萬Token低至0.2元

2月25日 , 繼除夕開源Qwen3.5-397B-A17B之后 , 阿里繼續開源千問3.5系列模型 。 本次開源三款中等規模的新模型 , 包括Qwen3.5-35B-A3B、Qwen3.5-122B-A10B、Qwen3.5-27B 。 基于架構創新和訓練突破 , 此次開源的三款千問3.5模型均創下中等尺寸模型的性能新高 , 超越了更大尺寸的上代旗艦模型Qwen3-235B-A22B和Qwen3-VL , 多榜單表現均明顯優于GPT-5 mini 。 千問3.5新模型甚至可直接部署于消費級顯卡 , 對開發者極為友好 。 目前 , 基于Qwen3.5-35B-A3B的托管模型Qwen3.5-Flash已上線阿里云百煉 , 每百萬Token輸入低至0.2元 。

千問3.5模型采用混合注意力機制 , 結合高稀疏的MoE架構創新 , 并基于更大規模的文本和視覺混合Token上訓練 , 新模型以更小的總參數和激活參數量 , 實現了更大的性能提升:Qwen3.5-122B-A10B與Qwen3.5-35B-A3B , 就是這一新范式在中等規模下的最新模型成果 , 在指令遵循(IFBench)、博士級別推理(GPQA)、數學推理(HMMT 25)、多語言知識(MMMLU)、Agent工具調用(BFCL v4)、Agentic Coding(SWE-bench Verified)等多個權威榜單上 , 新模型均超越了遠大于其規模的Qwen3-235B-A22B模型及Qwen3-VL , 以及GPT-5 mini、gpt-oss-120b等模型 。

更緊湊的模型 , 更好的性能 , 千問3.5家族中的首個密集(Dense)模型Qwen3.5-27B此次驚艷亮相 。 Qwen3.5-27B同時擁有更強的Agent能力和原生多模態能力 , 在工具調用、搜索、編程等多個Agent評測中均超過了GPT-5 mini , 在視覺推理、文本識別和理解、視頻推理等多項視覺理解能力榜單中超過了Qwen3-VL旗艦模型和Claude Sonnet 4.5 。 Qwen3.5-27B可運行于單個GPU , 對于本地部署極為友好 。

此前 , 基于Qwen3.5-397B-A17B的Qwen3.5-Plus模型已上線阿里云百煉 , 性能媲美Gemini 3但API價格僅為其5% , 適用于高性能的AI編程、Agent等場景 。 此次 , 百煉上線基于Qwen3.5-35B-A3B的Qwen3.5-Flash , 支持1M 的上下文長度 , 提供官方的內置工具調用 , 企業和開發者每百萬Token輸入成本低至0.2元 。 Qwen3.5-Flash響應速度快、性價比高、門檻低 , 適合處理工作、生產、生活的日常AI任務 。

【阿里發布三款中型千問3.5新模型,每百萬Token低至0.2元】此外 , Qwen3.5-35B-A3B的基座(Base)模型也一并開源 。 千問3.5的系列開源引發全球AI開源社區熱議 , 有開發者指出 , 這將加速機器人產業的VLA模型發展 , 或將衍生出一批基于Qwen3.5的多模態模型 。 據了解 , 除夕開源的Qwen3.5-397B-A17B 模型已登頂Hugging Face全球榜首 , 截至目前 , 阿里已開源千問模型超400個 , 全球下載量突破10億次 , 衍生模型數超20萬 , 千問穩居全球第一開源模型 。

    推薦閱讀