
文章圖片

文章圖片

文章圖片
機器之心報道
機器之心編輯部
國產開源力量的集中爆發 。
都在說國內大模型正在馳騁開源領域 , 具體的情況如何?
近日 , 隨著新一代大語言模型(LLM)的一波更新 , 開源大模型再次成為了熱門討論話題 。 軟件工程師、自媒體 Rohan Paul 發現了一個驚人的現象:Design Arena 排行榜上排名前十幾位開源 AI 模型全部來自中國 。
Design Arena 是目前全球最大規模的眾包 AI 生成設計 Benchmark 平臺 , 它的核心機制是讓真實的人類用戶進行評測 , 基于 Elo Rating(類似于國際象棋評分體系)等級分制度進行模型對戰 。
【全球開源大模型,前十五名全是中國的】
用戶在平臺上會被隨機展示兩段由不同模型生成的回答 , 然后進行投票選擇「哪一個更好」 。 每一次投票都會影響對應模型的 Elo 分數 , 進而形成動態的排行榜 。 Elo 核心原理是 , 高分選手擊敗低分選手 , 得分會很少 , 而低分選手爆冷戰勝高分選手時 , 得分會很多 。 因此用對弈的角度來看的話 , 這是一個相對公平、符合認知的評分系統 。
因此 , 不同于 MMLU、SWE-Bench 這類客觀指標 , Design Arena 更貼近于「用戶真實體驗」 。 新模型一上線 , 就能迅速通過對戰獲得口碑分數 。
在 Design Arena 上 , 如果把條件設定為「開源」 , 可見現在的前 15 名是清一色的國產開源大模型:
排名第一的是 DeepSeek-R1-0528 , 智譜的 GLM-4.5 和阿里的 Qwen 3 Coder 480B 緊隨其后 。
再往下我們能看到 DeepSeek、Qwen、GLM 的各種型號 , Kimi 在 7 月份開源的 K2 模型…… 一直到第 16 名才是 OpenAI 最近開源的 GPT OSS 120B 。
在前 15 名中 , 各家大模型廠商上榜的模型數量依次如下:
阿里:6 款 DeepSeek:5 款 智譜:3 款 Kimi:1 款
最近一段時間 , 國內 AI 公司不斷發布新一代開源大模型 , 正在開拓 AI 技術的前沿 。 甚至對于國內科技公司來說 , 開源已經成為了最近一兩個月發布的主旋律 。
在 Hugging Face 發布的中國 AI 社區 7 月開放成果中 , 包括阿里、智譜、昆侖萬維、月之暗面、騰訊、階躍星辰等在內的多家廠商先后開源了 33 款大模型 。
此前還有機構 Interconnects(深度聚焦前沿 AI 研究的高質量內容平臺)匯總了國內頂尖的 19 家開源模型實驗室 , 包括 DeepSeek 這樣的頂級機構 , 以及一些通過技術報告和小眾模型嶄露頭角的新興學術實驗室 。
這 19 個開源玩家依次是:DeepSeek、Qwen、Moonshot AI (Kimi)、Zhipu / Z.AI、StepFun、Tencent (Hunyuan)、RedNote (Xiaohongshu)、MiniMax、OpenGVLab / InternLM、Skywork、ByteDance Seed、OpenBMB、Xiaomi (MiMo)、Baidu (ERNIE)、Multimodal Art Projection、Alibaba International Digital Commerce Group、BAAI 以及 inclusionAI、Pangu (Huawei) 。
在大模型領域里 , 技術和性能領先的一直是以 GPT 系列為代表的閉源大模型 。 但隨著 Llama 系列興起 , 越來越多的開源模型逐漸成為了推動技術向前進步的重要動力 。 近一年多時間里 , 國產大模型集群式的崛起 , 則重塑了全球 AI 版圖 。
現在說起開源的大模型 , 大多數人的第一反應早已不是 Llama , 而是 Qwen 和 DeepSeek 。 有人認為 , 正是 DeepSeek 等開源大模型能夠與閉源頂尖模型分庭抗禮 , 才讓眾多應用端公司得以轉變工作重點 , 把精力放在模型調優和應用優化的工作上來 , 進而加速了 AI 技術的落地 。
或許這樣的趨勢也會扭轉 AI 研究社區的趨勢 , 讓未來最先進模型的開源成為必選項 。
最后 , 在外網也有人在為中國的 AI 模型崛起尋找深層原因 。 這位 Illya Gerasymchuk 是數學專業的碩士 , 他認為原因在于數學基礎 —— 目前東亞人在數學領域上已經占據了主導地位 。
這是否和我們一直以來的印象已經有些不一樣了?
參考鏈接:
https://www.designarena.ai/
https://x.com/rohanpaul_ai/status/1959710355208499692
https://x.com/interconnectsai/status/1957105950201950715
推薦閱讀
- 剛剛,馬斯克開源Grok 2.5:中國公司才是xAI最大對手
- 2nm芯片價格出爐:太貴了,全球沒幾家企業,用得起了
- 三個月、零基礎手搓一塊TPU,能推理能訓練,還是開源的
- 北京大學打造TransMLA:讓大模型推理速度飛躍10倍的神奇轉換器
- 形勢嚴峻,全球AI算力對比,美國占69%,中國僅15%,差距巨大?
- 比GPT-5還準?AIME25飆到99.9%刷屏,開源模型首次!
- 華為全球發布會定檔,多領域新品登場
- 全球首個百兆瓦級重卡超充站發布:華為方案 5分鐘補能百公里!
- 華為開源CANN,要跨過英偉達又一條護城河?
- “A計劃”發布!智元機器人董事長鄧泰華:全球正處于具身智能大爆發前夜
