馬斯克開始瘋狂劇透Grok 5了

馬斯克開始瘋狂劇透Grok 5了

文章圖片

馬斯克開始瘋狂劇透Grok 5了

文章圖片

馬斯克開始瘋狂劇透Grok 5了

文章圖片

馬斯克開始瘋狂劇透Grok 5了

文章圖片

馬斯克開始瘋狂劇透Grok 5了

文章圖片

馬斯克開始瘋狂劇透Grok 5了

文章圖片

馬斯克開始瘋狂劇透Grok 5了

鷺羽 發自 凹非寺
量子位 | 公眾號 QbitAI
馬斯克的Grok 5偷偷藏不住了 。

剛剛ARC-AGI榜單官宣出現新SOTA , 用的還是Grok 4+程序合成技術微調 。
好小汁 , 啥時候開始Grok都彎道超車了?OpenAI、Anthropic、谷歌一眾明星模型都被壓一頭 。

一石激起千層浪 , 網友紛紛發問 , 那等Grok5出來 , 豈不是……

馬斯克也隨即出來回應:
我現在認為Grok 5能達到AGI 。

順便附贈了一堆有關Grok 5的爆料 。
馬斯克瘋狂劇透Grok 5這事還得從Grok 4超越預期的表現說起 , 發布才兩個月就登上多個榜單第一的寶座 , 而就在剛剛 , ARC Prize發布了兩個最新的ARC-AGI榜單SOTA方案:
都是開源的 。 都使用的是Grok 4作為基礎模型 。 都實現了帶測試自適應的程序合成外循環 。
先簡單介紹一下ARC-AGI排行榜 , 其旨在評估AI解決復雜難題的能力 , 類似于人類的智力測試 , 從而反映LLM的推理能力 。
測試任務包含v1和v2版本 , v2需要LLM完成更多的多步驟推理 , 一般來說 , 即使是最優秀的LLM也只能在v2中獲得16%的準確率 。

GPT-5在二者上的得分依次是65.7%和9.9% , Claude Opus 4的得分是35.7%和8.6% , 而Grok 4則是66.7%和16% 。
Jeremy Berman的新方案則是在Grok 4基礎上 , 用英語替代了傳統的Python , 最終得分來到79.6%和29.44% 。
Eric Pang則在Jeremy的工作上 , 設計了一個受DreamCoder啟發、LLM輔助的程序合成系統 , 能夠通過從不斷擴展的程序庫中學習來解決越來越難的任務 。

雖然得分沒有進一步升高(77.1%和26%) , 但是成功讓每個任務的平均費用得以下降(v1:8.42美元→2.56美元;v2:30.4美元→3.97美元) 。
當問及兩位作者選擇Grok 4的理由 , 他們均表示 , 這是他們測試下來效果最好的模型 。
當中所體現出的AGI潛力 , 也讓馬斯克感到自豪 , 隨即透露了一系列有關Grok 5的消息 。
老馬表示 , 這才只是Grok 4 , 而Grok 5將很有可能達成AGI 。

而這個可能性也許能達到10%或者更高 , 要知道他此前并不認為Grok版本會出現AGI 。

與此同時 , 他表示Grok 5將會在幾周之內開始訓練 。

加上此前他曾表示Grok 5將在今年年底前推出 , 或許我們將在不久后見證新的“LLM怪物”誕生 。
所以為什么老馬能對Grok 5抱以如此強烈的信心呢?
訓練數據及硬件資源的投入歸根結底 , 是馬斯克在Grok訓練中投入之深 。
據悉 , Grok 5將擁有較之前代更多的訓練數據 。
Grok 4的訓練量是Grok 2的100倍、Grok 3的10倍 , 而Grok 5則只會更多 。

馬斯克擁有一整套的最新真實數據收集體系 , 其中xAI可以為其提供最新的直接數據 , 特斯拉可以定期利用FSD和攝像頭捕獲圖像從而生成數據 , 而擎天柱機器人也能從現實世界中生成大量數據 。
可以說 , 馬斯克在當下數據為王的時代 , 最不缺的就是數據 。
此外 , xAI在硬件資源上也投入頗多 , 目標在5年內完成相當于5000萬臺H100 GPU同等算力的部署 。
其專門為Grok系列打造的超級計算集群Colossus , 已經部署了約23萬張GPU 。 其中包括3萬張NVIDIA GB200(基于Nvidia的Blackwell架構) , 將會持續為Grok提供強大的算力支持 。

不過Grok 5究竟能否真正實現AGI , 網友們對此也提出了質疑:畢竟要成為AGI靠的可不僅僅是數據和馬斯克的聲明 , 一切還得看成品 。

所以究竟誰才是能吃到第一只AGI螃蟹的AI公司 , 且讓我們拭目以待 。
參考鏈接:[1
https://x.com/elonmusk/status/1968196086193066365 [2
https://jeremyberman.substack.com/p/how-i-got-the-highest-score-on-arc-agi-again[3
https://ctpang.substack.com/p/e760eba7-c8b3-4fda-b631-61b89dd0d0fd[4
https://www.tomshardware.com/tech-industry/artificial-intelligence/elon-musk-says-xai-is-targeting-50-million-h100-equivalent-ai-gpus-in-five-years-230k-gpus-including-30k-gb200s-already-reportedly-operational-for-training-grok
— 完 —
量子位 QbitAI
【馬斯克開始瘋狂劇透Grok 5了】關注我們 , 第一時間獲知前沿科技動態

    推薦閱讀