谷歌AI破解外星人難題!打破十年紀錄,自己寫算法震撼諾獎得主

谷歌AI破解外星人難題!打破十年紀錄,自己寫算法震撼諾獎得主

文章圖片

谷歌AI破解外星人難題!打破十年紀錄,自己寫算法震撼諾獎得主

文章圖片

谷歌AI破解外星人難題!打破十年紀錄,自己寫算法震撼諾獎得主

文章圖片

谷歌AI破解外星人難題!打破十年紀錄,自己寫算法震撼諾獎得主

文章圖片

谷歌AI破解外星人難題!打破十年紀錄,自己寫算法震撼諾獎得主

文章圖片

谷歌AI破解外星人難題!打破十年紀錄,自己寫算法震撼諾獎得主

文章圖片

谷歌AI破解外星人難題!打破十年紀錄,自己寫算法震撼諾獎得主

文章圖片

谷歌AI破解外星人難題!打破十年紀錄,自己寫算法震撼諾獎得主

文章圖片

谷歌AI破解外星人難題!打破十年紀錄,自己寫算法震撼諾獎得主

文章圖片

谷歌AI破解外星人難題!打破十年紀錄,自己寫算法震撼諾獎得主

文章圖片

谷歌AI破解外星人難題!打破十年紀錄,自己寫算法震撼諾獎得主

文章圖片

谷歌AI破解外星人難題!打破十年紀錄,自己寫算法震撼諾獎得主

文章圖片

谷歌AI破解外星人難題!打破十年紀錄,自己寫算法震撼諾獎得主

文章圖片

谷歌AI破解外星人難題!打破十年紀錄,自己寫算法震撼諾獎得主

文章圖片

谷歌AI破解外星人難題!打破十年紀錄,自己寫算法震撼諾獎得主

文章圖片

谷歌AI破解外星人難題!打破十年紀錄,自己寫算法震撼諾獎得主
編輯:好困 Aeneas
【新智元導讀】谷歌DeepMind又放大招了:AlphaEvolve自主寫算法 , 一口氣改寫5個經典拉姆齊數下界 , 打破了塵封十年的數學紀錄!諾獎得主Hassabis和圖靈獎得主LeCun都紛紛點贊——AI , 正在徹底改變數學突破的方式!


就在剛剛 , 谷歌DeepMind又出神功了 。
他們開發的系統AlphaEvolve , 在極值組合學問題上取得突破 , 一次性改進了五個經典拉姆齊數的下界!

論文地址:https://arxiv.org/pdf/2603.09172
更令人驚訝的是 , 這并不是通過人工設計五套不同算法實現 , 而是通過一個統一的「元算法」(meta-algorithm)來完成的 。

推導這些搜索算法的難度極大 , 最佳結果至少是十年前了 。 而這次 , DeepMind讓大模型自主寫算法 , 直接踏平了塵封十年的數學記錄!

DeepMind研究者報喜后 , CEO Hassabis也火速轉發慶賀 。 他表示 , AlphaEvolve的這項成果 , 是AI在數學領域的又一個重大里程碑!

連圖靈獎得主LeCun , 都主動祝賀了團隊 。

拉姆齊數問題究竟難到了什么程度?可以說 , 它讓最偉大的數學家 , 都感到絕望 。
著名數學家、陶哲軒的導師保羅·埃爾德什(Paul Erd?s)曾說 , 如果外星人威脅地球:必須在規定時間內算出R(55)這個拉姆齊數 , 否則就毀滅人類 , 那么人類最理性的選擇 , 可能就是投降 。

幾十年來 , 拉姆齊數一直是組合數學中最頑固的難題之一 。 數學家想要在某一個具體的拉姆齊數上取得進展 , 通常都必須從零設計一套專門的搜索算法 。
但現在 , AlphaEvolve把五個全破了!

而這 , 還只是AlphaEvolve能力的冰山一角 。
此前 , 它就已經打破了塵封56年的矩陣乘法紀錄 , 優化了谷歌數據中心調度 , 并在AI芯片設計中發現了人類工程師未曾注意到的結構簡化方案 。
當一個能夠自動發現算法的系統 , 同時還能優化訓練自己的計算基礎設施時 , 我們毫無疑問正在見證一個全新物種的誕生 。




外星人來了都算不出的數


大約一百年前 , 英國邏輯學家弗蘭克·拉姆齊證明了這樣一個結論 。
在一個六人小組中 , 無論這六個人之間的關系如何 , 總能找到三個互相認識的人 , 或者三個互不認識的人 。
這個簡單直觀的例子是拉姆齊理論的最早原型 。

在圖論中 , R(rs)定義為最小整數n , 使得任何包含n個頂點的無向圖必然滿足以下至少一種情況:

  • 存在r個頂點的完全子圖(clique)
  • 或存在s個頂點的獨立集(independent set)
比如 , R(33) = 6 。
這樣就意味著 , 任意6個頂點的圖 , 必然包含一個三角形 , 或三個互不相連的點 。

現在 , 對于一些小規模參數 , 比如(3s) s ≤ 9 , (4s) s = 45 , 這些拉姆齊數已經被精確求出 。
但對于大量參數 , 仍然存在巨大的上下界差距 。
如何得到下界呢?
如果我們能構造一個圖 , 頂點數為n , 不包含r-clique , 不包含s-independent set , 那么就說明:R(rs) ≥ n + 1 。


五個十年紀錄 , 一次踏平


而這次 , DeepMind三名研究發出論文 , 宣布用AlphaEvolve一次性刷新了5個經典拉姆齊數的下界 。
  • R(313):60 → 61(此前紀錄保持11年)
  • R(318):99 → 100(此前紀錄保持整整20年)
  • R(413):138 → 139(此前紀錄保持11年)
  • R(414):147 → 148(此前紀錄保持11年)
  • R(415):158 → 159(此前紀錄保持6年)

雖然 , 每個數字只往上推了1 , 但在拉姆齊數這個領域 , 推1比很多數學領域推一個量級還難 。
更關鍵的是 , 這5個突破全部來自同一個系統 。
除了這5個新紀錄 , 它還匹配了所有已知精確值的拉姆齊數下界 , 以及大量其他值的當前最佳下界 , 總共覆蓋28個R(rs) 。




AlphaEvolve
不算題 , 算算法


那AlphaEvolve是怎么做到的?
簡單說 , 它是一個用大語言模型來進化代碼的智能體 。 它搜索的對象 , 是搜索算法本身 。
這是理解這項工作最關鍵的一點 。

傳統路徑是:
人類專家根據數學直覺和領域知識 , 手工設計一套搜索算法(比如模擬退火、禁忌搜索) , 然后讓計算機去跑 。 算法好不好 , 全看人的功力 。
AlphaEvolve把這一步自動化了 。 它的工作流程是這樣的:
第一步 , 維護一個「算法種群」 。
一開始只有一個最簡單的基線程序(甚至只是返回一個空圖) 。
第二步 , 用LLM變異代碼 。
從種群中選出一個表現好的算法 , 讓大語言模型(Gemini)對代碼進行「變異」——修改搜索策略、改初始化方式、加新的啟發式規則 。
第三步 , 執行和評分 。
運行變異后的程序 , 看它能造出多大的合法圖 。 如果圖的大小超過了當前最佳紀錄 , 給高分;如果圖接近合法(違規次數很少) , 也給一定獎勵——這是為了引導搜索向邊界推進 。
第四步 , 進化迭代 。
把高分算法放回種群 , 繼續選擇、變異、評估 。 循環往復 。
這就是所謂的「元搜索」(meta-search)——在算法空間里搜索 , 而非圖空間 。
換句話說 , AlphaEvolve最終產出的也不是一個圖 , 而是一段能找到好圖的代碼 。


AI發明的四大算法家族


論文中展示了AlphaEvolve為28個R(rs)值發現的具體搜索算法 。 這些算法風格差異極大 , 但可以歸為四大家族 。
第一類:隨機起步 , 暴力退火
最樸素的路徑 。 從隨機圖出發 , 用模擬退火逐步消除違規結構(三角形或過大的獨立集) 。
R(35)、R(37)等較小的值用的就是這類方法 。
簡單 , 但對于大規模問題不夠用 。


第二類:代數結構播種
用Paley圖、二次剩余圖、三次剩余圖等有深厚數學背景的代數圖作為起點 , 再做局部優化 。
這些圖本身就具有接近拉姆齊約束的良好性質 , 相當于給搜索一個「高起點」 。
R(413)的突破就屬于這一類——從有限域F???上的三次剩余Cayley圖出發 。
第三類:循環圖 + 無和集引導
從循環圖(Circulant Graph)出發 , 利用無和集(sum-free set)的代數性質天然保證無三角形 , 再做增量擴展 。
R(313)和R(318)這兩個突破屬于這一類 。 這也是產出新紀錄最多的一個家族 。


第四類:混合/分形/譜方法
最復雜的一類 , 融合了分形自相似構造、譜性質分析、多種啟發式的并行執行等 。
R(311)的算法就用了分形初始化+自適應能量場+動態溫度調節的組合 。
有意思的是 , 每種算法都高度針對特定的(rs)值 。
也就是說 , AlphaEvolve并沒有找到一個通用的萬能算法 , 而是為每個問題「量身定制」了一套搜索策略 。
但定制這個過程 , 是全自動的 。


AI設計的算法有多精巧?


讓我們近距離看看一個突破性算法的細節 。
R(415):和聲記憶 + 譜初始化 + 有毒軌道隧穿 。對于這個問題 , AlphaEvolve給它設計了一種叫「和聲遺傳記憶」(Harmonic Genetic Memory)的機制——
跨代維護一個全局記憶池 , 記錄哪些邊和哪些循環距離在成功的圖中頻繁出現 。
初始化時 , 它要么用廣義Paley圖這樣的代數構造 , 要么根據和聲記憶的概率分布來擴展已有的最佳圖 。
局部搜索階段用的是禁忌搜索+模擬退火的組合 , 但每次刪除一條邊來消除4-團時 , 不只是看直接效果 , 還要評估刪邊后產生大獨立集的風險 , 并給歷史表現好的邊加「和聲」保護分 。
最驚人的是一個叫「和聲隧穿」(Harmonic Tunneling)的逃逸機制 。
如果搜索卡住了(還有4-團沒消除掉) , 算法會找出一個「有毒軌道」 。 也就是在剩余4-團中出現頻率最高的循環距離d* , 然后一次性翻轉所有距離為d*的邊 。
這是一個極其暴力的操作 , 相當于對圖做了一次大規模手術 , 直接跳出當前的局部最優 。
人類專家很難想到這樣的策略組合 。 但AlphaEvolve通過反復變異和進化 , 自己摸索出來了 。


人類專家 , 徹底輸了


AlphaEvolve生成的算法夠強 , 這點前面已經看到了 。
但一個更尖銳的問題是:跟人類頂級專家手工設計的算法比 , 它贏在哪?
論文給出的三組對比 , 沖擊一個比一個大 。
R(413):起點一樣 , AI贏在后半程 。

此前最佳紀錄由Exoo和Tatarevic在2015年創造 , 他們的算法從三次剩余圖出發 , 用標準模擬退火優化 。
AlphaEvolve選了同樣的起點(F???上的三次剩余圖) , 但后續策略完全不同——
兩階段篩選、基于擾動的頂點擴展、帶「戰略踢腿」的禁忌搜索(停滯500步后強制隨機跳出) 。

R(414):AI連起跑圖都換了 。Exoo在2015年用三次圖初始化 , AlphaEvolve直接選了循環圖 , 在完全不同的搜索空間里探索 , 用隨機軌道采樣和高性能位運算加速 。

R(410):AI發明了人類文獻里不存在的策略 。此前的最佳由Harborth和Krause在2003年用分支定界搜索得到 。
相比之下 , AlphaEvolve的算法從循環圖分布中采樣 , 結合自適應概率的禁忌搜索和近似命中倉庫機制 。
論文作者直言:「這種搜索策略在已有文獻中根本找不到先例 。 」

歸納來看 , AlphaEvolve生成的算法有三個顯著特征:
1. 懂得利用已知的代數結構 。
AlphaEvolve不是隨機搜索 , 而是會選擇Paley圖、循環圖等「好的起點」 。 這說明LLM在代碼變異過程中 , 隱含地運用了圖論和代數的領域知識 。
2. 喜歡串聯多種啟發式 。
人類算法往往用單一策略(比如純模擬退火) , AlphaEvolve則經常把多種方法鏈在一起——先禁忌搜索 , 再退火 , 再遺傳算法 , 再來一輪局部修復 。
3. 自創了快速近似計數方法 。
在大圖上精確計算所有4-團和13-獨立集非常耗時 , AlphaEvolve的算法會用位運算加速、啟發式過濾、增量更新等技巧來大幅降低計算開銷 。



AI , 正在改寫科學發現的規則


Hassabis曾這樣概括AlphaEvolve的意義:
知識催生更多知識 , 算法優化其他算法——飛輪正在加速旋轉 。
Gemini生成代碼 , 代碼進化出更好的算法 , 算法優化谷歌的基礎設施 , 更高效的基礎設施加速Gemini的訓練 , 更強的Gemini生成更好的代碼……
到這一步 , AI已經嵌入了自我提升的基礎設施之中 。
而這次拉姆齊數的突破 , 又把故事往前推了一步 。
矩陣乘法有明確的優化目標和連續的評估標準 , 拉姆齊數則不同 。 它的搜索空間是離散的、組合爆炸的 , 沒有梯度可以沿著爬坡 。
最后 , 論文也坦承了一個重要限制:
它目前只能搞定「下界」 , 也就是構造反例 。 而拉姆齊數的「上界」需要證明某個尺寸以上的圖不可能滿足約束 , 不能靠找一個例子來解決 。
這條路AlphaEvolve暫時還走不了 。 不過在它能走的路上 , 沒有人走得比它更遠 。
十年前 , AlphaGo下出Move 37 , AI證明了自己在特定領域可以超越人類直覺 。
五年前 , AlphaFold解決了困擾生物學界50年的蛋白質結構預測難題 。
【谷歌AI破解外星人難題!打破十年紀錄,自己寫算法震撼諾獎得主】AlphaEvolve干脆跳出了固定賽道——它開始自己發明規則了 。

    推薦閱讀