谷歌AI破解外星人難題！打破十年紀錄，自己寫算法震撼諾獎得主

2026-04-06 北京高級工程師

文章圖片

文章圖片

文章圖片

文章圖片

文章圖片

文章圖片

文章圖片

文章圖片

文章圖片

文章圖片

文章圖片

文章圖片

文章圖片

文章圖片

文章圖片

編輯：好困 Aeneas
【新智元導讀】谷歌DeepMind又放大招了：AlphaEvolve自主寫算法，一口氣改寫5個經典拉姆齊數下界，打破了塵封十年的數學紀錄！諾獎得主Hassabis和圖靈獎得主LeCun都紛紛點贊——AI ，正在徹底改變數學突破的方式！

就在剛剛，谷歌DeepMind又出神功了。
他們開發的系統AlphaEvolve ，在極值組合學問題上取得突破，一次性改進了五個經典拉姆齊數的下界！

論文地址：https://arxiv.org/pdf/2603.09172
更令人驚訝的是，這并不是通過人工設計五套不同算法實現，而是通過一個統一的「元算法」（meta-algorithm）來完成的。

推導這些搜索算法的難度極大，最佳結果至少是十年前了。而這次， DeepMind讓大模型自主寫算法，直接踏平了塵封十年的數學記錄！

DeepMind研究者報喜后， CEO Hassabis也火速轉發慶賀。他表示， AlphaEvolve的這項成果，是AI在數學領域的又一個重大里程碑！

連圖靈獎得主LeCun ，都主動祝賀了團隊。

拉姆齊數問題究竟難到了什么程度？可以說，它讓最偉大的數學家，都感到絕望。
著名數學家、陶哲軒的導師保羅·埃爾德什（Paul Erd?s）曾說，如果外星人威脅地球：必須在規定時間內算出R(55)這個拉姆齊數，否則就毀滅人類，那么人類最理性的選擇，可能就是投降。

幾十年來，拉姆齊數一直是組合數學中最頑固的難題之一。數學家想要在某一個具體的拉姆齊數上取得進展，通常都必須從零設計一套專門的搜索算法。
但現在， AlphaEvolve把五個全破了！

而這，還只是AlphaEvolve能力的冰山一角。
此前，它就已經打破了塵封56年的矩陣乘法紀錄，優化了谷歌數據中心調度，并在AI芯片設計中發現了人類工程師未曾注意到的結構簡化方案。
當一個能夠自動發現算法的系統，同時還能優化訓練自己的計算基礎設施時，我們毫無疑問正在見證一個全新物種的誕生。

外星人來了都算不出的數

大約一百年前，英國邏輯學家弗蘭克·拉姆齊證明了這樣一個結論。
在一個六人小組中，無論這六個人之間的關系如何，總能找到三個互相認識的人，或者三個互不認識的人。
這個簡單直觀的例子是拉姆齊理論的最早原型。

在圖論中， R(rs)定義為最小整數n ，使得任何包含n個頂點的無向圖必然滿足以下至少一種情況：

存在r個頂點的完全子圖（clique）
或存在s個頂點的獨立集（independent set）

比如， R(33) = 6 。
這樣就意味著，任意6個頂點的圖，必然包含一個三角形，或三個互不相連的點。

現在，對于一些小規模參數，比如(3s) s ≤ 9 ， (4s) s = 45 ，這些拉姆齊數已經被精確求出。
但對于大量參數，仍然存在巨大的上下界差距。
如何得到下界呢？
如果我們能構造一個圖，頂點數為n ，不包含r-clique ，不包含s-independent set ，那么就說明：R(rs) ≥ n + 1 。

五個十年紀錄，一次踏平

而這次， DeepMind三名研究發出論文，宣布用AlphaEvolve一次性刷新了5個經典拉姆齊數的下界。

R(313)：60 → 61（此前紀錄保持11年）
R(318)：99 → 100（此前紀錄保持整整20年）
R(413)：138 → 139（此前紀錄保持11年）
R(414)：147 → 148（此前紀錄保持11年）
R(415)：158 → 159（此前紀錄保持6年）

雖然，每個數字只往上推了1 ，但在拉姆齊數這個領域，推1比很多數學領域推一個量級還難。
更關鍵的是，這5個突破全部來自同一個系統。
除了這5個新紀錄，它還匹配了所有已知精確值的拉姆齊數下界，以及大量其他值的當前最佳下界，總共覆蓋28個R(rs) 。

AlphaEvolve
不算題，算算法

那AlphaEvolve是怎么做到的？
簡單說，它是一個用大語言模型來進化代碼的智能體。它搜索的對象，是搜索算法本身。
這是理解這項工作最關鍵的一點。

傳統路徑是：
人類專家根據數學直覺和領域知識，手工設計一套搜索算法（比如模擬退火、禁忌搜索），然后讓計算機去跑。算法好不好，全看人的功力。
AlphaEvolve把這一步自動化了。它的工作流程是這樣的：
第一步，維護一個「算法種群」。
一開始只有一個最簡單的基線程序（甚至只是返回一個空圖）。
第二步，用LLM變異代碼。
從種群中選出一個表現好的算法，讓大語言模型（Gemini）對代碼進行「變異」——修改搜索策略、改初始化方式、加新的啟發式規則。
第三步，執行和評分。
運行變異后的程序，看它能造出多大的合法圖。如果圖的大小超過了當前最佳紀錄，給高分；如果圖接近合法（違規次數很少），也給一定獎勵——這是為了引導搜索向邊界推進。
第四步，進化迭代。
把高分算法放回種群，繼續選擇、變異、評估。循環往復。
這就是所謂的「元搜索」（meta-search）——在算法空間里搜索，而非圖空間。
換句話說， AlphaEvolve最終產出的也不是一個圖，而是一段能找到好圖的代碼。

AI發明的四大算法家族

論文中展示了AlphaEvolve為28個R(rs)值發現的具體搜索算法。這些算法風格差異極大，但可以歸為四大家族。
第一類：隨機起步，暴力退火
最樸素的路徑。從隨機圖出發，用模擬退火逐步消除違規結構（三角形或過大的獨立集）。
R(35)、R(37)等較小的值用的就是這類方法。
簡單，但對于大規模問題不夠用。

第二類：代數結構播種
用Paley圖、二次剩余圖、三次剩余圖等有深厚數學背景的代數圖作為起點，再做局部優化。
這些圖本身就具有接近拉姆齊約束的良好性質，相當于給搜索一個「高起點」。
R(413)的突破就屬于這一類——從有限域F???上的三次剩余Cayley圖出發。
第三類：循環圖 + 無和集引導
從循環圖（Circulant Graph）出發，利用無和集（sum-free set）的代數性質天然保證無三角形，再做增量擴展。
R(313)和R(318)這兩個突破屬于這一類。這也是產出新紀錄最多的一個家族。

第四類：混合/分形/譜方法
最復雜的一類，融合了分形自相似構造、譜性質分析、多種啟發式的并行執行等。
R(311)的算法就用了分形初始化+自適應能量場+動態溫度調節的組合。
有意思的是，每種算法都高度針對特定的(rs)值。
也就是說， AlphaEvolve并沒有找到一個通用的萬能算法，而是為每個問題「量身定制」了一套搜索策略。
但定制這個過程，是全自動的。

AI設計的算法有多精巧？

讓我們近距離看看一個突破性算法的細節。
R(415)：和聲記憶 + 譜初始化 + 有毒軌道隧穿。對于這個問題， AlphaEvolve給它設計了一種叫「和聲遺傳記憶」（Harmonic Genetic Memory）的機制——
跨代維護一個全局記憶池，記錄哪些邊和哪些循環距離在成功的圖中頻繁出現。
初始化時，它要么用廣義Paley圖這樣的代數構造，要么根據和聲記憶的概率分布來擴展已有的最佳圖。
局部搜索階段用的是禁忌搜索+模擬退火的組合，但每次刪除一條邊來消除4-團時，不只是看直接效果，還要評估刪邊后產生大獨立集的風險，并給歷史表現好的邊加「和聲」保護分。
最驚人的是一個叫「和聲隧穿」（Harmonic Tunneling）的逃逸機制。
如果搜索卡住了（還有4-團沒消除掉），算法會找出一個「有毒軌道」。也就是在剩余4-團中出現頻率最高的循環距離d* ，然后一次性翻轉所有距離為d*的邊。
這是一個極其暴力的操作，相當于對圖做了一次大規模手術，直接跳出當前的局部最優。
人類專家很難想到這樣的策略組合。但AlphaEvolve通過反復變異和進化，自己摸索出來了。

人類專家，徹底輸了

AlphaEvolve生成的算法夠強，這點前面已經看到了。
但一個更尖銳的問題是：跟人類頂級專家手工設計的算法比，它贏在哪？
論文給出的三組對比，沖擊一個比一個大。
R(413)：起點一樣， AI贏在后半程。

此前最佳紀錄由Exoo和Tatarevic在2015年創造，他們的算法從三次剩余圖出發，用標準模擬退火優化。
AlphaEvolve選了同樣的起點（F???上的三次剩余圖），但后續策略完全不同——
兩階段篩選、基于擾動的頂點擴展、帶「戰略踢腿」的禁忌搜索（停滯500步后強制隨機跳出）。

R(414)：AI連起跑圖都換了。Exoo在2015年用三次圖初始化， AlphaEvolve直接選了循環圖，在完全不同的搜索空間里探索，用隨機軌道采樣和高性能位運算加速。

R(410)：AI發明了人類文獻里不存在的策略。此前的最佳由Harborth和Krause在2003年用分支定界搜索得到。
相比之下， AlphaEvolve的算法從循環圖分布中采樣，結合自適應概率的禁忌搜索和近似命中倉庫機制。
論文作者直言：「這種搜索策略在已有文獻中根本找不到先例。」

歸納來看， AlphaEvolve生成的算法有三個顯著特征：
1. 懂得利用已知的代數結構。
AlphaEvolve不是隨機搜索，而是會選擇Paley圖、循環圖等「好的起點」。這說明LLM在代碼變異過程中，隱含地運用了圖論和代數的領域知識。
2. 喜歡串聯多種啟發式。
人類算法往往用單一策略（比如純模擬退火）， AlphaEvolve則經常把多種方法鏈在一起——先禁忌搜索，再退火，再遺傳算法，再來一輪局部修復。
3. 自創了快速近似計數方法。
在大圖上精確計算所有4-團和13-獨立集非常耗時， AlphaEvolve的算法會用位運算加速、啟發式過濾、增量更新等技巧來大幅降低計算開銷。

AI ，正在改寫科學發現的規則

Hassabis曾這樣概括AlphaEvolve的意義：
知識催生更多知識，算法優化其他算法——飛輪正在加速旋轉。
Gemini生成代碼，代碼進化出更好的算法，算法優化谷歌的基礎設施，更高效的基礎設施加速Gemini的訓練，更強的Gemini生成更好的代碼……
到這一步， AI已經嵌入了自我提升的基礎設施之中。
而這次拉姆齊數的突破，又把故事往前推了一步。
矩陣乘法有明確的優化目標和連續的評估標準，拉姆齊數則不同。它的搜索空間是離散的、組合爆炸的，沒有梯度可以沿著爬坡。
最后，論文也坦承了一個重要限制：
它目前只能搞定「下界」，也就是構造反例。而拉姆齊數的「上界」需要證明某個尺寸以上的圖不可能滿足約束，不能靠找一個例子來解決。
這條路AlphaEvolve暫時還走不了。不過在它能走的路上，沒有人走得比它更遠。
十年前， AlphaGo下出Move 37 ， AI證明了自己在特定領域可以超越人類直覺。
五年前， AlphaFold解決了困擾生物學界50年的蛋白質結構預測難題。
【谷歌AI破解外星人難題！打破十年紀錄，自己寫算法震撼諾獎得主】AlphaEvolve干脆跳出了固定賽道——它開始自己發明規則了。

推薦閱讀

上一篇：長江存儲首款商用PCIe 5.0 SSD！PC550 1TB圖賞

下一篇：大增17.7%，中國第3大芯片代工廠，只差0.03%就成全球第7了