陶哲軒看傻：三破18年數學紀錄，谷歌推出「AI愛迪生」，科研不再靠靈感？

2025-07-14 14:30 b站工業化廣播劇

文章圖片

文章圖片

文章圖片

文章圖片

在5月中旬，谷歌發布了AlphaEvolve 。不僅30天內攻克了18年未解的難題，或將開啟了一場無需「靈感」的科學革命：未來，科學家將不再依賴直覺，而是靠AI解決難題！
5月中旬，谷歌在科學和計算領域投下了重磅炸彈：AlphaEvolve 。
利用Gemini模型，它發現全新的算法。
比如說，僅用30天， AlphaEvolve與人類聯手三度攻克一項封塵18年的數學難題！對此，知名華人數學家陶哲軒略感驚訝。
不僅在計算機科學和數學取得重大進展， AI甚至可能影響到更廣泛的科學領域。
它不僅僅是生成文本工具，更不是簡單的模板生成器。它喻示了AI的無限可能，就像AlphaGo的「神之一手」，展現了人類從未做過的突破。
這甚至可能是邁向AI自我改進的一步。
在深度對話中，華人投資家Sarah Guo（郭睿）采訪了谷歌DeepMind科學與戰略副總裁Pushmeet Kohli（下圖左），以及研究科學家Matej Balog（下圖右）。
他們分享了AlphaEvolve的背后故事。除了數學和計算機科學，他們也進一步暢想：AlphaEvolve背后的理念，是否還能顛覆更多基礎科學領域？
AlphaEvolve證明靠智能取代「運氣」，也能顛覆科學。 AlphaEvolve ，或許正開啟一場不靠「靈感」的科學革命。

AlphaEvolve：陶哲軒震驚的進步DeepMind的使命是負責任地構建人工智能，造福人類。這些年來， DeepMind一直在科學領域尋找新算法。
AlphaEvolve有什么不一樣？
Pushmeet Kohli認為區別可以從歷史上來看。
一切從AlphaGo說起。
AlphaGo不僅能夠高效地探索圍棋的所有可能局面，而且能夠提出當時最佳走法。在幾十年的圍棋歷史中，人類都沒有發現這種下法。
某種意義上， AlphaGo是AI智能體。在龐大的搜索空間中，它可以高效探索并提出最優解。這種能力讓人們感到驚訝，因為圍棋非常復雜，科學家們認為AI能夠在這一領域取得突破還需要很長時間。
從AlphaGo的工作中， DeepMind得到啟發：
如果AI能夠如此高效地搜索圍棋的所有可能局面，那么是否可以利用類似的思想去搜索算法空間呢？
這就是開始研發AlphaTensor工作的基礎。
幾十年來，人們認為矩陣乘法的復雜度是立方級別的。也就是說，如果你有兩個矩陣，矩陣的維度是n ，那么計算的時間復雜度是n3 。
50多年前，德國數學家Strassen提出了一種非常反直覺的方法，證明了：實際上，矩陣乘法的復雜度比原來預想的要低。
通過搜索， AlphaTensor發現了比之前所知的算法更高效的解決方案。它不僅在效率上超越了傳統算法，而且這個結果還證明了AI可以實現超人級別的突破。
但問題是， AlphaTensor專門針對矩陣乘法設計。那么，能否將這種方法推廣到更一般的問題中呢？這就引出了對AlphaEvolve的進一步探索。
AlphaEvolve不僅能夠處理特定的任務，它更具普適性，可以處理更廣泛的問題。
AlphaEvolve利用了與AlphaTensor相似的進化算法。但它不再局限于矩陣乘法的特定問題，而是能夠在更廣泛的編程空間中搜索，提出解決方案。

不斷進化，自我改進聽起來AlphaEvolve類似于進化選擇對吧？它是如何進行每一代的改進的？
在每一代過程中， AlphaEvolve不斷改進，每一代都基于上一代的強解進行優化。
通過基因池和評估函數，確保每一代的改進都能夠提高整體的解的質量，同時保持了多樣性，以便在龐大的搜索空間中發現最佳解決方案。
那這種進化過程的規模如何呢？如何控制模型的迭代次數？
關于這個問題， AlphaEvolve有一個很棒的特性，就是它能夠適應問題的難度。
如果AlphaEvolve被要求解決一個相對簡單的問題，它幾乎能立即得到答案；但如果是一個非常復雜的問題，那么解決方案可能需要更長時間，更多的代次來不斷改進。
但令人欣慰的是， AlphaEvolve可以持續改進，即使是在面對難度極大的問題時，它仍能不斷提高。
【陶哲軒看傻：三破18年數學紀錄，谷歌推出「AI愛迪生」，科研不再靠靈感？】這非常有價值，因為在持續優化時，許多傳統的系統往往會在早期就遇到瓶頸，無法繼續改進。
至于預測需要多少代才能達到最優解，這個問題比較復雜。問題的難度，無法預料，尤其是在科學領域，一些看似簡單的問題實際上可能非常難，反之亦然。但幸運的是，只要持續運行AlphaEvolve ，它會隨著時間的推移不斷得到更好的結果。

對編碼智能體的意義與一般的編碼智能體相比， AlphaEvolve有何不同之處？
與一般的編碼智能體相比， AlphaEvolve的優勢在于它能夠處理更復雜的任務，并且具有更高的效率和創造性。
在面對復雜或模糊的任務時，大多數通用編碼智能體，容易陷入困境或產生錯誤，因為它們通常依賴于直接的任務說明，而這些說明往往不夠精確，或者它們沒有很強的判斷能力。
而AlphaEvolve則依賴嚴格的評估函數。它能夠區分有效的解決方案與無效的解決方案。
它的「創造性」不僅僅體現在提出新算法上，還表現在對解決方案進行有效評估和優化的能力上。
每當提出一個新解決方案時，評估函數會幫助判斷它是否有效。
例如，在優化數據中心調度時，評估函數可能是一個模擬器，它能夠根據給定的調度算法來判斷該算法在現實中的表現如何。
這個評估過程幫助Alpha Evolve更準確地搜索解決方案空間。
那對于開發者來說，設計好的評估函數確實非常具有挑戰性。你需要明確什么樣的結果才是好的解決方案。在某些情況下，開發者可以使用現有的模擬器來進行評估，而在其他更復雜的情況下，可能需要開發定制化的評估工具。
評估函數不僅要能判斷方案的好壞，還要能夠在不同的任務中靈活應用。比如，在數據中心調度優化問題中，評估函數的復雜性可能遠高于一些較簡單的任務。
這也是為什么強調評估函數在AI系統中的重要性，只有擁有了精確的評估函數， AI才能有效地進行創新。
左圖：AlphaEvolve為谷歌的工作負載和容量量身定制的啟發式函數；右圖：對該啟發式評分函數的可視化展示

科學家轉變角色Matej Balog和Pushmeet Kohli都認為：未來，科學家的角色會發生一些變化。
可以想象，在未來，科學家們將更多地專注于如何定義問題、設計評估函數，以及如何解釋AI生成的結果。
AI將成為科學家們的強大工具，幫助他們更快解決復雜的問題。
AI不僅僅給出答案，還提供算法，科學家們可以通過研究算法來理解背后的原理，這對于深入理解問題和解決方案非常重要。
這正是AlphaEvolve稱霸多個領域的原因。
數學家和科學家不僅能看到最終的解決方案，還能理解到達這個解的路徑，這種新的視角對推動科學發展至關重要。
此外， AlphaEvolve不僅僅推動技術創新，還有助于科學家發掘新的思維方式，挑戰現有的認知框架。
AlphaEvolve的問世，標志著科學研究進入了一個嶄新的時代。它不僅在算法領域創造了奇跡，更為未來的科學革命鋪設了道路。
在AlphaEvolve的推動下，或許我們即將見證：科學，不再依賴「靈感」，而是靠「智能」。

參考資料：https://www.youtube.com/watch?v=2Fs6VZpsiMQ

推薦閱讀

上一篇：深夜開源首個萬億模型K2，壓力給到OpenAI，Kimi時刻要來了？

下一篇：從HiFi桌搭到街頭潮玩，飛傲攜高保真音箱和時尚耳機亮相BW2025