陶哲軒看傻:三破18年數學紀錄,谷歌推出「AI愛迪生」,科研不再靠靈感?

陶哲軒看傻:三破18年數學紀錄,谷歌推出「AI愛迪生」,科研不再靠靈感?

文章圖片

陶哲軒看傻:三破18年數學紀錄,谷歌推出「AI愛迪生」,科研不再靠靈感?

文章圖片

陶哲軒看傻:三破18年數學紀錄,谷歌推出「AI愛迪生」,科研不再靠靈感?

文章圖片

陶哲軒看傻:三破18年數學紀錄,谷歌推出「AI愛迪生」,科研不再靠靈感?

文章圖片

陶哲軒看傻:三破18年數學紀錄,谷歌推出「AI愛迪生」,科研不再靠靈感?

在5月中旬 , 谷歌發布了AlphaEvolve 。 不僅30天內攻克了18年未解的難題 , 或將開啟了一場無需「靈感」的科學革命:未來 , 科學家將不再依賴直覺 , 而是靠AI解決難題!
5月中旬 , 谷歌在科學和計算領域投下了重磅炸彈:AlphaEvolve 。
利用Gemini模型 , 它發現全新的算法 。
比如說 , 僅用30天 , AlphaEvolve與人類聯手三度攻克一項封塵18年的數學難題!對此 , 知名華人數學家陶哲軒略感驚訝 。
不僅在計算機科學和數學取得重大進展 , AI甚至可能影響到更廣泛的科學領域 。
它不僅僅是生成文本工具 , 更不是簡單的模板生成器 。 它喻示了AI的無限可能 , 就像AlphaGo的「神之一手」 , 展現了人類從未做過的突破 。
這甚至可能是邁向AI自我改進的一步 。
在深度對話中 , 華人投資家Sarah Guo(郭睿)采訪了谷歌DeepMind科學與戰略副總裁Pushmeet Kohli(下圖左) , 以及研究科學家Matej Balog(下圖右) 。
他們分享了AlphaEvolve的背后故事 。 除了數學和計算機科學 , 他們也進一步暢想:AlphaEvolve背后的理念 , 是否還能顛覆更多基礎科學領域?
AlphaEvolve證明靠智能取代「運氣」 , 也能顛覆科學 。 AlphaEvolve , 或許正開啟一場不靠「靈感」的科學革命 。

AlphaEvolve:陶哲軒震驚的進步DeepMind的使命是負責任地構建人工智能 , 造福人類 。 這些年來 , DeepMind一直在科學領域尋找新算法 。
AlphaEvolve有什么不一樣?
Pushmeet Kohli認為區別可以從歷史上來看 。
一切從AlphaGo說起 。
AlphaGo不僅能夠高效地探索圍棋的所有可能局面 , 而且能夠提出當時最佳走法 。 在幾十年的圍棋歷史中 , 人類都沒有發現這種下法 。
某種意義上 , AlphaGo是AI智能體 。 在龐大的搜索空間中 , 它可以高效探索并提出最優解 。 這種能力讓人們感到驚訝 , 因為圍棋非常復雜 , 科學家們認為AI能夠在這一領域取得突破還需要很長時間 。
從AlphaGo的工作中 , DeepMind得到啟發:
如果AI能夠如此高效地搜索圍棋的所有可能局面 , 那么是否可以利用類似的思想去搜索算法空間呢?
這就是開始研發AlphaTensor工作的基礎 。
幾十年來 , 人們認為矩陣乘法的復雜度是立方級別的 。 也就是說 , 如果你有兩個矩陣 , 矩陣的維度是n , 那么計算的時間復雜度是n3 。
50多年前 , 德國數學家Strassen提出了一種非常反直覺的方法 , 證明了:實際上 , 矩陣乘法的復雜度比原來預想的要低 。
通過搜索 , AlphaTensor發現了比之前所知的算法更高效的解決方案 。 它不僅在效率上超越了傳統算法 , 而且這個結果還證明了AI可以實現超人級別的突破 。
但問題是 , AlphaTensor專門針對矩陣乘法設計 。 那么 , 能否將這種方法推廣到更一般的問題中呢?這就引出了對AlphaEvolve的進一步探索 。
AlphaEvolve不僅能夠處理特定的任務 , 它更具普適性 , 可以處理更廣泛的問題 。
AlphaEvolve利用了與AlphaTensor相似的進化算法 。 但它不再局限于矩陣乘法的特定問題 , 而是能夠在更廣泛的編程空間中搜索 , 提出解決方案 。

不斷進化 , 自我改進聽起來AlphaEvolve類似于進化選擇對吧?它是如何進行每一代的改進的?
在每一代過程中 , AlphaEvolve不斷改進 , 每一代都基于上一代的強解進行優化 。
通過基因池和評估函數 , 確保每一代的改進都能夠提高整體的解的質量 , 同時保持了多樣性 , 以便在龐大的搜索空間中發現最佳解決方案 。
那這種進化過程的規模如何呢?如何控制模型的迭代次數?
關于這個問題 , AlphaEvolve有一個很棒的特性 , 就是它能夠適應問題的難度 。
如果AlphaEvolve被要求解決一個相對簡單的問題 , 它幾乎能立即得到答案;但如果是一個非常復雜的問題 , 那么解決方案可能需要更長時間 , 更多的代次來不斷改進 。
但令人欣慰的是 , AlphaEvolve可以持續改進 , 即使是在面對難度極大的問題時 , 它仍能不斷提高 。
【陶哲軒看傻:三破18年數學紀錄,谷歌推出「AI愛迪生」,科研不再靠靈感?】這非常有價值 , 因為在持續優化時 , 許多傳統的系統往往會在早期就遇到瓶頸 , 無法繼續改進 。
至于預測需要多少代才能達到最優解 , 這個問題比較復雜 。 問題的難度 , 無法預料 , 尤其是在科學領域 , 一些看似簡單的問題實際上可能非常難 , 反之亦然 。 但幸運的是 , 只要持續運行AlphaEvolve , 它會隨著時間的推移不斷得到更好的結果 。

對編碼智能體的意義與一般的編碼智能體相比 , AlphaEvolve有何不同之處?
與一般的編碼智能體相比 , AlphaEvolve的優勢在于它能夠處理更復雜的任務 , 并且具有更高的效率和創造性 。
在面對復雜或模糊的任務時 , 大多數通用編碼智能體 , 容易陷入困境或產生錯誤 , 因為它們通常依賴于直接的任務說明 , 而這些說明往往不夠精確 , 或者它們沒有很強的判斷能力 。
而AlphaEvolve則依賴嚴格的評估函數 。 它能夠區分有效的解決方案與無效的解決方案 。
它的「創造性」不僅僅體現在提出新算法上 , 還表現在對解決方案進行有效評估和優化的能力上 。
每當提出一個新解決方案時 , 評估函數會幫助判斷它是否有效 。
例如 , 在優化數據中心調度時 , 評估函數可能是一個模擬器 , 它能夠根據給定的調度算法來判斷該算法在現實中的表現如何 。
這個評估過程幫助Alpha Evolve更準確地搜索解決方案空間 。
那對于開發者來說 , 設計好的評估函數確實非常具有挑戰性 。 你需要明確什么樣的結果才是好的解決方案 。 在某些情況下 , 開發者可以使用現有的模擬器來進行評估 , 而在其他更復雜的情況下 , 可能需要開發定制化的評估工具 。
評估函數不僅要能判斷方案的好壞 , 還要能夠在不同的任務中靈活應用 。 比如 , 在數據中心調度優化問題中 , 評估函數的復雜性可能遠高于一些較簡單的任務 。
這也是為什么強調評估函數在AI系統中的重要性 , 只有擁有了精確的評估函數 , AI才能有效地進行創新 。
左圖:AlphaEvolve為谷歌的工作負載和容量量身定制的啟發式函數;右圖:對該啟發式評分函數的可視化展示

科學家轉變角色Matej Balog和Pushmeet Kohli都認為:未來 , 科學家的角色會發生一些變化 。
可以想象 , 在未來 , 科學家們將更多地專注于如何定義問題、設計評估函數 , 以及如何解釋AI生成的結果 。
AI將成為科學家們的強大工具 , 幫助他們更快解決復雜的問題 。
AI不僅僅給出答案 , 還提供算法 , 科學家們可以通過研究算法來理解背后的原理 , 這對于深入理解問題和解決方案非常重要 。
這正是AlphaEvolve稱霸多個領域的原因 。
數學家和科學家不僅能看到最終的解決方案 , 還能理解到達這個解的路徑 , 這種新的視角對推動科學發展至關重要 。
此外 , AlphaEvolve不僅僅推動技術創新 , 還有助于科學家發掘新的思維方式 , 挑戰現有的認知框架 。
AlphaEvolve的問世 , 標志著科學研究進入了一個嶄新的時代 。 它不僅在算法領域創造了奇跡 , 更為未來的科學革命鋪設了道路 。
在AlphaEvolve的推動下 , 或許我們即將見證:科學 , 不再依賴「靈感」 , 而是靠「智能」 。

參考資料:https://www.youtube.com/watch?v=2Fs6VZpsiMQ

    推薦閱讀