GPT-5 Pro獨立做數學研究,OpenAI總裁:這是生命跡象

GPT-5 Pro獨立做數學研究,OpenAI總裁:這是生命跡象

文章圖片

GPT-5 Pro獨立做數學研究,OpenAI總裁:這是生命跡象

文章圖片

GPT-5 Pro獨立做數學研究,OpenAI總裁:這是生命跡象

文章圖片

GPT-5 Pro獨立做數學研究,OpenAI總裁:這是生命跡象

文章圖片


克雷西 發自 凹非寺
量子位 | 公眾號 QbitAI
AI已經能夠自主思考并證明新的數學規律了?
OpenAI研究人員表示 , 自己喂給GPT-5 Pro一篇論文 , 結果模型讀完之后得到了新的結論 。
在凸優化問題當中 , GPT-5 Pro針對一個邊界問題 , 給出了比原文更加精確的閾值和相應證明 。
消息立即引發全網熱議 , 不到半天推文就有230多萬次閱讀 。

不過這位研究人員并沒有將GPT-5 Pro的研究成果發表成論文 , 理由是被人類搶先了——
這篇論文后來又更新了一個版本 , 給出了新的邊界 , 這個新的邊界又把GPT-5 Pro反超了 。
但是 , GPT-5 Pro的證明思路與此并不相同 , 說明它已經具備了獨立探索的能力 , 所以人類的反攻也不影響這是GPT-5 Pro的一個新突破 。
OpenAI總裁Brockman甚至將這一成果稱之為“生命跡象” 。

凸優化曲線是凸的嗎?喂給GPT-5 Pro的這篇另論文 , 研究的是凸優化(convex optimization)問題 , 凸優化是數學最優化的一個子領域 , 研究定義于凸集中的凸函數最小化的問題 。
具體來說 , 這篇論文題目為《凸優化曲線是凸的嗎?》 , 研究了這樣的一個問題:
當使用梯度下降算法優化光滑凸函數時 , 其產生的優化曲線(optimization curve)是否是凸的?
這里的“優化曲線”指的是函數值f(x_n)隨迭代次數n變化的曲線 。 如果這條曲線是凸的 , 意味著優化速率(即相鄰兩次迭代的函數值下降量)是單調遞減的 。
【GPT-5 Pro獨立做數學研究,OpenAI總裁:這是生命跡象】
關于這個問題 , 論文的結論是優化曲線凸不凸 , 關鍵取決于步長(step size)的選擇 , 具體包括如下幾個關鍵點:
凸性保證區間:當步長η ∈ (0 1/L
時(L為平滑度) , 優化曲線保證是凸的; 非凸可能區間:當步長η ∈ (1.75/L 2/L)時 , 即使梯度下降仍單調收斂 , 優化曲線可能不是凸的; 梯度范數性質:對于整個收斂區間η ∈ (0 2/L
, 梯度范數序列||?f(x_n)||總是單調遞減的; 二階可導凸函數的梯度流凸性:對于凸且二階連續可導的函數 , 梯度流的優化曲線總是凸的; 光滑凸函數的梯度流凸性:對于凸L-光滑函數(不要求二階可導) , 梯度流的優化曲線總是凸的; 梯度流的梯度范數單調性:對于連續時間的梯度流 , 優化曲線總是凸的;關于第一個結論 , 證明的核心是證明序列{f(x_n) - f[(x_(n+1)
非遞增 。
論文作者巧妙地引入輔助函數g_k(t) , 將離散的迭代過程轉化為連續函數的積分 , 利用凸函數的性質證明輔助函數的單調性 , 通過比較相鄰兩個輔助函數的大小關系 , 最終證明優化曲線的凸性 。

非凸可能區間部分則是構造一個分段函數(二次函數和線性函數的組合)作為反例實現證明 。
作者選擇特定的初始點x_0 = -1.8 , 通過直接計算前三步迭代的函數值下降量 , 驗證在該步長范圍內 , 后面的下降量反而比前面大 , 違反了凸性要求 。

由于GPT-5 Pro的證明主要針對的是邊界問題 , 后面四個結論的證明過程在這里就不詳細介紹了 , 感興趣的話可以閱讀原論文 。
GPT-5 Pro給出新邊界在論文的第一版中 , 作者分別證明了步長不大于1/L和大于1.75/L時的情況 , 但在(1/L 1.75/L
范圍內則未有定論 。
GPT-5 Pro則是通過更精細的不等式技巧 , 用17分半的時間把1/L這個邊界移動到了1.5/L 。
而人類檢查證明過程的時間 , 是25分鐘 , GPT-5 Pro讀論文并進行證明的時間還要長 。

其核心思路與原論文相似 , 均是將優化曲線凸性問題轉化為證明函數值下降量遞減 。
但GPT-5 Pro巧妙運用了凸L-光滑函數的兩個基本不等式——Bregman散度不等式(提供更緊的下界)和標準的共強制性(cocoercivity)不等式 。
通過這種巧妙的代數操作 , GPT-5 Pro成功將凸性條件進一步細化 。

再之后 , GPT-5 Pro的發現還未來得及發表 , 論文原作者就對論文進行了更新 , 作者新增了一名 , 關鍵是證明了1.75/L就是一個精確界限 , 之前未探索的區間實現了閉合 。
其思路是利用凸L-光滑函數的Bregman散度不等式 , 對三個點對(x_0x_1)、(x_1x_2)和(x_0x_2) 分別建立不等式 , 之后將三個不等式分別乘以不同權重后求和 , 并通過恒等式將復雜的梯度項組合化簡 。

雖然GPT-5 Pro給出的證明最后被人類扳回一城 , 但是 , 其思路和過程與新版論文不同 。
也就是說 , GPT-5 Pro并不是發現了新論文才實現邊界的精確化 , 而是確實具備了自主發現并證明數學規律的能力 。
參考鏈接:[1
https://x.com/SebastienBubeck/status/1958198661139009862[2
https://arxiv.org/abs/2503.10138v1[3
https://arxiv.org/abs/2503.10138v2
— 完 —
量子位 QbitAI
關注我們 , 第一時間獲知前沿科技動態

    推薦閱讀