ICPC總決賽被AI統治!GPT-5系統12題全對登頂,人類只能爭第三

ICPC總決賽被AI統治!GPT-5系統12題全對登頂,人類只能爭第三

文章圖片

ICPC總決賽被AI統治!GPT-5系統12題全對登頂,人類只能爭第三

文章圖片

ICPC總決賽被AI統治!GPT-5系統12題全對登頂,人類只能爭第三

文章圖片

ICPC總決賽被AI統治!GPT-5系統12題全對登頂,人類只能爭第三

文章圖片


夢晨 發自 凹非寺量子位 | 公眾號 QbitAI
這屆大學生太難了 , 好不容易拼進編程競賽總決賽 , 還要被AI秀一臉 。
在剛剛結束的2025年國際大學程序設計競賽(ICPC)世界總決賽上 , OpenAI的系統完美解決全部12道題目 , 若計入排名將位居第一 。
谷歌的Gemini 2.5 Deep Think模型解決10道題目 , 達到金牌水準名列第二 。

這場頂級賽事匯集了來自全球103個國家、近3000所大學的139支頂尖隊伍 。
而AI系統在ICPC官方監督的獨立“AI實驗賽道”中 , 與人類選手面對相同題目和評測標準 , 表現非常搶眼 。
其中比較難的一道“問題C” , 沒有一個大學團隊能夠解決 , Gemini和OpenAI的模型組合都解決了 。

谷歌不知出于什么原因 , 還比人類選手晚10分鐘才啟動系統 , 就有點過分了啊 。
OpenAI滿分奪魁 , 給GPT-5配了強力外援OpenAI這次派出的是GPT-5和一個實驗性推理模型的組合陣容 。 在不到五小時的比賽時間里 , 這套系統成功解決了全部12道題目 。
具體來說 , GPT-5獨立完成了前11道題目 , 而且其中11道題都是一次提交就通過了ICPC官方的在線評測環境 。

對OpenAI系統來說 , 最有挑戰的是問題G , 由實驗性推理模型在GPT-5遇到困難后接力完成 , 兩個模型總共提交了9次才攻克這道難題 。
【ICPC總決賽被AI統治!GPT-5系統12題全對登頂,人類只能爭第三】人類選手中也只有第一名圣彼得堡國立大學團隊在3次嘗試中解決 , 很多大學團隊一次都沒有提交過這個問題 。

OpenAI暫沒有分享這道題的解決思路 , 但他們特別強調參賽的是通用推理模型 , 并沒有專門為ICPC進行訓練 。
另外值得一提的是 , OpenAI團隊中有不少研究員本身就是ICPC的參賽選手出身 , 包括接任Ilya的首席科學家Jakub Pachocki , 關于他的故事可以看奧特曼:點名表揚兩個波蘭人 , OpenAI還沒遇到過他們解決不了的問題 。
此時距離OpenAI首次推出推理模型o1差不多剛好一年 , 與一年前相比 , 現在的推理模型不僅更智能、更快速 , 而且成本效益更高了 。
谷歌Gemini獨立解決難題谷歌Gemini 2.5 Deep Think在比賽開始10分鐘后啟動 , 最終在五小時內成功解決了12道題目中的10道 , 達到了金牌級別 。
Gemini在前45分鐘內就解決了8道題目 , 三小時內又攻克了兩道 , 按照總用時677分鐘計算 , 若與大學隊伍比較 , Gemini的成績將排在第二位 。
下圖中 , Gemini解決問題的時間以藍色顯示 , 最快的大學隊伍所用時間以灰色顯示 。

對于人類選手沒解決的問題C , 谷歌分享了解題思路 。
這道題要求設計一個通過相互連接的管道網絡向儲存庫分配液體的方案 , 目標是找到一種配置使所有儲存庫盡快填滿 。
由于每個管道可以打開、關閉或部分打開 , 可能的配置數量是無限的 , 這使得搜索最優配置變得極其困難 。

Gemini的解決方案:
它首先假設每個儲存庫都有一個“優先級值” , 代表相對于其他儲存庫應該優先考慮的程度 。
當給定一組優先級值時 , 可以使用動態規劃算法找到管道的最佳配置通過應用極小化極大定理 , 原始問題可以通過尋找使結果流量最受約束的優先級值來解決 。
利用優先級值和最優流量之間的關系 , Gemini使用嵌套三元搜索在碗狀凸解空間中快速找到最優優先級值 , 成功解決了問題C 。
谷歌DeepMind表示 , Gemini的成功融合了預訓練、后訓練、新型強化學習技術、多步推理和并行思維等一系列技術進展 。
在強化學習過程中 , 他們訓練Gemini為編程界面臨的一些最困難的問題進行推理和生成代碼 , 從結果反饋中學習并不斷改進方法 。
One More Thing自推理模型范式問世之后 , AI連續在數學奧賽IMO , 信息學奧賽IOI , 編程大賽ICPC中表現出色 。
不過 , 這次OpenAI研究副總裁Jerry Tworek表示:
ICPC之后我們可能不會打別的競賽了 , 下一個前沿領域更令人興奮 。

人類選手們可以松一口氣了 。
那么什么是下一個前沿領域?可以參考Tworek最新的個人介紹:
如何將各類科學和工程技能應用于現實世界的問題 。

這些領域的研究者、工作者們 , GPT-5來找你們了 。
參考鏈接:[1
https://x.com/OpenAI/status/1968368133024231902[2
https://deepmind.google/discover/blog/gemini-achieves-gold-level-performance-at-the-international-collegiate-programming-contest-world-finals/[3
https://worldfinals.icpc.global/2025/

    推薦閱讀