OpenAI「解決」10道數學難題?哈薩比斯直呼「尷尬」,LeCun點評

OpenAI「解決」10道數學難題?哈薩比斯直呼「尷尬」,LeCun點評

文章圖片

OpenAI「解決」10道數學難題?哈薩比斯直呼「尷尬」,LeCun點評

文章圖片

OpenAI「解決」10道數學難題?哈薩比斯直呼「尷尬」,LeCun點評

文章圖片

OpenAI「解決」10道數學難題?哈薩比斯直呼「尷尬」,LeCun點評

文章圖片

OpenAI「解決」10道數學難題?哈薩比斯直呼「尷尬」,LeCun點評

文章圖片

OpenAI「解決」10道數學難題?哈薩比斯直呼「尷尬」,LeCun點評

文章圖片

OpenAI「解決」10道數學難題?哈薩比斯直呼「尷尬」,LeCun點評

文章圖片

OpenAI「解決」10道數學難題?哈薩比斯直呼「尷尬」,LeCun點評

文章圖片

機器之心報道
編輯:+0
這個周末 AI 圈非常熱鬧 , OpenAI 陷入輿論中心 , Google、Meta 和 AI 圈多位大佬加入混戰 。
一句話概括就是:OpenAI 研究員宣稱 GPT-5 「發現」了 10 個懸賞數學難題的解決方法 , 輿論誤以為是 GPT-5 給出了解題方法 , 結果被發現只是檢索到了早已存在的文獻 , 引發了學界大佬的群嘲和對于 AI 夸大宣傳的激烈討論 。

故事要從幾條引爆社交平臺的推文說起 。
【OpenAI「解決」10道數學難題?哈薩比斯直呼「尷尬」,LeCun點評】GPT-5 解決懸賞難題?
10 月 12 日 , Sebastien Bubeck 發推表示 GPT-5 文獻搜索方面超凡脫俗 , 發現了 Erd?s 問題 339 已被解決但在官方數據庫中狀態尚未修改 。

10 月 17 日 , OpenAI 研究人員 Mark Sellke 轉發此貼更新 , 表示他和 Mehtaab 使用 GPT-5 模型進一步研究 , 通過數千次查詢 , 針對 erdosproblems.com 網站上列為「開放」的 Erd?s 問題進行了調查 。

他們聲稱「發現了」10 個問題的解決方案(問題編號:223、339、494、515、621、822、883(第 2/2 部分)、903、1043、1079) 。 同時他們在另外 11 個問題上也取得了部分進展 。
OpenAI 首席產品官 Kevin Weil 轉發此貼 。

這些問題源自數學家 Paul Erd?s 提出的未解決問題列表 , 該網站由數學家 Thomas Bloom 維護 。
OpenAI 的副總裁 Sebastien Bubeck 轉發并宣稱「AI 加速科學已正式開始」 , 并順勢宣布 Mark Sellke 加入 OpenAI 。

一時間 , 公眾和媒體普遍認為 GPT-5 在數學推理能力上取得了驚人突破 , 能夠獨立解決困擾人類數學家數十年的難題 。
反轉:「這很尷尬」
然而 , 這場狂歡僅僅持續了幾個小時 , 就迎來了反轉 。
谷歌 DeepMind 的 CEO Demis Hassabis 在 Sebastien Bubeck 那條「AI 加速科學」的推文下回復:這很尷尬 。

Hassabis 隨后引導公眾關注該數學難題網站維護者、數學家 Thomas Bloom 的澄清 。
Thomas Bloom 表示:OpenAI 的表述為「戲劇性的誤解」 。 網站上將這些問題標記為「未解決」 , 僅僅代表他個人不知道相關解答已經發表 , 并不意味著數學界沒有人解決 。

換言之 , GPT-5 扮演了一個效率極高的學術搜索引擎 , 而非一個數學家 。
Sebastien Bubeck 隨后刪除帖子并道歉 , 稱「我無意誤導任何人 , 我認為表述很清楚 , 對不起」 。 他強調 , AI 在文獻搜索上的作用非常有價值 , 因為「搜索文獻有多難 , 我很清楚」 , 這能加速科學研究 。

Kevin Weil 也刪帖并承認「我實際上誤解了我們的結果(尷尬)」 。 Mark Sellke 的更新也是轉發此貼 。

Hoisted by their own GPTards
對此 , Lecun 也辛辣點評:(OpenAI)被自己吹捧 GPT 的言論坑慘了(Hoisted by their own GPTards) , 諷刺其作繭自縛 。
注:源自莎士比亞戲劇《哈姆雷特》的著名短語 Hoist with his own petard(被自己的炸藥包給炸飛了) , 這里 petard(炸藥)改成了 GPTards(-tards 源自英文單詞 retard , 意為笨蛋) , 指代那些盲目崇拜 ChatGPT / AI 的人 。

搞笑的是 , 就在同一天 , Lecun 在一篇指出最近的熱門論文《Definition of AGI》中存在虛假引用的帖子下面回復了相同的一句話 。

Gary Marcus 也做出點評:任何期望當前范式接近AGI的人都是在癡心妄想 。

網友也進行了激烈討論 , 有部分人認為 OpenAI 再一次炒作失敗 。

不過也有人認為 , 這是一個有價值的事情 。

陶哲軒的觀點與此類似 , 他在 Mastodon 上表示 , AI 在數學中的即時潛力在于加速文獻搜索等瑣碎任務 , 而非解決最難的開放問題 。 他承認 AI 可能「工業化」數學 , 加速整體進展 , 但強調人類專家仍需審查、分類和整合 AI 結果 。

  • 貼文地址:https://mathstodon.xyz/@tao/115385022005130505
還有人對「炒作」行為做出了更深層次的解讀 。

無論如何 , 這件事再次警醒我們 , 在追求技術突破的道路上 , AI 社區究竟該如何平衡嚴謹的科學精神與必要的公眾宣傳?
參考鏈接:
https://x.com/Yuchenj_UW/status/1979422127905476778
https://x.com/ns123abc/status/1979574373435441229
https://x.com/ylecun/status/1979596956277289353

    推薦閱讀