奧特曼：點名表揚兩個波蘭人，OpenAI還沒有過他們解決不了的問題_廣東省|ai|人工智能

文章圖片

文章圖片

文章圖片

文章圖片

文章圖片

文章圖片

文章圖片

文章圖片

夢晨發自凹非寺量子位 | 公眾號 QbitAI
奧特曼點名表揚了兩個波蘭人。
沒有他們， OpenAI就不是今天的樣子。

他們是OpenAI首席科學家Jakub Pachocki以及頭銜為“Technical Fellow”的Szymon Sidor 。

△左：Jakub Pachocki ，右：Szymon Sidor
兩人不僅是波蘭老鄉，而且是高中同學，讀博時分別選擇了計算機科學和機器人，后來又在OpenAI重聚。
在ChatGPT風靡全球、每天服務數億用戶的今天，奧特曼感慨大多數人永遠不會想到背后那些付出心血的人，這兩位波蘭科學家，正是其中的關鍵角色。
他們在OpenAI的貢獻從Dota項目大規模擴展了強化學習，到領導了GPT-4的預訓練，還與 Ilya和Lukasz共同推動了導致推理突破的最初想法。
當然，奧特曼對他們如此高評價或許還有另一個原因：
在2023年OpenAI內亂事件中，他倆也是帶頭站出來宣布辭職，要追隨奧特曼離開的。
從高中同窗到OpenAI重聚故事還要從波蘭的一所學校說起，格丁尼亞第三高中。
在那里兩人跟隨同一位老師學習計算機，接受的教育深度遠超普通高中課程，涉及圖論等內容。
兩人第一次相遇是在編程夏令營，每年他們要在夏令營做兩個月高強度訓練。
不過后來他們回憶，兩人在高中時關系還沒那么好，只算學業上的同伴。離開高中后一同在美國闖蕩，才讓他們建立深厚友誼。

先說Pachocki（以下簡稱帕哥）這邊。
15歲的時候，他像很多少年一樣還不確定自己未來想做什么。
父親給了他一本書，是YC聯合創始人保羅·格雷厄姆散文集《黑客與畫家》的波蘭語譯本。
給帕哥觸動最深的是書中這樣的描寫：黑客和畫家的共同點在于，他們都是創造者。
與作曲家、建筑師和作家一樣，黑客和畫家努力做的是創造美好的事物。他們本質上并非在進行研究，但如果在嘗試創造美好事物的過程中發現了一些新技術，那就更好了。

帕哥很幸運，不僅發現自己對計算機有興趣，不久后還發現自己在這方面是真的有天賦：高中時期拿過國際信息學奧林匹克競賽IOI的銀牌。

話說回來，奧特曼本曼的職業道路也是受到格雷厄姆影響很深，不過是創投事業的那一面。
在8月份的OpenAI播客節目中，帕哥表示現在想想整件事還挺好笑的，當時真的沒有把這些聯系起來。
高中畢業后，帕哥來到波蘭華沙大學讀計算機專業，在本科期間又拿過許多競賽獎項。
2012年ICM-ICPC的金牌和Google Code Jam ，至今仍然能搜到他在ICPC的獲獎感言片段。

△中：Jakub Pachocki
本科畢業后他來到卡耐基梅隆大學攻讀計算機科學博士學位。
對于AI ，他原以為真正能做到推理的AI需要很長時間才能開發出來，需要更大的計算機和非常扎實的數學基礎。

但2016年的AlphaGo改變了一切。
圍棋的搜索空間太大了，我們的算法根本無法應對。但他們用深度學習解決了這個問題，這迫使我重新思考。
畢業后帕哥先在哈佛大學做了一年博士后之后， 2017年2月就加入了OpenAI 。

再來看Sidor（以下簡稱西哥）這邊，讓他堅定研究強化學習的也是AplphaGo ，不過青少年時期給他啟發最大的是《鋼鐵俠》電影。
高中畢業后，他本科先去的英國讀劍橋大學，博士就讀于MIT 。
但不是他主動選擇了MIT ，而是他當時申請了很多美國學校，只有MIT沒有拒絕他，因為MIT不考英語，而他的英語很差（允悲）。
一開始他選擇的是機器人專業，不過很快他就對現實中的機器人并沒有電影里那么炫酷感到失望了，轉而學習深度學習和強化學習。

最終畢業時他的論文課題是“自然語言處理中多階段推理的強化學習方法” ，這個題目拿到現在當成最新的大模型研究題目都沒問題。
只不過當時西哥的研究對象是LSTM模型、Deep Q-learning強化學習算法，多階段推理任務指的是句子打亂重排序問題。

博士畢業后，他受AlphaGo影響，先申請的DeepMind崗位，不過面試時被問到很多理論機器學習問題，他一個都不會就掛掉了。
盡管當時OpenAI還是個名不見經傳的小公司，但看起來對做強化學習這件事很認真，西哥就加入了。
2017年，兩個波蘭人在OpenAI重聚。
加入OpenAI后不久，兩人投入到Dota 2項目中，目標是讓AI在復雜的電子競技游戲中擊敗人類職業選手。

△Dota項目早期訪談，右：Szymon SIdor
他們原本想通過這個項目找到強化學習的極限在哪里，到什么程度會失效，結果卻大獲成功，擊敗人類職業選手隊伍創造了歷史。
代價是兩人都失去了發際線。

在這個項目中，帕哥專注于大規模強化學習與優化，而西哥參與開發了分布式訓練系統和持續訓練工具。
兩人的合作模式在這個項目中逐漸成型。
帕哥會在辦公室或公寓里走來走去，深入思考應該如何研究一個現象。而西哥更傾向于直接開干，先整出一些數據再說。
這種一個深度思考、一個動手實驗的組合，成為他們的制勝法寶。
到了GPT-4的開發階段，帕哥已經成為項目的領導者。奧特曼曾公開表示：”如果沒有他的貢獻，我們無法取得今天的成就。 ”

西哥的角色非常靈活，他將自己定位為“獨立貢獻者” ，只是偶爾承擔領導職責，核心是去做最有價值的事。
危機時刻見真章2023年11月的OpenAI內亂危機，讓這對搭檔的分量徹底顯現出來。
11月17日中午，正在吃午飯的兩人收到了奧特曼被解職的消息。
西哥回憶到，當時他正在走廊里思考問題，收到消息馬上去找帕哥。帕哥正在與別人討論一個一個很深入問題。西哥很粗魯地打斷了他們，給他們看公告內容。
帕哥的反應非常果斷，立即走出大樓給奧特曼打電話詢問到底發生了什么，電話那頭的奧特曼同樣困惑。
后來兩人步調一致，與Aleksander Madry一起率先宣布辭職，要追隨奧特曼一起加入微軟，也正是他們堅定的支持成為促使Altman回歸的關鍵因素之一。

這次危機給兩人帶來了深刻的教訓。帕哥感慨：
直到那一刻，我才真正意識到治理結構有多重要。我們建設了近十年的東西，突然間就可能面臨劇變。
對此西哥也有同感， “當初設立這些治理結構時，感覺像是殺雞用牛刀” ，而現在他得到的教訓是“在公司早期做出的決策，即使當時看起來微不足道，也可能在未來產生深遠影響” 。
后來事情暫告一段落之后，帕哥正式接棒Ilya成為首席科學家，主要職責是為公司制定研究路線圖，并確立長期的技術愿景。

他認為深度學習盡管基于數學，但更像是一門自然科學，研究者需要通過實驗去理解其內在現象。
他未來的目標是構建能夠進行自主科學研究的AI系統，認為這種系統將在不遠的將來成為”持久的實體” ，并有望解決AI對齊等行業難題。
西哥繼續保持著獨立貢獻者的角色，他的社交媒體簽名是“一行一行代碼地構建AGI” 。

對他倆的搭檔關系，奧特曼有感而發：
我聽說過一些兩個人能夠完美互補的合作關系，但能夠見證這種合作關系多年來的演變，真的非常特別。

而奧特曼給他們的最新評價是：OpenAI還沒有遇到過他們無法解決的問題。

這里面或許既指研究上的問題，也暗含管理上的問題。

【奧特曼：點名表揚兩個波蘭人，OpenAI還沒有過他們解決不了的問題】參考鏈接：[1
https://blog.samaltman.com/jakub-and-szymon[2
https://www.youtube.com/watch?v=yBzStBK6Z8c[3
https://www.youtube.com/watch?v=LauSf7HoxwM

奧特曼：點名表揚兩個波蘭人，OpenAI還沒有過他們解決不了的問題

推薦閱讀

清算報告需要注明的內容有哪一些

惻隱之心仁之端也啥意思

無糖糖漿是什么東西

吃荷蘭豆的好處有哪些荷蘭豆多吃有什么壞處

oppoa95怎么關閉usb調試

艾爾登法環阿根廷區漲價了嗎阿根廷漲價分享

支付寶68元消費券怎么領

海棠花秋季的養殖方法

cs1.5怎么加人機器人快捷鍵

聚乙烯粉料潮濕易交聯嗎

兩個小故事，與生活攜手的文章，直面世俗一角

中國南方與北方具體分界線是怎樣的在供暖問題上，對南方不供暖的介定好象不合理

政府如何彌補市場缺陷,如何彌補市場不足

分享蘋果8p掉幀的具體處理方法。

釣2050斤的魚用什么主線和子線，釣鯉魚用幾號線組

紅瑰寶是紅木嗎