OpenAI最大失誤:放走這位MIT學霸!美國AI三朝元老,現實韋小寶

OpenAI最大失誤:放走這位MIT學霸!美國AI三朝元老,現實韋小寶

文章圖片

OpenAI最大失誤:放走這位MIT學霸!美國AI三朝元老,現實韋小寶

文章圖片

OpenAI最大失誤:放走這位MIT學霸!美國AI三朝元老,現實韋小寶

文章圖片

OpenAI最大失誤:放走這位MIT學霸!美國AI三朝元老,現實韋小寶

文章圖片

OpenAI最大失誤:放走這位MIT學霸!美國AI三朝元老,現實韋小寶

文章圖片

OpenAI最大失誤:放走這位MIT學霸!美國AI三朝元老,現實韋小寶

文章圖片

OpenAI最大失誤:放走這位MIT學霸!美國AI三朝元老,現實韋小寶

文章圖片

OpenAI最大失誤:放走這位MIT學霸!美國AI三朝元老,現實韋小寶

文章圖片

OpenAI最大失誤:放走這位MIT學霸!美國AI三朝元老,現實韋小寶

文章圖片

OpenAI最大失誤:放走這位MIT學霸!美國AI三朝元老,現實韋小寶

文章圖片

編輯:KingHZ
【新智元導讀】AI時代的基建狂潮來了!Anthropic聯合創始人Tom Brown直言:人類正踏上一場規模超越阿波羅登月、曼哈頓計劃的算力競賽 。 他 , 曾經線代只考70多 , 6月自學成才 , 加入OpenAI打造GPT-3 , 創立Anthropic……一路開掛堪比韋小寶 , 他正是AI時代最燃的注腳!
AI算力競賽 , 比阿波羅更龐大 , 比曼哈頓更瘋狂!
Anthropic聯合創始人Tom Brown直言 , AI基礎設施的規模超越阿波羅與曼哈頓計劃 。
AGI算力投入正瘋狂膨脹 , 每年增速高達3倍 。
明年 , 這個增長勢頭確定無疑;但到了2027到2028年 , 不確定性稍高 。
Tom Brown , 或許并不如奧特曼、馬斯克那樣家喻戶曉 , 但在AI圈 , 他是被低估的傳奇 。
特別的是 , 他自學成才——從線性代數只考了B-的學生 , 硬是成長為推動通用人工智能突破的核心人物 。
在OpenAI協助打造了GPT-3之后 , 他和OpenAI志同道合的同事 , 另立山頭 , 共同創立了Anthropic 。

當剛起步時 , 他們完全看不出會成功:
OpenAI擁有十億美元的資金 , 還有一群明星科學家;
而Anthropic只有七個聯合創始人(見下圖) , 硬著頭皮起步 , 連能否做出產品、產品會是什么樣都沒譜 。

如今 , Anthropic的Claude , 已經成為全球開發者的首選 。
在Anthropic , 他主導著他稱之為「人類史上最大規模的基礎設施建設」——一場比阿波羅登月、曼哈頓計劃更龐大的算力競賽 。
在硅谷的「黃埔軍校」YC的Lightcone Podcast「光錐播客」節目中 , Tom Brown首次全面講述了自己的非典型人生歷程 。 他還分享了對年輕工程師的肺腑之言 。

這場訪談完整回顧了Tom Brown的創業與研究歷程:

  • 畢業即創業 , 體會「狼性」文化;
  • 在Grouper遭遇失敗 , 轉向AI自學;
  • 厚臉皮聯系Greg Brockman , 進入OpenAI;
  • 參與GPT-3訓練基礎設施 , 見證scaling law的力量;
  • 與OpenAI團隊決裂 , 創立Anthropic;
  • 推出Claude , 并在Claude 3.5/3.7迎來市場轉折;
  • 打磨Claude Code , 意外成為爆款應用;
  • 負責超大規模的算力與硬件基礎設施;
  • 最后強調:年輕人要勇敢冒險 , 追隨內心使命 , 而不是追名逐利(chasing credentials) 。

MIT學霸創業踩坑錄
主持人問:21歲從MIT畢業 , Tom進入科技行業 , 從2009年到今天 , 怎么一路走到聯合創辦Anthropic這樣重要的公司?

他追憶了他的來時路 。
21歲從MIT的計算機專業畢業后 , 放棄巨頭offer , 他加入朋友初創公司Linked Language , 首次體驗「狼性」創業文化 。
畢業即創業 , 他直言這段經歷改變了他的心態:
在學校里 , 別人給我布置任務 , 我就完成任務 , 就像一只等著被喂食的狗 。


但在創業公司 , 我們更像狼——必須自己去獵食 , 不然孩子會餓死 。
這種轉變給了他勇氣直面更大更難的事 。
之后 , Tom去了移動廣告平臺Mopub , 是第一號工程師 。 雖然想當「狼」 , 但那時編程水平其實很差 , 他常常覺得自己跟不上 。 但這段經歷讓他學到了如何把東西拓展 。
之后 , 他卻連續踩坑:
  • 第一次當CEO:做「比Heroku更靈活」的DevOps平臺 , 結果連自己都說不清要做什么 。
  • 第二次做約會App:YC之父Paul Graham把他介紹給Grouper , 被Tinder直接降維打擊 , 邊燒光錢邊靠「每周帶團隊去相親」續命 。

對Tom來說 , Grouper的吸引力在于:本來 , 他非常笨拙、害羞 , 特別希望有個平臺能讓他在朋友陪伴下去認識女生 , 這樣會更安全 。
唯一比他還常去Grouper約會的人是Greg Brockman 。 他一度幾乎每周都在社交軟件上發「這周誰去Grouper?」 。

Greg Brockman:OpenAI聯創、現任OpenAI主席
他們也成了好朋友 , 這也成為他之后進入OpenAI的重要人脈 。
在Grouper , 他被搞得身心俱疲:創業的高潮讓人興奮 , 但低谷也極度痛苦 。
回頭看 , Tinder的方案比他們好得多 , Grouper的使命被超越了 。
業務下滑、收入減少 , 但Tom仍在招工程師 , 不斷推銷一個連自己都不再相信的夢想——那種感覺簡直像「死亡行軍」 。
所以那段時間 , 他并沒有立刻投入研究 , 而是先「晃蕩」了一陣子 。
比如 , 去做瑜伽、CrossFit , 甚至花三個月造了一輛「藝術車」開去Burning Man藝術節 , 洗去一身「班味」 。


六月自學AI
「走后門」加入OpenAI
他猶豫了很久是否要轉型去做AI研究:
也許 , 我們這輩人就會遇到顛覆性人工智能(Transformative AI)的出現 , 如果真發生 , 那是人類最重大的事件 。


或許我能幫上點忙 。 但我大學線性代數才考了B-(差點是C+) , 這種水平能行嗎?
2015年 , Tom離開了Grouper , 但一直到一年后才加入了OpenAI 。
那時 , 想要搞AI研究 , 大家覺得你必須是頂尖學霸才有資格 。 所以 , 他不確定能否勝任 , 加上之前創業有所成就 , 他一度想干脆再去做個新創業項目算了 。
他的朋友們聽說他要去做AI研究 , 都覺得很怪 , 甚至有點糟糕 。 他們說:「AI安全?聽起來就像火星人口過剩一樣荒謬!」
他們都懷疑Tom不一定適合干這事 。 所以他足足猶豫了半年 , 才慢慢鼓起勇氣去嘗試 。
玩了三個月后 , 他逼自己進入「隱身學習模式」六個月 , 好讓自己有機會進到頂尖實驗室 。
當時只有三個選擇:DeepMind、谷歌Brain、MIRI(機器智能研究院) 。 但他完全沒技術積累 , 只能靠自學 。
那是2015年 , 深度學習剛火起來 , 他的主要計劃是:
  • 在Coursera上自學機器學習課程;
  • 做一些Kaggle項目;
  • 讀《Linear Algebra Done Right》;
  • 翻一本統計學教材;
  • 甚至用YC校友點數買了一塊GPU , SSH遠程上去跑實驗 。
為了進入OpenAI , 他一開始就厚著臉皮去找Greg Brockman , 畢竟那時OpenAI團隊里大多是研究員 , 陣容強大 。

OpenAI宣布成立的當天 , Tom就給Brockman發消息:「我線性代數才B- , 但會一點工程 , 懂一些分布式系統 。 要是能幫上忙 , 哪怕掃地拖地我都愿意 。 」
Greg覺得懂機器學習又懂分布式系統的人太少了 , Tom是個鬼才 。
于是把Tom介紹給Pieter Abbeel , 幫他整理學習計劃 。

Pieter Abbeel是加州大學伯克利分校的教授 , 專攻機器人學習領域 。 2016年4月26日 , 他從伯克利休假 , 全職加入了OpenAI
后來 , Tom每個月都去跟進學習 , 終于等到一個機會:OpenAI想做游戲環境 , 需要人幫忙搭建星際爭霸(StarCraft)環境 。 于是他加入項目 。
當時 , OpenAI落腳在舊金山的Dandelion 巧克力工廠樓上 , 還有馬斯克承諾的十億美元資金 , 創業氛圍十足 。

之后的一個關鍵節點是:他開始負責訓練GPT模型的工程系統 。
GPT-2還在TPU上訓練 , 而GPT-3的重大突破是切換到GPU并使用更多算力 。
在OpenAI干了一年 , 他中間離開去Google Brain待了一年 , 后來又回到OpenAI 。

他恰好碰上GPT-3的訓練期(2018–2019) 。
那時大家已經意識到Scaling Law的力量:只要用對方法 , 算力越多 , 智能就越強 。
  • Dario Amodei發表了著名的Scaling Law論文 , 證明了這一趨勢 。
  • Danny Hernandez的研究顯示 , 算法效率提升也在持續降低成本 。
這兩股力量疊加 , 讓OpenAI看清未來幾年智能水平會爆炸式提升 。
當時他最震撼的是:那條直線跨越了12個數量級——從小模型到超級大模型 , 全都穩定對齊在同一條線 。
這么長的數量級跨度 , 在其他科學領域都沒見過 。 于是Tom完全轉向做scaling相關工作 。
當然 , 當時學界很多人還在批評OpenAI , 說「你們只是在堆GPU , 太粗暴 , 沒技術含量」 。 有人甚至形容這就是「愚蠢但有效」的辦法 。
如今看來 , 正是這條「笨辦法」推動了智能的飛躍 。

分道揚鑣 , 自立門戶
Tom待過OpenAI、谷歌DeepMind和Anthropic , 可謂美國AI界的「三朝元老」 。
Tom原本是從GPT-3團隊的一員 , 到底為何與OpenAI決裂?
這與與Amodei兄妹難脫關系 。

當時 , OpenAI負責safety和scaling的團隊向Daniela、Dario Amodei兄妹報告 。
兩支團隊合作默契 , 而且都堅信:
Scaling Law必然會帶來顛覆 , 最終人類將不得不把某種控制權移交給通用人工智能(AGI) 。 如果運氣好 , 它會與人類目標保持一致 , 帶來順利的過渡;如果運氣不好 , 后果可能極為嚴重 。


因此我們必須建立一個能夠承擔這種重任的機構 。
這就是他們自立門戶核心原因 。
Tom坦承當時并不確定這是對世界最好的選擇 。 回頭看 , 結果證明這是明智的 。
早期加入Anthropic的人都是抱著「使命」來的 。 他們本可以去更體面、更賺錢的地方 , 但選擇了Anthropic , 因為他們相信這件事值得做 。
這也成為公司文化的基石:前100名員工幾乎都是因使命而來 。

Anthropic的Linkedin主頁介紹
正因如此 , 直到今天Anthropic已有2000多人 , 政治斗爭依舊沒能滲入 。 如果有人覺得某個行為偏離使命 , 他們會直接站出來指出來 。

Claude拿下開發者 , ChatGPT干瞪眼
大概在ChatGPT推出前9個月 , Anthropic推出了第一個產品Slack機器人Claude 1 。
初期 , Anthropic還猶豫是否發布產品 , 專注于研究和基礎設施 。 ChatGPT的發布是一個催化劑 , 促使Anthropic推出API和Claude AI 。
Claude 3.5 Sonnet特別是Claude Code是其關鍵轉折點 , 獲得了巨大的市場認可 。
2023年 , 幾乎所有創業者都在用OpenAI 。
但到2024年 , Claude 3.5尤其是Sonnet版本開始迅速搶占市場份額 。
尤其在編程場景里 , 從個位數一路升到20%、30% , 甚至現在可能80%、90%的創始人更偏好Claude 。

國外某投行LLM報告:https://menlovc.com/perspective/2025-mid-year-llm-market-update/
就像OpenAI當初沒準備好ChatGPT的爆紅一樣 , Claude 3.7 Sonnet同樣讓Anthropic驚訝——它意外解鎖了「智能體式編程」的能力 。
每一次迭代 , Claude的新能力驚艷眾人 。

Claude Code的誕生
「心智切換」理論
YC的創業者調研顯示 , 大家在編程上更喜歡用Anthropic的模型 , 這種偏好遠超基準測試結果能解釋的范圍 。 為什么會這樣?是有意為之 , 還是自然涌現?
Tom覺得主要原因是——不「刷榜」 。
其他大實驗室都有專門團隊 , 盯著基準測試題庫做針對性優化 , 目標就是讓分數更好看 。 但我們沒有這樣的團隊 , 所以反而避免了訓練集和測試集的過擬合 。
Anthropic內部當然也有自己的評測指標 , 但不會對外公布 。 團隊主要盯著內部benchmark去優化 , 同時大量「dogfooding」(內部自用)——比如讓Claude來加速自己的工程師工作 , 這是最高優先級 。
最近 , Claude Code特別成功 。 主持人問起了它的起源 , 沒想到Claude Code最初只是個無心之作 。
工程師Boris Cherny為了幫團隊寫代碼 , 臨時拼湊出來的內部小工具 。
一開始 , Anthropic的戰略是:只做API , 不碰應用 。 因為他們覺得 , 外部創業公司有無數點子 , 肯定更懂產品 。 所以他們全力把API打磨到最好 , 讓開發者去構建應用 。
結果Claude Code出乎意料地跑了出來 , 作為一個產品 , 它居然比市面上的替代品更好用 。
對此 , Tom有個「心智切換」理論——把Claude本身當成「用戶」來對待 。
  • 在Linked Language , 用戶是老師;
  • 在Grouper , 用戶是紐約的單身青年;
  • 在Claude Code , 用戶既是開發者 , 也是Claude自身 。
所以團隊的思路是:給Claude配備最合適的工具和上下文 , 讓它更高效地幫助人類完成任務 。
這是一種「以模型為中心」的思維方式 , 對Anthropic而言卻格外自然 。

人生忠告
如果今天有一個「年輕版的你」——20多歲 , 正想進入AI領域 , 想搭上這班快車 , 你會給他什么建議?
Tom會說——要敢于冒更多風險 。
選擇那些即使失敗 , 朋友們也會覺得你很酷、很欽佩的項目 。 或者 , 你理想中的那個更好的自己 , 會為之驕傲的事情 。 去做這樣的事 , 而不是一味追逐所謂的「安全路徑」 。
主持人最后問了大學生常見的困惑:到底要不要繼續上學?未來還有沒有工作?世界會怎么變?
Tom的建議是:
不要太在意外部的標簽(比如學位、證書、去大廠) 。


內在驅動比外在驅動更重要 。


如果只是為了拿一個文憑 , 或者去FAANG公司(Facebook、Apple、Amazon、Netflix、Google)混一份工作 , 那已經沒什么意義了 。

【OpenAI最大失誤:放走這位MIT學霸!美國AI三朝元老,現實韋小寶】現在的世界變化太快 , 靠「傳統路徑」已經不再是優勢 。 真正的價值 , 是你能不能在朋友心中、在自己心里 , 都覺得「我做了一件了不起的事情」 。

    推薦閱讀