OpenAI最大失誤：放走這位MIT學霸！美國AI三朝元老，現實韋小寶_anthropic|創業|人工智能

文章圖片

文章圖片

文章圖片

文章圖片

文章圖片

文章圖片

文章圖片

文章圖片

文章圖片

文章圖片

編輯：KingHZ
【新智元導讀】AI時代的基建狂潮來了！Anthropic聯合創始人Tom Brown直言：人類正踏上一場規模超越阿波羅登月、曼哈頓計劃的算力競賽。他，曾經線代只考70多， 6月自學成才，加入OpenAI打造GPT-3 ，創立Anthropic……一路開掛堪比韋小寶，他正是AI時代最燃的注腳！
AI算力競賽，比阿波羅更龐大，比曼哈頓更瘋狂！
Anthropic聯合創始人Tom Brown直言， AI基礎設施的規模超越阿波羅與曼哈頓計劃。
AGI算力投入正瘋狂膨脹，每年增速高達3倍。
明年，這個增長勢頭確定無疑；但到了2027到2028年，不確定性稍高。
Tom Brown ，或許并不如奧特曼、馬斯克那樣家喻戶曉，但在AI圈，他是被低估的傳奇。
特別的是，他自學成才——從線性代數只考了B-的學生，硬是成長為推動通用人工智能突破的核心人物。
在OpenAI協助打造了GPT-3之后，他和OpenAI志同道合的同事，另立山頭，共同創立了Anthropic 。

當剛起步時，他們完全看不出會成功:
OpenAI擁有十億美元的資金，還有一群明星科學家；
而Anthropic只有七個聯合創始人（見下圖），硬著頭皮起步，連能否做出產品、產品會是什么樣都沒譜。

如今， Anthropic的Claude ，已經成為全球開發者的首選。
在Anthropic ，他主導著他稱之為「人類史上最大規模的基礎設施建設」——一場比阿波羅登月、曼哈頓計劃更龐大的算力競賽。
在硅谷的「黃埔軍校」YC的Lightcone Podcast「光錐播客」節目中， Tom Brown首次全面講述了自己的非典型人生歷程。他還分享了對年輕工程師的肺腑之言。

這場訪談完整回顧了Tom Brown的創業與研究歷程：

畢業即創業，體會「狼性」文化；
在Grouper遭遇失敗，轉向AI自學；
厚臉皮聯系Greg Brockman ，進入OpenAI；
參與GPT-3訓練基礎設施，見證scaling law的力量；
與OpenAI團隊決裂，創立Anthropic；
推出Claude ，并在Claude 3.5/3.7迎來市場轉折；
打磨Claude Code ，意外成為爆款應用；
負責超大規模的算力與硬件基礎設施；
最后強調：年輕人要勇敢冒險，追隨內心使命，而不是追名逐利（chasing credentials）。

MIT學霸創業踩坑錄
主持人問：21歲從MIT畢業， Tom進入科技行業，從2009年到今天，怎么一路走到聯合創辦Anthropic這樣重要的公司？

他追憶了他的來時路。
21歲從MIT的計算機專業畢業后，放棄巨頭offer ，他加入朋友初創公司Linked Language ，首次體驗「狼性」創業文化。
畢業即創業，他直言這段經歷改變了他的心態：
在學校里，別人給我布置任務，我就完成任務，就像一只等著被喂食的狗。

但在創業公司，我們更像狼——必須自己去獵食，不然孩子會餓死。
這種轉變給了他勇氣直面更大更難的事。
之后， Tom去了移動廣告平臺Mopub ，是第一號工程師。雖然想當「狼」，但那時編程水平其實很差，他常常覺得自己跟不上。但這段經歷讓他學到了如何把東西拓展。
之后，他卻連續踩坑：

第一次當CEO：做「比Heroku更靈活」的DevOps平臺，結果連自己都說不清要做什么。
第二次做約會App：YC之父Paul Graham把他介紹給Grouper ，被Tinder直接降維打擊，邊燒光錢邊靠「每周帶團隊去相親」續命。

對Tom來說， Grouper的吸引力在于：本來，他非常笨拙、害羞，特別希望有個平臺能讓他在朋友陪伴下去認識女生，這樣會更安全。
唯一比他還常去Grouper約會的人是Greg Brockman 。他一度幾乎每周都在社交軟件上發「這周誰去Grouper？」。

Greg Brockman：OpenAI聯創、現任OpenAI主席
他們也成了好朋友，這也成為他之后進入OpenAI的重要人脈。
在Grouper ，他被搞得身心俱疲：創業的高潮讓人興奮，但低谷也極度痛苦。
回頭看， Tinder的方案比他們好得多， Grouper的使命被超越了。
業務下滑、收入減少，但Tom仍在招工程師，不斷推銷一個連自己都不再相信的夢想——那種感覺簡直像「死亡行軍」。
所以那段時間，他并沒有立刻投入研究，而是先「晃蕩」了一陣子。
比如，去做瑜伽、CrossFit ，甚至花三個月造了一輛「藝術車」開去Burning Man藝術節，洗去一身「班味」。

六月自學AI
「走后門」加入OpenAI
他猶豫了很久是否要轉型去做AI研究：
也許，我們這輩人就會遇到顛覆性人工智能（Transformative AI）的出現，如果真發生，那是人類最重大的事件。

或許我能幫上點忙。但我大學線性代數才考了B-（差點是C+），這種水平能行嗎？
2015年， Tom離開了Grouper ，但一直到一年后才加入了OpenAI 。
那時，想要搞AI研究，大家覺得你必須是頂尖學霸才有資格。所以，他不確定能否勝任，加上之前創業有所成就，他一度想干脆再去做個新創業項目算了。
他的朋友們聽說他要去做AI研究，都覺得很怪，甚至有點糟糕。他們說：「AI安全？聽起來就像火星人口過剩一樣荒謬！」
他們都懷疑Tom不一定適合干這事。所以他足足猶豫了半年，才慢慢鼓起勇氣去嘗試。
玩了三個月后，他逼自己進入「隱身學習模式」六個月，好讓自己有機會進到頂尖實驗室。
當時只有三個選擇：DeepMind、谷歌Brain、MIRI（機器智能研究院）。但他完全沒技術積累，只能靠自學。
那是2015年，深度學習剛火起來，他的主要計劃是：

在Coursera上自學機器學習課程；
做一些Kaggle項目；
讀《Linear Algebra Done Right》；
翻一本統計學教材；
甚至用YC校友點數買了一塊GPU ， SSH遠程上去跑實驗。

為了進入OpenAI ，他一開始就厚著臉皮去找Greg Brockman ，畢竟那時OpenAI團隊里大多是研究員，陣容強大。

OpenAI宣布成立的當天， Tom就給Brockman發消息：「我線性代數才B- ，但會一點工程，懂一些分布式系統。要是能幫上忙，哪怕掃地拖地我都愿意。」
Greg覺得懂機器學習又懂分布式系統的人太少了， Tom是個鬼才。
于是把Tom介紹給Pieter Abbeel ，幫他整理學習計劃。

Pieter Abbeel是加州大學伯克利分校的教授，專攻機器人學習領域。 2016年4月26日，他從伯克利休假，全職加入了OpenAI
后來， Tom每個月都去跟進學習，終于等到一個機會：OpenAI想做游戲環境，需要人幫忙搭建星際爭霸（StarCraft）環境。于是他加入項目。
當時， OpenAI落腳在舊金山的Dandelion 巧克力工廠樓上，還有馬斯克承諾的十億美元資金，創業氛圍十足。

之后的一個關鍵節點是：他開始負責訓練GPT模型的工程系統。
GPT-2還在TPU上訓練，而GPT-3的重大突破是切換到GPU并使用更多算力。
在OpenAI干了一年，他中間離開去Google Brain待了一年，后來又回到OpenAI 。

他恰好碰上GPT-3的訓練期（2018–2019）。
那時大家已經意識到Scaling Law的力量：只要用對方法，算力越多，智能就越強。

Dario Amodei發表了著名的Scaling Law論文，證明了這一趨勢。
Danny Hernandez的研究顯示，算法效率提升也在持續降低成本。

這兩股力量疊加，讓OpenAI看清未來幾年智能水平會爆炸式提升。
當時他最震撼的是：那條直線跨越了12個數量級——從小模型到超級大模型，全都穩定對齊在同一條線。
這么長的數量級跨度，在其他科學領域都沒見過。于是Tom完全轉向做scaling相關工作。
當然，當時學界很多人還在批評OpenAI ，說「你們只是在堆GPU ，太粗暴，沒技術含量」。有人甚至形容這就是「愚蠢但有效」的辦法。
如今看來，正是這條「笨辦法」推動了智能的飛躍。

分道揚鑣，自立門戶
Tom待過OpenAI、谷歌DeepMind和Anthropic ，可謂美國AI界的「三朝元老」。
Tom原本是從GPT-3團隊的一員，到底為何與OpenAI決裂？
這與與Amodei兄妹難脫關系。

當時， OpenAI負責safety和scaling的團隊向Daniela、Dario Amodei兄妹報告。
兩支團隊合作默契，而且都堅信：
Scaling Law必然會帶來顛覆，最終人類將不得不把某種控制權移交給通用人工智能（AGI）。如果運氣好，它會與人類目標保持一致，帶來順利的過渡；如果運氣不好，后果可能極為嚴重。

因此我們必須建立一個能夠承擔這種重任的機構。
這就是他們自立門戶核心原因。
Tom坦承當時并不確定這是對世界最好的選擇。回頭看，結果證明這是明智的。
早期加入Anthropic的人都是抱著「使命」來的。他們本可以去更體面、更賺錢的地方，但選擇了Anthropic ，因為他們相信這件事值得做。
這也成為公司文化的基石：前100名員工幾乎都是因使命而來。

Anthropic的Linkedin主頁介紹
正因如此，直到今天Anthropic已有2000多人，政治斗爭依舊沒能滲入。如果有人覺得某個行為偏離使命，他們會直接站出來指出來。

Claude拿下開發者， ChatGPT干瞪眼
大概在ChatGPT推出前9個月， Anthropic推出了第一個產品Slack機器人Claude 1 。
初期， Anthropic還猶豫是否發布產品，專注于研究和基礎設施。 ChatGPT的發布是一個催化劑，促使Anthropic推出API和Claude AI 。
Claude 3.5 Sonnet特別是Claude Code是其關鍵轉折點，獲得了巨大的市場認可。
2023年，幾乎所有創業者都在用OpenAI 。
但到2024年， Claude 3.5尤其是Sonnet版本開始迅速搶占市場份額。
尤其在編程場景里，從個位數一路升到20%、30% ，甚至現在可能80%、90%的創始人更偏好Claude 。

國外某投行LLM報告：https://menlovc.com/perspective/2025-mid-year-llm-market-update/
就像OpenAI當初沒準備好ChatGPT的爆紅一樣， Claude 3.7 Sonnet同樣讓Anthropic驚訝——它意外解鎖了「智能體式編程」的能力。
每一次迭代， Claude的新能力驚艷眾人。

Claude Code的誕生
「心智切換」理論
YC的創業者調研顯示，大家在編程上更喜歡用Anthropic的模型，這種偏好遠超基準測試結果能解釋的范圍。為什么會這樣？是有意為之，還是自然涌現？
Tom覺得主要原因是——不「刷榜」。
其他大實驗室都有專門團隊，盯著基準測試題庫做針對性優化，目標就是讓分數更好看。但我們沒有這樣的團隊，所以反而避免了訓練集和測試集的過擬合。
Anthropic內部當然也有自己的評測指標，但不會對外公布。團隊主要盯著內部benchmark去優化，同時大量「dogfooding」（內部自用）——比如讓Claude來加速自己的工程師工作，這是最高優先級。
最近， Claude Code特別成功。主持人問起了它的起源，沒想到Claude Code最初只是個無心之作。
工程師Boris Cherny為了幫團隊寫代碼，臨時拼湊出來的內部小工具。
一開始， Anthropic的戰略是：只做API ，不碰應用。因為他們覺得，外部創業公司有無數點子，肯定更懂產品。所以他們全力把API打磨到最好，讓開發者去構建應用。
結果Claude Code出乎意料地跑了出來，作為一個產品，它居然比市面上的替代品更好用。
對此， Tom有個「心智切換」理論——把Claude本身當成「用戶」來對待。

在Linked Language ，用戶是老師；
在Grouper ，用戶是紐約的單身青年；
在Claude Code ，用戶既是開發者，也是Claude自身。

所以團隊的思路是：給Claude配備最合適的工具和上下文，讓它更高效地幫助人類完成任務。
這是一種「以模型為中心」的思維方式，對Anthropic而言卻格外自然。

人生忠告
如果今天有一個「年輕版的你」——20多歲，正想進入AI領域，想搭上這班快車，你會給他什么建議？
Tom會說——要敢于冒更多風險。
選擇那些即使失敗，朋友們也會覺得你很酷、很欽佩的項目。或者，你理想中的那個更好的自己，會為之驕傲的事情。去做這樣的事，而不是一味追逐所謂的「安全路徑」。
主持人最后問了大學生常見的困惑：到底要不要繼續上學？未來還有沒有工作？世界會怎么變？
Tom的建議是：
不要太在意外部的標簽（比如學位、證書、去大廠）。

內在驅動比外在驅動更重要。

如果只是為了拿一個文憑，或者去FAANG公司（Facebook、Apple、Amazon、Netflix、Google）混一份工作，那已經沒什么意義了。

【OpenAI最大失誤：放走這位MIT學霸！美國AI三朝元老，現實韋小寶】現在的世界變化太快，靠「傳統路徑」已經不再是優勢。真正的價值，是你能不能在朋友心中、在自己心里，都覺得「我做了一件了不起的事情」。