
文章圖片

文章圖片

文章圖片

文章圖片

文章圖片

文章圖片

文章圖片
那個站在 LLM 風口上唱反調(diào)的倔老頭 , 可能要離開 Meta 了 。
硅谷大佬出走創(chuàng)業(yè) , 三天兩頭就有一樁 , 但要出走的 Yann LeCun 不一樣 , 他是能讓扎克伯格親自登門的重量級人物 , 是深度學習三巨頭之一 , 圖靈獎得主 , Meta AI Research 的開山祖師 。
更重要的是 , 他這些年一直在干一件特別擰巴的事:站在全世界最熱鬧的 LLM 路線門口 , 舉著牌子說「這幫人走錯路了」 。
現(xiàn)在《金融時報》傳出他要離職 , 說他在籌備自己的初創(chuàng)公司 , 已經(jīng)開始接觸投資人了 。 注意 , 目前只是風聲 , 言之鑿鑿地說 LeCun 已經(jīng)離職創(chuàng)業(yè) , 這顯然是不嚴謹?shù)?。
只是 , 截至發(fā)稿前 , 面對鋪天蓋地的報道 , Yann LeCun 本人還沒吭聲 , 這沉默本身 , 就很說明問題 。
從三顧茅廬到分道揚鑣 , 這十二年到底發(fā)生了什么?
2013 年那場豪賭 , 扎克伯格賭對了嗎?Lecun 與 Meta 故事得從 2013 年說起 。
那段時間 , 正是深度學習蓬勃興起的階段 。 2012 年 , Geoffrey Hinton 與其學生 Alex Krizhevsky、Ilya Sutskever 提交的 AlexNet 在 ILSVRC-2012 一騎絕塵 , top-5 錯誤率約 15.3% , 這個突破讓整個學術(shù)界和工業(yè)界都看到了神經(jīng)網(wǎng)絡(luò)的潛力 。
然后就是科技巨頭們的搶人大戰(zhàn)——谷歌花大價錢收購了 Hinton 所在的創(chuàng)業(yè)公司 DNNresearch , 順帶把老爺子本人也挖走了;微軟研究院也在瘋狂擴張 AI 團隊 。
【65 歲圖靈獎得主終于不用向 28 歲輟學生匯報了,小扎是怎么把他氣走的】扎克伯格坐不住了 。
Facebook(現(xiàn)為 Meta)當時正在從 PC 互聯(lián)網(wǎng)往移動互聯(lián)網(wǎng)轉(zhuǎn)型 , 新聞推送算法、照片識別、內(nèi)容審核 , 哪哪兒都需要技術(shù) 。
但問題是 , Facebook 的 AI 能力跟谷歌、微軟根本不在一個量級 。 扎克伯格需要一個能撐起門面的人物 , 最好是那種在學術(shù)界有足夠分量、能吸引頂尖人才加盟的大牛 。
他盯上了 Yann LeCun 。
LeCun 當時在紐約大學當教授 , 已經(jīng)干了十多年 。 那時的 Lecun 自然不是什么新人 , 早在 1989 年 , 他就在貝爾實驗室搞出了卷積神經(jīng)網(wǎng)絡(luò) (CNN) , 用來識別手寫數(shù)字 , 這后來也成了計算機視覺的基石 。
但那個年代深度學習不受待見 , LeCun 就這么冷板凳坐了許久 , 眼睜睜看著自己的研究被邊緣化 。 直到 2012 年 , Hinton 用深度學習拿下 ImageNet 冠軍 , 證明了神經(jīng)網(wǎng)絡(luò)這條路走得通 。
LeCun 憋了的那口氣 , 終于能吐出來了 。
后續(xù) , 扎克伯格親自登門拜訪 。 具體談了什么外人不知道 , 但最后開出的條件足夠誘人:
第一 , 給錢 , 主打一個資源自由;第二 , 給自由 , LeCun 可以保留紐約大學的教授身份 , 繼續(xù)教書搞研究;第三 , 給權(quán) , 讓他參與建立 Facebook AI 研究院 , 怎么招人、做什么方向 , 全由他說了算 。
這對一個憋屈了多年的學者來說 , 簡直是夢寐以求的機會 。
2013 年末 , LeCun 正式加入 Facebook , 出任新成立的 Facebook AI Research(FAIR) 實驗室負責人 。
他在紐約、門洛帕克和倫敦三地建起了 FAIR 實驗室 , 自己常駐紐約辦公室 。
團隊最初規(guī)模較小 , 但個個都是從頂尖高校和研究機構(gòu)挖來的——LeCun 的號召力在這時候體現(xiàn)出來了 , 但凡是做深度學習的 , 沒人不知道「卷積神經(jīng)網(wǎng)絡(luò)之父」這個名號 。
扎克伯格給了資源 , LeCun 也拿出了成果 。
加入 Facebook 這些年 , LeCun 干的事情可以分成三條線:一是把深度學習塞進 Facebook 的產(chǎn)品里 , 二是推動學術(shù)界的前沿研究 , 三是培養(yǎng)下一代 AI 人才 。
產(chǎn)品線上 , 2014 年的 DeepFace 人臉識別系統(tǒng)達到 97.35% 準確率 , 深度學習優(yōu)化的推送算法也提升了廣告點擊率 。
與此同時 , LeCun 自己繼續(xù)在學術(shù)圈刷存在感:發(fā)論文、頂會 keynote、帶學生辦 workshop 。 直到和 Hinton、Bengio 一起拿圖靈獎 ,才算是熬出頭了 。
此外 , 在 LeCun 創(chuàng)建的 FAIR 實驗室 , Soumith Chintala 主導開發(fā)了 PyTorch 框架并于 2017 年開源 , 這也是 Meta 至今為數(shù)不多的形象招牌 。
PyTorch 動態(tài)計算圖、Python 原生接口 ,調(diào)試方便 ,學術(shù)圈迅速倒戈 。 這一招等于把全球 AI 研究者都拉進了 Facebook 生態(tài) 。
不過 , 或許是冥冥中自有天意 , Soumith 前幾天也宣布離職 Meta , 表示「不想一輩子做 PyTorch」 。
而更重要的是人才培養(yǎng) 。 FAIR 有個規(guī)矩:研究員可以自由發(fā)表論文、跟學術(shù)界合作、指導外部學生 。 頂級資源加學術(shù)自由的組合 , 自然吸引了一批頂尖研究人員 。
到 2020 年前后 , FAIR 已是全球頂尖 AI 研究機構(gòu)之一 ,跟谷歌 DeepMind 并列第一梯隊 。 扎克伯格的那場豪賭 ,至少在前七八年就已經(jīng)得到了不小的回報 。
貓比 ChatGPT 聰明?這個圖靈獎得主是認真的在 ChatGPT 席卷世界初期 , Yann Lecun 和扎克伯格也有過一段甜蜜期 。
2023 年以來 , Meta 陸續(xù)開源 LLaMA 系列模型 , 引發(fā)業(yè)界震動 。
OpenAI、谷歌走的是封閉路線 , 靠 API 賺錢;Meta 卻把模型權(quán)重直接扔出來 , 任人取用 。 這步棋背后的算盤其實挺清楚:與其讓對手一家獨大 , 不如用開源贏得開發(fā)者生態(tài) , 讓 LLaMA 成為 AI 界的 Android 。
至少在明面上 , 身居 Meta 首席 AI 科學家一職的 LeCun , 是這條路線最堅定的擁護者 。
開源 LLaMA 讓 Meta 在大模型競賽中站穩(wěn)了腳跟 , 也讓 LeCun 的 AI 理想得到了一定程度的實現(xiàn)——盡管這個實現(xiàn)的方式 , 恰恰是通過他并不完全認同的 LLM 技術(shù)路線 。
沒錯 , LeCun 一直覺得 LLM 是條死胡同 。 這才是矛盾的核心 。
LeCun 不止一次在公開場合炮轟 LLM 路線 , 在他看來 , LLM 只會根據(jù)統(tǒng)計相關(guān)性預(yù)測下一個詞 , 根本不理解世界 。 你問它常識問題 , 它能給你編出一本正經(jīng)的瞎話——這叫「幻覺」(hallucination) , 說白了就是不懂裝懂 。
熟悉 LeCun 的人都知道 , 他最喜歡舉的例子是貓和機器人:
「我們有了會考試聊天的語言模型 , 但家務(wù)機器人在哪里?哪怕像貓那樣靈巧的機器人都沒有出現(xiàn) 。 」
「你的貓肯定有一個比任何 AI 系統(tǒng)都更復(fù)雜的模型 。 動物擁有持久記憶的系統(tǒng) , 這是目前的 LLM 所不具備的;能夠規(guī)劃復(fù)雜動作序列的系統(tǒng) , 這在今天的 LLM 中是不可能的 。 」
他算過一筆賬:一個 4 歲小孩通過視覺獲取的信息量 , 幾年下來就有 10 的 15 次方字節(jié) , 遠超 LLM 讀遍互聯(lián)網(wǎng)文本 。 但小孩已經(jīng)掌握了基本的物理直覺和語言 , LLM 耗費這么多數(shù)據(jù) , 智能仍然很有限 。
「光靠喂文本 , 不可能達到人類水平智能 。 這條路永遠走不通 。 」他如此說道 。
在當下最火的風口面前 , 這樣唱反調(diào)的言論顯然并不討喜 , 有人批評他傲慢 , 有人說他故步自封 。 甚至 Meta 內(nèi)部都有聲音認為 , 正是 LeCun 對 LLM 路線的抵觸 , 讓公司在大模型競賽中暫時落后 。
但 LeCun 不在乎 。
他有自己的路線圖:世界模型 (World Model)、聯(lián)合嵌入預(yù)測架構(gòu) (JEPA)等等 。 這些概念聽起來學術(shù)味十足 , 核心思想其實很直觀——
讓 AI 通過觀察世界來學習 , 而不是通過閱讀文本來記憶 。 就像嬰兒成長那樣 , 先理解重力、因果關(guān)系這些物理常識 , 再逐步建立抽象認知 。
他設(shè)想的 AI 架構(gòu)是模塊化的:感知模塊、世界模型模塊、記憶模塊、行動模塊 , 各司其職 。 不像 LLM 那樣把所有知識和推理揉在一個巨型網(wǎng)絡(luò)里 , 搞得像個什么都懂但其實什么都不懂的「書呆子」 。
具體來說 , 世界模型就是讓 AI 在內(nèi)部學會一個對外部世界的預(yù)測模型 。 就像嬰兒在成長過程中建立起對重力、物體恒存等常識那樣 , AI 應(yīng)該通過觀察世界 , 形成對物理規(guī)律、因果關(guān)系的理解 。有了世界模型 , AI 就可以在腦海中模擬未來 , 從而具備計劃行動的能力 。
JEPA 則是實現(xiàn)這個世界模型的具體架構(gòu) 。
它采用自監(jiān)督學習的方法 , 給 AI 兩個相關(guān)的輸入 (比如視頻中相鄰的兩幀畫面) , 模型將這兩個輸入分別編碼到一個抽象的表示空間中 , 然后訓練一個預(yù)測器 , 根據(jù)「上下文」表示去預(yù)測「目標」表示 。
這種方式避免了直接生成所有細節(jié) , 而是關(guān)注抽象的關(guān)鍵因素——更符合人類學習方式 。 LeCun 曾預(yù)言 , 如果團隊的路線順利推進 , 三到五年內(nèi)就會有更好的范式出現(xiàn) , 使得現(xiàn)在基于 LLM 的方法過時 。
問題是 , 三到五年 , Meta 等得起嗎?
一場猝不及防的重組 , FAIR 的黃金時代結(jié)束了當初 , LeCun 建立 FAIR 時的承諾是「做長期的、基礎(chǔ)性的 AI 研究」 , 扎克伯格也同意了 。
但這個「長期」到底有多長?「基礎(chǔ)研究」到底能給公司帶來多少直接收益?這些問題在早期不是問題 , 因為深度學習本身就是風口 , FAIR 做什么都有望轉(zhuǎn)化成產(chǎn)品優(yōu)勢 。
可隨著生成式 AI 開始爆發(fā) , 競爭也日益激烈 , 形勢開始發(fā)生了變化 , 尤其是 Llama 4 的失敗也給了扎克伯格當頭一棒 。 扎克伯格要的是現(xiàn)在就能用的技術(shù) , 不是五年后可能有用的理念 。
于是 , 一場猝不及防的重組出現(xiàn)了 。
就在今年 , Meta 搞了個大動作 , 成立「超級智能實驗室」 , 把 FAIR、基礎(chǔ)模型團隊和各應(yīng)用 AI 團隊統(tǒng)統(tǒng)塞進一個筐里 。 表面上是整合資源 , 實際上是一場徹底的權(quán)力重組 。
這場重組的核心邏輯很明確:讓研究直接服務(wù)產(chǎn)品 , 讓科學家為商業(yè)目標讓路 。
FAIR 團隊原本「相對不受干擾地開展研究」 , 現(xiàn)在得跟著產(chǎn)品節(jié)奏走 , 研究方向要服務(wù)于個人 AI 助手 。 此外 , Meta 對 FAIR 的研究發(fā)表制定了更嚴格的內(nèi)部審核機制 。
研究員在對外發(fā)布論文、開源代碼之前 , 需要經(jīng)過額外的內(nèi)部交叉審閱和管理層審批 , 原因在于 Meta 擔心自己砸錢搞出來的成果被競爭對手白嫖 。
LeCun 對這些變化表現(xiàn)出強烈的抵觸 。
據(jù)多方報道 , 他在內(nèi)部激烈反對新的論文審核制度 , 為維護研究自由據(jù)理力爭 。 The Information 援引知情者的話稱 , LeCun 在今年 9 月一度「氣到考慮辭職」以示抗議 。
但或許更讓他難以接受的是領(lǐng)導權(quán)的旁落 。
扎克伯格在重組中做了一個大膽的人事任命:從外部挖來 Alexandr Wang , 讓他擔任 Meta 的首席 AI 官 , 直接向 CEO 匯報 。
Alexandr Wang 是誰?一個 28 歲的 MIT 輟學生 , 他創(chuàng)辦的公司 Scale AI 專門做數(shù)據(jù)標注業(yè)務(wù) , 給各大科技公司的 AI 模型提供訓練數(shù)據(jù) 。
扎克伯格看中的 , 恰恰是 Wang 的產(chǎn)品思維和商業(yè)嗅覺 。 在生成式 AI 的競賽中 , Meta 需要的不是象牙塔里的理想主義者 , 而是能快速把技術(shù)轉(zhuǎn)化為產(chǎn)品的實干家 。
這個任命的震撼在于:LeCun 這個圖靈獎得主、深度學習三巨頭之一、在 Meta 干了十二年的首席 AI 科學家 , 在新架構(gòu)下的話語權(quán)被大幅削弱 , 甚至要向 Wang 匯報 。
同時 , 今年 7 月 , 扎克伯格還任命了年輕有為的趙晟佳為超級智能實驗室的首席 AI 科學家 , 負責制定新實驗室的研究方向 。
有趣的是 , LeCun 當時發(fā)了個聲明 , 說自己角色沒變、使命沒變 , 還期待跟新團隊合作 。 這求生欲屬實拉滿 。 但他對于研究方向和領(lǐng)導層重組的分歧 , 顯然是公開的秘密 。
而真正可能成為壓垮駱駝的最后一根稻草的 , 是最近的裁員 。 據(jù)報道 , Meta 近期對 AI 團隊進行了裁員 , 波及到 FAIR 研究部門以及與產(chǎn)品相關(guān)的 AI 團隊 , 甚至華人大佬田淵棟也因此受到了波及 。
裁員的信號很明確:Meta 不再愿意為「看不到短期回報」的基礎(chǔ)研究買單了 。 那些不能直接轉(zhuǎn)化為產(chǎn)品功能、不能立即提升用戶增長或廣告收入的研究方向 , 都成了被砍的對象 。
FAIR 的黃金時代結(jié)束了 。
種種因素之下 , 《金融時報》爆料他在籌備創(chuàng)業(yè) , 倒也不算意外 。
學術(shù)大佬出來單干 , 最近幾年已經(jīng)成了硅谷新常態(tài) 。 Hinton 退休后到處演講呼吁 AI 監(jiān)管 , Bengio 也有自己的實驗室和創(chuàng)業(yè)項目 。 LeCun 若是真出去創(chuàng)業(yè) , 沒準反而是好事 。 說到底 , 這事兒沒有誰對誰錯 。
LeCun 能夠在 Meta 之外繼續(xù)他畢生的事業(yè) 。
他帶走了那個被 Meta「擱置」的愿景 , 可以放開手腳搞自己的世界模型 , 用自己的方式證明它是正確的 , 再也不用跟產(chǎn)品經(jīng)理扯皮 , 不用向 28 歲的小老弟匯報 。成了 , 那就是「我早說過 LLM 是死路」;敗了 , 頂多被人嘲笑幾句「你看那個老頑固」 。
而對于 Meta 來說 , 扎克伯格要給股東講故事 , 要把最實用的生成式 AI 塞進旗下產(chǎn)品的各個角落 , 這確實是 CEO 該干的事 。
只是 , 盡管少了 LeCun 也不會傷筋動骨 , 但可能會少點不一樣的聲音 。 等哪天大家發(fā)現(xiàn) LLM 真的走到瓶頸了 , 回頭看看當年那個舉著反對牌子的倔老頭說過什么 , 或許會覺得別有一番趣味 。
#歡迎關(guān)注愛范兒官方微信公眾號:愛范兒(微信號:ifanr) , 更多精彩內(nèi)容第一時間為您奉上 。
愛范兒|原文鏈接· ·新浪微博
推薦閱讀
- 31-45歲中年男人的現(xiàn)狀,就藏在這份APP排行榜里
- 為激勵新技術(shù)研發(fā),三星將專利申請獎勵最高提升100%
- AQ斬獲烏鎮(zhèn)峰會創(chuàng)新案例獎,唯一獲獎專業(yè)級AI健康應(yīng)用
- 藤校拒了又怎樣?18歲天才少年打造爆款A(yù)I年入2億
- 羅永浩在用的數(shù)字人,拿下世界互聯(lián)網(wǎng)大會科技大獎
- 騰訊、理想、宇樹等14家企業(yè)獲世界互聯(lián)網(wǎng)大會杰出貢獻獎|2025世界互聯(lián)網(wǎng)大會
- 打破國外壟斷海信RGB三維控色顯示技術(shù)榮膺創(chuàng)新大獎
- 20歲輟學生用AI幫人記筆記,半年做到500萬用戶,年入百萬美元
- 閃電快訊 | 70萬條科學科普視頻為底,B站科學晚評選8大趣味科學獎
- “支付寶碰一下”斬獲支付大獎:Money20/20創(chuàng)新大獎唯一獲獎中企
