騰訊調整大模型組織架構:姚順雨加盟,向總裁劉熾平匯報

騰訊調整大模型組織架構:姚順雨加盟,向總裁劉熾平匯報

文章圖片


henry 發自 凹非寺
量子位 | 公眾號 QbitAI
官宣了 。
就在剛剛 , 量子位獲悉 , 騰訊內部宣布了大模型組織架構調整 , 而姚順雨也首次被明確了加盟 。
姚順雨是誰?
前OpenAI研究員、清華姚班學霸、普林斯頓博士、NOI奧賽銀牌、安徽省高考探花 , 是近幾年大模型 Agent 方向最受關注的青年研究者之一 。
【騰訊調整大模型組織架構:姚順雨加盟,向總裁劉熾平匯報】只有28歲 。
他是Tree of Thoughts(思維樹)、ReAct等工作的作者 , 也是SWE-bench、SWE-agent等一系列知名研究的核心貢獻者 。
去年一篇《AI下半場》的博文 , 讓他在學界與產業界迅速出圈;而今年9月從OpenAI離職后 , 他的去向也隨之成為各大 AI 公司關注的焦點 , 一度引發諸多猜測 。
如今 , 一切塵埃落定——
姚順雨確定加盟騰訊 , 雙重身份:
第一 , “CEO/總裁辦公室”首席AI科學家 , 向騰訊總裁劉熾平匯報;
同時兼任AI Infra部、大語言模型部負責人 , 向技術工程事業群總裁盧山匯報 。
騰訊內部官宣說了啥姚順雨內部官宣加盟的消息 , 是隨著騰訊AI組織架構一起披露的 。
量子位獲悉 , 騰訊今日內部官宣了大模型研發組織架構調整——
新成立AI Infra部、AI Data部、數據計算平臺部 , 全面強化其大模型的研發體系與核心能力 。
其中Vincesyao出任“CEO/總裁辦公室”首席AI科學家 , 向騰訊總裁劉熾平匯報;同時兼任AI Infra部、大語言模型部負責人 , 向技術工程事業群總裁盧山匯報 。
而Vincesyao , 正是姚順雨 。
據稱 , 作為騰訊大模型體系的重要一環 , AI Infra部將負責大模型訓練和推理平臺技術能力建設 , 聚焦大模型分布式訓練、高性能推理服務等核心技術能力 , 構建大模型AI Infra核心競爭力 , 為大模型算法研發和業務場景落地提供穩定高效的技術支持和服務 。
而架構升級后的AI Data部、數據計算平臺部 , 將分別負責大模型數據及評測體系建設、大數據和機器學習的數據智能融合平臺建設工作 。
王迪繼續擔任大語言模型部副總經理 , 向姚順雨匯報 。 劉煜宏擔任AI Data部負責人、陳鵬擔任數據計算平臺部負責人 , 均向公司副總裁蔣杰匯報 。
騰訊內部信中還強調 , AI大模型研究與工程技術緊密相關 。 在過往混元大模型訓練以及海量業務場景的深度實踐中 , 騰訊已經積累了系統化的工程能力;此次大模型研發架構升級 , 在進一步強化騰訊工程化優勢同時 , 旨在提升AI大模型研究能力 , 聚焦公司AI戰略布局 , 提升AI大模型的研發效率 。
過去一年 , 混元大模型發布超過30個新模型 。 12月5日發布的混元2.0 , 顯著改進了預訓練數據和強化學習策略 , 在復雜推理與文本生成場景表現國內領先 。 混元3D模型甚至保持著全球領先的水準 , 開源社區下載量超過300萬 。
而AI產品和服務 , 騰訊也正在展現一貫的競爭力 。
在產品和服務層面 , 騰訊元寶持續優化用戶體驗 , 上線初期甚至保持了每天一個版本的迭代頻率 , 快速贏得了用戶的認可 , 用戶規模穩居國內AI應用前三 , 成為最受新中產歡迎的AI原生應用 。 目前騰訊也將元寶的AI能力融入微信、QQ、音樂、會議等國民級產品中 , 讓用戶在不改變習慣的前提下自然觸碰AI , 為用戶提供最自然、門檻最低的服務體驗 。
與此同時 , 據稱騰訊公司內部正在推進一場全面AI化的效率變革 。 據騰訊財報會信息 , 截止目前 , 騰訊混元大模型已在騰訊會議、微信、廣告、游戲等內部超過900款應用和場景中落地 。 在騰訊公司內部 , 有超90%的騰訊工程師在使用騰訊云代碼助手CodeBuddy , 50%新增代碼由AI輔助生成 , 代碼評審環AI參與度達94% 。
而作為高密度人才引進的姚順雨 , 也是騰訊開啟AI攻堅的證明 。
可以確定的是 , 這個時間點上的騰訊 , 已經明顯開啟了AI進程上的提速 。
不論是組織變陣、人才推進 , 還是產品代表元寶、開源代表混元3D , 都能明顯感覺得到企鵝洶涌 。
當然 , 之所以騰訊一舉一動備受關注 , 核心還是其所擁有的完備AI要素:豐富場景、海量數據、生態資源 , 以及謀定后動的戰略風格…
AI船票是什么可能還在被討論 , 但擁有上述AI要素的騰訊 , 被認為坐在預留席位的那一桌 。
這或許也是姚順雨這樣的TOP人才 , 難以拒絕offer的原因 。
姚順雨其人其論姚順雨 , 合肥一中畢業 , NOI奧賽銀牌 , 高考704分以安徽探花進入清華姚班 , 后在普林斯頓大學獲得計算機博士學位 。

博士期間 , 他師從GPT-1第二作者Karthik Narasimhan , 從事智能體方向研究 。 博士畢業后 , 隨即加入OpenAI 。

在科研層面 , 姚順雨的工作幾乎貫穿了Agent研究的關鍵節點 。 他先后提出CALM(讓語言模型以Agent形式參與語言游戲)、WebShop(用可控的電商環境系統性評估Agent 能力)等工作 。
隨后 , 他又陸續推出了一系列在學界和工業界都產生深遠影響的成果:
ReAct:讓大語言模型同步完成推理與行動 , 是其被引次數最高的工作 。 Tree of Thoughts:通過搜索式思維結構顯著提升模型推理能力 。 SWE-bench:面向真實軟件工程任務的大模型評估基準 。 SWE-agent:將LLM系統性用于代碼修復與開發的開源 Agent) 。如果說這些工作回答的是“Agent 能不能工作、該怎么工作” , 那么在觀點層面 , 姚順雨更關心的 , 是AI接下來該往哪里走 。
在2024年8月加入OpenAI 后 , 姚順雨發表博文《The Second Half》 , 提出了一個被反復引用的判斷:
AI正處在“中場休息”階段:上半場是訓練評估 , 下半場將是評估訓練 。
在他的劃分中 , AI 發展可以清晰地分為兩個階段:上半?。 閡閱P禿頭椒ㄎ行?, 核心任務是“把模型訓出來” 。 下半?。 核孀拍P湍芰η饔誄墑?, 重心轉向任務定義、系統構建與評估體系 。
也就是說 , AI 的關鍵問題正在從
“我們能否訓練一個模型解決 XX?”轉向“什么問題值得被解決?我們如何判斷 AI 是否真的進步了?”
在這個階段 , 評估不再是附屬環節 , 而是決定方向的前置條件 。
真正重要的 , 不是繼續堆模型規模 , 而是讓模型在真實任務、真實系統中經得起檢驗 。
除了“AI 下半場”的判斷之外 , 姚順雨今年 9 月與張小珺的對談同樣出圈 , 也進一步強化了他一貫的技術立場 。
在那次對談中 , 他對Agent、應用與模型邊界的多項判斷被反復引用 , 比如:
Agent 的本質不是“會用工具” , 而是“能推理并泛化” Code 是 Agent 的“手” , 是真正的第一性環境 真正困難的不是“難任務” , 而是“簡單任務的可靠性” 創業公司的最大機會 , 不在模型 , 而在交互方式這些觀點并非停留在判斷層面 , 而是與他過往在 ReAct、SWE-agent 等工作中一以貫之的研究路徑高度一致 。
如今 , 這位有產出、有觀點、也有清晰技術方法論的明星研究員選擇加入騰訊 , 所帶來的 , 顯然不只是單點能力補強 , 而是一整套關于Agent、系統與真實任務的“下半場”解法 。

    推薦閱讀