
頭圖來源:視覺中國
大模型戰事進入深水區 , 騰訊正在通過調整陣型 , 來適應更快的速度 。
12 月 17 日 , 騰訊宣布升級大模型研發架構 。 這次調整最核心的變化在于成立了三個新部門:AI Infra 部、AI Data 部、數據計算平臺部。
這是騰訊在混元大模型步入 2.0 時代后 , 對研發體系的一次全面「提速」 。
在人事任命上 , 技術派高管被推向了更核心的位置 。 Vincesyao 出任「CEO/總裁辦公室」首席 AI 科學家 , 直接向騰訊總裁劉熾平匯報;同時 , 他還兼任新成立的 AI Infra 部及大語言模型部負責人 , 向技術工程事業群(TEG)總裁盧山匯報 。
一手抓算法(大語言模型部) , 一手抓算力基建(AI Infra 部) , 同時直通公司最高決策層 , 這一配置表明:在騰訊的戰略棋盤中 , 大模型的研究與工程落地正在完成深度耦合 。
姚順雨 , 98年的AI頂尖青年科學家據了解 , Vinces Yao就是數月前傳聞入職騰訊的姚順雨 , 畢業于清華和普林斯頓大學 , 曾任OpenAI研究員 。
據外媒報道 , 自今年 9 月從 OpenAI 離職加入騰訊以來 , 姚順雨被高層賦予了極大的權限 , 以推動內部的文化與組織變革 。 過去幾個月里 , 騰訊一改往日在大模型人才戰中的守勢 , 開始以雙倍薪資激進地從字節跳動等競爭對手處挖角核心研究員 , 并為應屆博士生開出高出行業標準 50% 的薪資溢價 。
姚順雨10月在X上發帖|圖片來源:X
更深層的變化在于「權力交接」 。 騰訊正在進行內部重組 , 降級那些雖擅長工程落地和廣告算法、但缺乏前沿 AI 研究背景的管理者 , 將指揮棒真正交還給「研究派」 。 這種去肥增瘦的動作 , 旨在打破過去「產品經理思維」主導大模型研發的局限 。
姚順雨出生于1998年 , 是人工智能領域的頂尖青年科學家 , 本科畢業于清華大學計算機系(姚班) , 后赴普林斯頓大學攻讀計算機科學博士學位 , 2024年正式加入 OpenAI , 專注于智能體(Agents)與深度研究(Deep Research)方向 。
他在OpenAI任職及相關研究期間 , 主要在大模型推理、Agent(智能體)——及評估體系方面取得了核心成果:
提升推理能力:提出了著名的思維樹(Tree of Thoughts ToT) , 通過讓大模型進行多路徑推理和反復思考 , 大幅提升了模型解決復雜問題的能力;
智能體研究:他是 SWE-bench(大模型代碼能力評估數據集)和 SWE-agent(開源AI智能體)的關鍵貢獻者 , 并參與了 ReAct(推理與行動結合)和 CoALA(智能體認知架構)等開創性工作 。
此外 , 他還在個人社交平臺發布了關于“AI 下半場”的思考 , 主張AI發展的重心應從單純的訓練轉向定義問題與評估 , 提出要像產品經理一樣思考“解決什么問題” , 認為在當前階段評估比訓練更為重要 。
為什么是 AI Infra?在過去一年的「百模大戰」中 , 行業逐漸達成一個共識:大模型的競爭 , 早已超越了單純的算法層面 , 變成了算力、數據、工程化能力的綜合比拼 。
此次騰訊成立 AI Infra 部 , 也是為了解決「算力效率」這一關鍵命題 。
據官方信息 , AI Infra 部將作為騰訊大模型體系的重要一環 , 聚焦于大模型分布式訓練、高性能推理服務等核心技術 。 其目標非常明確:構建大模型 AI Infra 的核心競爭力 , 為算法研發和業務場景落地提供穩定、高效的技術底座 。
這符合大模型技術演進的規律——當模型參數量級不斷躍升(如騰訊近期發布的混元 2.0) , 如何讓龐大的 GPU 集群高效運轉 , 如何在大規模并發下保證推理速度和成本 , 已經成為決定生死的「隱形戰場」 。
騰訊方面表示 , 在過往混元大模型的訓練及海量業務實踐中 , 騰訊已積累了系統化的工程能力 。 此次獨立建制 , 意在進一步強化這一優勢 , 提升 AI 大模型的整體研發效率 。
除了算力基建 , 數據質量和評測體系也被提到了新的高度 。
此次升級中 , 新成立的 AI Data 部 將由劉煜宏負責 , 專注于大模型數據及評測體系建設;而數據計算平臺部則由陳鵬負責 , 聚焦大數據和機器學習的數據智能融合平臺建設 。 兩人均向公司副總裁蔣杰匯報 。
這意味著 , 數據處理不再只是算法研發中的附屬流程 , 而是作為獨立且關鍵的環節被標準化和制度化 。
與此同時 , 王迪將繼續擔任大語言模型部副總經理 , 向姚順雨匯報 , 確保模型算法團隊與新成立的基礎設施部門保持緊密協同 。
效率變革 , 從代碼到產品的「AI 化」過去兩年 , 盡管擁有微信這樣的國民級應用 , 騰訊在 AI 模型層卻一度被外界視為「旁觀者」 。
一個標志性事件是 , 今年 2 月騰訊元寶率先接入 DeepSeek R1 。 雖然這一動作讓元寶的活躍用戶數實現了數量級躍升 , 但也給騰訊內部敲響了警鐘:自有模型的缺位 , 甚至導致內部部分業務團隊因混元競爭力不足而猶豫是否接入 。
這種焦慮最終轉化為自上而下的壓力 。 據報道 , 騰訊總裁劉熾平今年早些時候曾對團隊下達硬指標 , 要求必須在技術水位上趕超對手 。 此次變革 , 正是為了解決此前因組織分散導致的資源內耗 , 集中力量為算法團隊輸送「彈藥」 。
架構調整的最終目的 , 是為了支撐產品和業務的快速奔跑 。
在前不久的 12 月 5 日 , 騰訊發布了混元 2.0 , 在預訓練數據和強化學習策略上進行了顯著改進 , 其 3D 模型甚至保持著全球領先水準 , 在開源社區下載量突破 300 萬 。
在應用層 , 騰訊元寶上線初期保持了「一天一版本」的迭代頻率 , 目前用戶規模已穩居國內 AI 應用前三 。 而在騰訊內部 , 一場靜水流深的 AI 效率變革正在發生:超過 90% 的騰訊工程師正在使用騰訊云代碼助手 CodeBuddy;50% 的新增代碼由 AI 輔助生成;代碼評審環節的 AI 參與度高達 94%。
目前 , 騰訊混元大模型已在騰訊會議、微信、廣告、游戲等內部超過 900 款應用和場景中落地 。
【騰訊大模型「變陣」:成立 AI Infra 部,姚順雨出任首席 AI 科學家】近期混元團隊的高密度人才引進與重組 , 本質上正是為了支撐這種高強度的技術攻堅與業務滲透。 通過成立 AI Infra 等新部門 , 騰訊正在試圖打通從底層算力、數據處理到上層算法、應用落地的任督二脈 , 為接下來的 AI 長期競賽備好糧草 。
推薦閱讀
- 在這個開源「從夯到拉」榜單,我終于明白中國 AI 為什么能逆襲
- 云宇星空大模型正式發布,上海市規劃資源局與商湯大裝置聯合打造
- 人大&騰訊團隊用信息論揭示:什么時候該想、什么時候別想
- 告別知識庫時代,印象筆記如何打造你的「第二大腦」?
- vivo S50 Pro mini「告白」圖賞:顏值與性能雙覺醒
- 「5年不卡」是不是笑話?淺析安卓卡頓三大病根,一看就懂
- 深度機智「情境數采」殺手锏,具身智能的通用性天花板要被捅破了?
- 火山引擎的「火」,是怎么點起來的
- 商湯科技的選擇:擁抱AI國產化,做那個「修塔」的人
- 無問芯穹曝智能體服務平臺,以基礎設施加速企業級「智能體自由」
