
文章圖片

文章圖片
“進達摩院研技 , 是少林僧一項尊崇之極的職司 , 若不是武功到了極高境界 , 決計無此資格 。 ”
馬云癡迷于金庸武俠 , 也曾懷抱一個技術“江湖夢” 。
2017年云棲大會 , 阿里成立了自己的“達摩院” , 揚言三年內技術研發投入超過1000億元 。 金庸小說里 , “三十余高僧 , 得進達摩院僅八人” 。 但全盛時期 , 阿里直接對外公布了十三位“掃地僧” , 再加上后來的賈揚清組成了最強陣容 。
“達摩院要活得比阿里巴巴長 。 ”
馬云當年的話猶在耳邊 , 經歷過一次次調整、洗牌之后 , 如今達摩院所剩下的“火種”寥寥 。 據公開信息統計 , 十三位“掃地僧”目前已經出走九人 。 過去繁榮的“4+X”研究領域 , 僅留下了“智能+計算” 。
俱往矣 , 達摩院所剩不多的榮光凝結在了“通義實驗室” , 在原有M6大模型的基礎上進化成“通義千問”系列模型 。
對阿里這家公司來說 , 商業高于技術 , 技術素來服務于業務 。 從達摩院到通義實驗室 , 都不是一個純研究性部門 , 技術理想和商業思維互搏 , 好比一群閉關修行的科學家也得走出山門 , 學會混跡江湖 。
阿里深諳“定戰略、拉架構、找對人”這套策略:馬云定調 , 吳泳銘上任 , “1+6+N”隨之瓦解 。 目標AGI , 作為先鋒兵的通義實驗室現在面臨著代際更迭、人員變動和引領集團AI化的新挑戰 。
達摩論劍
2020年5月 , OpenAI發布參數規模高達1750億的大模型GPT-3 , 大模型的競爭正式起步 。 據阿里官方披露 , 也是在同一年 , 開啟了語言模型體系AliceMind和多模態大模型M6的研發 。
現在大家熟知的阿里通義大模型實際包含了三部分構成 , 分別為模型底座、通用模型(通義-M6、通義-AliceMind、通義-視覺) , 以及行業模型 , 其中AliceMind主攻文本模型方向 , M6側重多模態方向 。
據一位原達摩院人士描述 , AliceMind和M6由達摩院的兩支團隊分開訓練 。 彼時 , 達摩院下方一共分為機器智能、數據計算、機器人、金融科技、X實驗室(量子計算)五大領域 。
M6是現在通義千問大模型的前身 , 其團隊隸屬周靖人負責的智能計算實驗室 , 由楊紅霞帶著幾個P7和實習生一起研發 , 團隊里青年才俊頗多 , 例如周暢、林俊旸等人 。 另一個AliceMind團隊隸屬于司羅負責的NLP實驗室 , 由其下屬泳春(花名)帶著差不多配置的團隊同時進行 。
知情人士表示 , GPT-3的出現 , 并沒有引起阿里的完全重視 , “僅是出于技術跟進考慮 , 就拉著不到十個人的團隊開始了復刻” 。
在訓練的過程中 , AliceMind和M6兩個團隊中逐漸形成了賽馬機制 , 話事人意志、數據、資源傾斜和技術路線選擇最終讓楊紅霞團隊勝出 。
楊紅霞的直系領導 , 周靖人起到了關鍵性的作用 。
彼時 , 周靖人兼任達摩院智能計算實驗室負責人和阿里搜索及廣告技術事業部負責人 。 在第二重身份之下 , 他負責管理阿里搜索AI中臺以及效果廣告業務 , 向蔣凡匯報 。 不知是否因為這層關系 , M6在訓練時采用了大量淘寶數據 。 而AliceMind則處于劣勢 , 只能通過第三方采買的方式獲取數據 , 由于缺乏C端的數據 , 致使數據訓練豐富性不足 。
原機器智能實驗室人員向光子星球透露 , 訓練大模型過程中遇到了用卡限制 。 他表示 , “靖人不給我們卡 , 我們只有500張 , 但我猜楊紅霞至少有5000張 。 ”另有知情人士提及類似情況 , 只是沒有十倍卡那么夸張 , 但用卡傾斜現象的確存在 。
官方顯示 , 2021年初 , 阿里相繼發布了AliceMind和M6 。 但隨著GPT-3.5的發布 , 技術路徑逐漸收斂至多模態M6上 。
2021年1月 , 阿里首次發布百億參數規模的中文多模態預訓練模型M6;同年3月 , 擴展至千億參數 , 5月擴展至萬億參數 , 10月擴展至十萬億參數;2022年 , 發布通用統一大模型M6-OFA , 實現架構、模態和任務統一 , 成為后來“通義”大模型系列的底座 。
劍氣合一“跟老板搞不好關系 , 怎么做得好業務?”
2022年前后 , AliceMind在賽馬機制中被淘汰 , 文本和多模態大模型團隊迎來了第一次融合 。 達摩院達成短暫共識 , 由楊紅霞統一領導兩個團隊 , 繼續訓練通用大模型 , 其余仍留在達摩院的人后面訓練行業大模型 。
差不多同一時間 , 達摩院發生巨震 , 被很多出走的老阿里人形容為“大清洗” 。
自動駕駛、XR、智慧城市這類直接涉及到改造物理世界的業務 , 如同劍宗 , 技術為輔 , 場景為主 。 而AI與大模型則更像是以氣御劍的氣宗 , 氣(技術)是主 , 劍(場景)是從 。
當達摩院副院長金榕、NLP負責人司羅、城市大腦實驗室負責人華先勝、XR實驗室負責人譚平、達摩院自動駕駛實驗室負責人王剛等多名“掃地僧”相繼離職 , “劍宗”失去了領頭人 。 而“氣宗”亦出現了人員變動 , 比如即便曾被“組織”委以重任的楊紅霞也轉身投入到了字節 。
核心人物離開的同時 , 集團還開啟了“1+6+N” , 組織架構調整隨之而來 , 阿里進入多事之秋 。 原機器智能和應用相關的團隊被打破重組 , 除了決策智能實驗室外 , 語言、視覺、NLP等團隊從達摩院剝離出來 , 一起并入到了阿里云的通義實驗室 。 至此 , 達摩院完成了“劍氣切換” , 聚焦大模型和AI的通義實驗室成為了主力 。
達摩院受到“重創” , 通義實驗室群龍無首 。 在此背景下 , 周靖人回歸 , 升任阿里云CTO , 兼任通義實驗室負責人 。
【通義接過阿里AI的衣缽】阿里內部對周靖人的評價中 , 有人說他的身上帶著些許微軟的辦公室文化氣息 , 熟諳職場規則 , 擁有一定的向上管理能力 。 平常不茍言笑 , 喜怒不形于色 , 有點像典型的外企出身的“職業經理人” 。
也有人見證過周靖人執拗的一面 , 感嘆“靖人啊 , 有時候比較實在 , 也比較直接” 。 有知情人士提到 , 在某次大會上 , CPO童文紅讓大家各抒己見 , 指出阿里出現的問題 。 周靖人被點名發言 , 他想了半天道 , “那我就實話實說 , 淘寶之前寫的代碼太爛了” 。
統籌云和大模型 , 對外統一輸出為“通義千問” 。 在周靖人的領導下 , 2023年4月 , 阿里云發布自研大模型“通義千問” , 開源和閉源兩條腿走路 , 跟隨技術路線迭代至今 。
達摩院時期埋下隱患仍影響至今 , 動蕩的陰霾揮之不去 。 2024年 , 通義千問大模型技術負責人周暢被字節挖走 , 引發了第二輪人事“洗牌” 。 鄢志杰、薄列峰緊隨其后 。 十個月 , 三位一線核心人物離職 , 語音、視覺、模型三個方向自此失去了“帶頭大哥” 。
隨著吳泳銘的上臺 , 達摩院再一次走到了十字路口 , 年輕的林俊旸們被推到了臺前 。
風流一代
阿里集團年輕化早在張勇時期就初露端倪 , 重用蔣凡、提拔莊卓然、大膽啟用葉軍 。 到吳媽上臺 , 則愈加清晰 , 針對跨部門流動、年輕高潛人才升遷等組織機制調整和人才考核已提上日程 。
阿里老人下 , 年輕人補位 , 要分兩方面來看待 。 在一個“沒有誰服誰 , 只有誰管誰”的體系內 , 前輩給后輩騰位置 , 可以讓一些有競爭力的年輕人被看到 , 并獲得晉升 。 提拔林俊旸多少帶著點樹典型的意味 , 暗中給后面的年輕人沖刺吹響了哨聲 , “吳媽重視年輕人不是說說而已” 。
新王朝 , 需要立一面旗幟 , 往往會樹一位典型 。
但也要看到周暢、鄢志杰、薄列峰等阿里老人 , 不屬于躺在功勞簿上“坐吃等死”的一批人 。 在大模型競爭的語境下 , 他們同時具備技術研發和領導團隊的競爭力 。 這些人出走 , 一方面透露出AI搶人的殘酷性 , 另一方面也說明阿里體系的“強吸引力”在被稀釋的可能性——革命最重要的是充滿激情 。
流失的人才等待補齊 , 加之老人和新人之間的融合 , 將成為阿里云未來一段時期的過渡態 。 團隊一號位面臨著兩個選擇 , 內部年輕高潛人才急速補位或外來業界大牛空降 , 而無論哪種都要經歷調整適應 。
值得慶幸一點是 , 即便派系不同 , 內部仍然有著技術上的共識 , 尤其是當集團將AI視為核心戰略之后 , 通義實驗室不必像之前達摩院一般 , 需要說服西溪邊上的“首長們”去All in 。
一方水土養一方人 , 不同的土壤結出不同的果子 。 阿里對待技術的態度一直很明確:服務于業務 , 追求商業轉化 。
iDST(達摩院前身)時期 , 從實驗室出來的科學家“上山下鄉” , 被“發配”到阿里業務一線 , 思考如何把前沿的學術成果與龐雜的場景對接 , 并帶來商業成果 。 成立之時 , 馬云對達摩院的愿景是 , “具備自營自利能力 , 未來靠自身賺錢” 。
據阿里云人士回憶 , 行癲掌管達摩院時期 , 常掛在口頭上的便是:“你有什么價值?怎么證明你的價值” 。 阿里云的財報數據透明 , 無論誰上去都得立“軍令狀” , “經常出現上半財年大吹影響力 , 下半財年大搞營收項目的情況” 。
現在到吳媽時期 , 這種現實主義下的結果導向仍在以另一種形態出現 。 通義大模型要看影響力、開源聲量 , 所有業務單元2025年的績效考核直接與AI技術應用成效掛鉤 。 一言以蔽之 , 結果為王 。
老問題和新任務接踵而來 , 純粹AI技術團隊定位顯得極其擰巴 。 在龐大的集團機器體制下 , 職級就像是套在人身上巨大的枷鎖 , 無論老少派 , 往上晉升才是首要任務 。
如果人們過分執著于晉升 , 往往會抹殺團隊創新的可能性 , 當然這并非是阿里一家正面對的挑戰 , 這也成為了DeepSeek誕生于大廠之外的重要原因之一 。 團隊的配置和規模不是重點 , 關鍵在于是否把大量精力投入在技術鉆研上 。
推薦閱讀
- 阿里入局AI編程,Lingma IDE對標Cursor
- 通義發布QwenLong-L1, 長上下文大型推理模型, 強在哪里?
- 阿里巴巴華中總部,以“孔明鎖”為設計理念
- 驚了,曾年入300億的阿里系平臺,全網下架
- 比華為鴻蒙早出現10年的阿里云OS,為何成為了失敗的操作系統
- 阿里CEO吳泳銘內網發帖:回歸初心,重新創業
- 阿里通義技術大牛再出走,應用視覺團隊負責人薄列峰已低調離職
- 企業級計算標桿——阿里云彈性計算15周年發布第九代Intel實例
- 獨家|阿里通義視覺負責人薄列峰入職國內A廠,任多模態部門負責人
- 再次“跳票”?蘋果AI功能推遲上線,百度、阿里提供技術
