曝頂級AI大牛,加入阿里通義,事關下一代大模型

曝頂級AI大牛,加入阿里通義,事關下一代大模型

文章圖片

曝頂級AI大牛,加入阿里通義,事關下一代大模型

文章圖片


智東西9月29日消息 , 據“互聯網八卦小喇叭”等媒體爆料 , 全球頂尖AI科學家、IEEE Fellow許主洪(Steven Hoi)已加盟阿里通義 , 轉向通義大模型的相關研發工作 。
許主洪擁有超20年AI產業和學術經驗 , 是新加坡管理大學終身教授、曾任新加坡南洋理工大學終身副教授 , 在AI領域發表了300多篇頂級學術論文 , 論文被引用超過5萬次 , 曾被斯坦福大學評為全球頂尖1%的AI科學家之一 。
【曝頂級AI大牛,加入阿里通義,事關下一代大模型】作為多模態大模型領域的領軍人物 , 許主洪曾擔任全球最大的企業軟件公司Salesforce的副總裁 , 從零開始構建了Salesforce在亞洲的AI研究生態系統;他還于2023年創立了一家多模態AI創企HyperAGI , 可以說是業內少有的產學研多棲AI大牛 。
許主洪
2025年2月 , 許主洪加入阿里并擔任阿里集團副總裁、智能信息事業群首席科學家 , 向智能信息事業群總裁吳嘉匯報 , 負責AI To C業務的多模態基礎模型及智能體(Agents)研究與應用 。
按原本的定位 , 許主洪的核心任務大概是組建頂級AI算法團隊 , 整合通義(應用)、夸克、天貓精靈等內部資源 , 促進多模態交互產品迭代 , 加速AI To C商業化 。
在今年6月的2025上海世界移動通信大會上 , 許主洪發表題為《多模態大模型發展與演進》的演講 , 在演講中他以夸克App的AI超級框、AI相機等功能為例講解了多模態大模型的應用場景 。
許主洪以夸克為例講解多模態大模型應用場景
然而 , 在加入阿里7個多月后 , 許主洪傳出加入通義實驗室團隊 , 這意味著他可能將從面向AI To C商業化研發轉向更基礎前沿的大模型研發 。
如果消息屬實 , 這意味著阿里完成了一次重大的人才重配 , 也標志阿里在多模態大模型研發領域再投重碼 。
當下 , 阿里通義大模型正處于“拼迭代速度”、“多模態發展”的關鍵階段 , 十分需要許主洪這樣對口的頂尖產學研多棲且有分量的AI大牛坐鎮 。
在9月底舉辦的2025云棲大會期間 , 阿里云智能集團首席技術官、通義實驗室負責人周靖人透露 , 連續發布數十款模型背后有戰略考量:全球AI模型進展都在加速 , 整個通義家族一直在跟全球AI領域的領先者進行你追我趕 , AI今天已進入加速期 , 比拼的是模型迭代效率;同時模型從單模態到多模態的演進是必然趨勢 , 阿里期待接下來在多模態方面還有進一步的創新和突破 。
許主洪或是目前阿里最適合牽頭做這件事情的人 。 他曾在在今年5月螞蟻技術開放日上的演講中提到 , 當下 , 用統一的框架做理解和生成 , 發展多模態大模型的一大演進趨勢 。 但這一領域發展尚處于的初級階段 , 需要實踐驗證 。
許主洪在講解統一多模態模型產業發展脈絡
許主洪指出 , 統一理解與生成的多模態大模型面臨眾多技術挑戰 。 在全模態交互挑戰方面 , 當下支持音、視、圖、文全模態交互的公開單模型非常少見;在理解與生成統一方面 , 圖像和語意的理解生成統一模型鮮有出現 , 且理解和生成效果難以平衡 。
而在6月的演講中 , 許主洪也提到:“多模態Agent AI時代才剛剛開始 , 未來要真正達到AGI , 我們還需要解決很多技術難題 , 包括多模態大模型的基礎能力、Agent智能體的核心功能模塊、數據世界的連接與操作、物理世界的交互與控制等等 , 都有很多的挑戰 , 但是這也是未來多模態大模型行業的機會 。 ”
截至目前 , 阿里及許主洪方未對此進行置評 。
本文來自微信公眾號 “智東西”(ID:zhidxcom) , 作者:李水青 , 36氪經授權發布 。

    推薦閱讀