丁磊淺嘗大模型

丁磊淺嘗大模型

文章圖片

丁磊淺嘗大模型

文章圖片

丁磊淺嘗大模型


“用最快的速度探索AI大模型的創新、應用 , 是網易的首要任務 。 ”在2023年7月的世界人工智能大會上 , 網易CEO丁磊拋出了這樣的豪言壯語 。
這屆大會上 , 網易展示多款AI大模型產品 , 涵蓋了AI基礎設施層、引擎層、平臺層、模型層、應用層 , 主要落地在游戲、教育、工業、音樂場景 。
這家老牌互聯網企業對于AI大模型的雄心 , 可見一斑 。
時至今日 , 網易在AI領域取得了一些成果 , 但整體來看 , 在AI大模型這條競爭極其激烈的賽道上 , 網易并不能算是國內頭部選手;就通用大模型而言 , 它的綜合實力甚至比不上AI六小龍 。
縱向來看 , 網易近兩年發布的通用大模型 , 比如“玉言”大模型、“商河”客服大模型、“易生諸相”多模態大模型等 , 大都沒能激起太大的浪花 , 如今聲量趨弱 。
只有有道的“子曰”大模型是個特例 , 它在教育場景下應用頗多 , 且有硬件產品作為載體 , 因而仍在持續更新 。
網易發力AI大模型的時間并不算晚 。
這一波AI大模型浪潮的起點 , 是2022年底ChatGPT全球爆紅 。 大約半年后 , 網易就開始大規?!吧喜恕?, 且一上來就是多模型、多模態、多場景全面覆蓋 , 屬于國內落子較早的互聯網公司之一 。
作為對比 , 如今國內AI大模型的頭部玩家字節 , 直到2024年5月才正式發布了豆包大模型家族 。
更何況 , 丁磊也格外看重這塊潛在價值巨大的新業務 , 至少在口頭上將其擺在公司C位 。
然而 , 在這場愈發火熱的時代競逐上 , 網易終歸是起了大早、趕了晚集 。 丁磊當年的督促 , 并沒有推動網易擠上AI大模型的中心舞臺 。

作為BAT 之下典型的“腰部大廠” , 網易被不少人視為“活得最舒服”的互聯網企業之一:它擁有穩固的業務矩陣和行業地位 , 每年可獲得豐厚的營收和利潤 , 且長期競爭壓力不大 。
從這一視角來看 , 當AI大模型浪潮襲來時 , 網易這樣的腰部大廠原本很有機會輕裝上陣、擊浪中流 , 迅速拿到一個重要的生態位 , 至不濟也要穩穩拿到一張通向下一個時代船票 。
然而 , 網易在AI大模型的全球生態中 , 尚未找到自己的專屬座位 。 這不僅僅是網易的難題 , 也是字節、阿里、騰訊(在大模型領域內或許可以加上百度)之下的腰部大廠集體面臨的嚴峻挑戰 。
復盤2022年底至今的國內AI大模型行業 , 一個略顯尷尬的事實是:當字節、阿里、騰訊等頭部大廠你追我趕、狂飆突進時 , 網易、京東、拼多多、攜程等腰部大廠顯得力不從心 , 圍繞AI大模型的愿景和動作都打了不小的折扣 。
人人都知道 , AI大模型時代已經到來 , 倘若企業不參與新時代的競逐 , 長期損失難以估量 。 然而 , 業務平穩、家資頗豐的腰部大廠們 , 經過一番波折后 , 最終都沒有選擇All In這場未來之戰;尤其是作為根基的通用大模型 , 腰部大廠們都沒能堅持做下去 。
丁磊們不碰大模型 , 反映出一個冷酷的事實:AI大模型競爭的門檻越來越高 , 腰部大廠蹉跎三年后 , 正在喪失AI主動權 。 不過 , 這沒準是一樁幸事——AI究竟是未來還是泡沫 , 現在誰都爭不出一個令所有人都信服的答案 。 面對甲骨文市值跌去40%的“慘狀” ,OpenAI今年“不上市就死”的前景 , 以及BAT們瘋狂燒錢但所獲無幾的投入產出比 , 本著有多大能力辦多大事的宗旨 , 先等等看 , 可能真是一種雖不得已但不失冷靜的選擇 。
A
雷聲大雨點小 , 是腰部大廠參與AI大模型的共同特點 。
以網易為例 , 盡管丁磊非??粗谹I大模型 , 但它在2023年推出的“玉言”大模型從一開始就沒能真正進入第一梯隊 。
按照官方說法 , 這款模型曾在中文語言理解權威測評CLUE分類任務榜單中獲得冠軍 。 但區區110億的參數量 , 決定了“玉言”的性能天花板并不高——畢竟 , OpenAI在2020年推出的GPT 3.0就已經擁有高達1750億的參數量 。
隨后兩年多里 , “玉言”大模型歸于沉寂 。 網易AI業務的重心逐漸轉移到垂直領域的實際應用上 , 除了持續迭代有道“子曰”大模型外 , 還在游戲開發、具身智能、工業機械等場景下落地不少AI應用 , 并針對AI數據標注做了“有靈”眾包平臺 。
其他腰部大廠同樣密切關注AI大模型 , 但截至目前 , 取得的成果也都相對有限 。

京東今年7月將旗下大模型品牌升級為JoyAI 。 這是一個規模龐大的AI產品矩陣:在算力基礎設施的基礎上 , 京東既有從3B到750B的全尺寸大模型 , 又構筑了一系列AI應用 , 包括智能體、編程助手、模型開發平臺、生成式營銷平臺、數字人等 。
單看測評成績 , JoyAI表現尚可 。 根據京東披露的數據 , JoyAI的750B模型在推理數據集Rbench上多項評測領先 , JoyAI1.0英文評測國內第一 , 中英文綜合國內第二 , 性能比肩行業一流大模型水平 。
但在2025年中的時間節點上 , AI大模型行業的焦點屬于GPT-5、Llama 4、Gemini 3.0等海外產品 , 以及豆包、Qwen、DeepSeek 3.2等國內一線選手 。 無論是模型還是應用 , 京東JoyAI家族的“存在感”都不算高 。
和京東、網易等不同的是 , 拼多多在大模型領域可以說是無聲無息 , 保密工作做得密不透風 。
黃崢早在2018年的上市招股書中提出 , 下一階段的拼多多“不是由集中式超級大腦型AI系統驅動 , 而是依托分布式智能代理網絡運作 , 兼具Costco的高性價比與迪士尼的娛樂體驗 。 ”
“分布式智能代理網絡”的概念 , 與如今的AI Agent頗為相似 。 黃崢在隨后幾個季度的財報電話會議上 , 也曾多次提到公司正在加大投入、拓展合作 , 以提升在分布式人工智能領域的技術能力 , 他本人將直接領導相關工作 。
然而 , 隨著黃崢卸任 , 拼多多管理層更迭 , 其發展戰略中的AI濃度下降不少 。 到了2025年 , 外界基本只能根據一些零散的招聘信息 , 猜測這家電商巨頭的AI業務走到哪一步了 。
從下半年的“大模型平臺工程師”“多模態大模型算法工程師”等招聘信息來看 , 拼多多大概率正在研發自家的AI大模型 。 但截至目前 , 相關成果尚未亮相 。
與兩三年前相比 , 腰部大廠對于AI大模型不再喊口號 , 變得更加務實 。
網易除了將AI應用于自家游戲、音樂、教育等業務板塊中 , 還嘗試注入工業場景 。 今年7月 , 網易發布具身智能模型“靈掘” , 專為露天礦山挖掘機裝車場景打造 。 目前 , “靈掘”已在內蒙古露天礦山投入實地運營 。
在工業大模型賽道上 , 網易鉆得越來越深 , 落地案例也越來越多 。 長期來看 , 這固然是一條有價值的發展路徑 , 但與國內外頭部AI企業打磨基礎模型、追求AGI愿景相比 , 專攻工業大模型略顯“偏科” , 上限較低 。
除了做專業“小模型” , 投資AI創業公司 , 是腰部大廠曲線占位的另一條路徑 。
網易云音樂早在2020年就投資了海外AI音樂公司AIVA 。 京東動作更大:今年5月以來 , 密集投資了智元、眾擎、千尋智能、逐際動力等多家具身智能企業 。 不過 , 與新BAT密集投資“AI六小龍”等超級獨角獸相比 , 腰部大廠的AI投資明顯差了一個段位 。
無論是專攻垂直領域 , 還是以投資換船票 , 腰部大廠們已經集體淡出了AI大模型的主戰場 。
B
丁磊們起初胸懷壯志 , 如今卻不再把通用大模型作為AI戰略重心 , 根本原因是AI大模型的參戰門檻已經高到了腰部大廠無法承受的程度 。
當腰部大廠們高調入局時 , 市場對于這場戰爭的消耗規模預期是幾十億元 , 最多百億量級 。
比如 , 丁磊2023年曾表示 , 計劃以每年上百億的力度 , 突破技術引擎、AI大模型芯片等領域 。 網易每年的營收超千億、凈利潤接近300億;去年研發投入175億元 , 撥出百億用于AI大模型 , 還算負擔得起 。
【丁磊淺嘗大模型】
京東沒有公布AI投入規模 , 但曾經披露研發投入:2017年至2025年第二季度累計超1500億元 , 平均每年不到200億元 , 與網易處于同一水平 。 這也意味著 , 正常情況下 , 京東能夠向AI投入的資金彈藥 , 每年也就百億左右 。
至于拼多多 , 還要更少一些 。 它在2024年的研發投入為127億元 , 能夠花在AI上的很可能只有幾十億元 。
對于腰部大廠來說 , 每年幾十到上百億的研發投入 , 并不是一筆小錢 。 但相比AI大模型——尤其是通用大模型的巨額投入 , 這點兒錢砸下去 , 幾乎看不到水花 。
AI大模型戰爭的關鍵戰場是通用大模型 。 誰掌握了最先進的通用大模型 , 誰就更有機會在垂直模型和應用層勢如破竹 。 OpenAI、谷歌、DeepSeek、字節、阿里都是靠性能優異的通用大模型站穩了腳跟 。
但今年以來 , AI大模型戰爭烈度進一步上升 。 新模型的參數規模越來越大 , 單次訓練成本飆升 , 算力芯片、能源及其他基礎設施的需求也飛速增長 , 且看不到盡頭 。 它需要的資金也水漲船高 , 導致越來越多的企業不得不鳴金收兵 。
AI大模型已經成為巨頭主導的游戲 。 二線AI企業紛紛放棄追求SOTA的通用大模型 , 要么轉向編程、圖像等專用模型 , 要么試圖以性價比取勝 。 腰部大廠的技術、產品和人才儲備都更遜一籌 , 自然也沒必要繼續死磕通用大模型 。
除了大模型本身 , 腰部大廠在發展AI APP時 , 還面臨要不要砸錢投流的難題 。
過去一年多 , 背靠字節的豆包長期占據蘋果App Store下載榜首 , 最終擊敗DeepSeek、元寶等對手 , 成為國內最大的AI APP , 月活躍用戶達1.7億 , 日活躍用戶突破1億 。
有消息稱 , 豆包是字節日活破億的產品中推廣費最低的 。 這顯然離不開抖音的全方位扶持和導流 。 相比之下 , 腰部大廠本身流量池有限 , 拉新必須靠外部投流 。 在流量成本高企的2025年 , 這顯然不是一個輕松的決策 。
再考慮到AI大模型的全行業虧損 , 就算依靠投流拉來一波用戶 , 腰部大廠依然會陷入用戶越多、虧得越多的窘境 。 即便強如OpenAI , 今年上半年營收達43億美元 , 凈虧損卻也猛增至135億美元 , 相當于營收的近3倍 。
兼具強大賺錢能力和融資能力的大廠 , 打得起AI燒錢戰爭 。
OpenAI今年拿到了軟銀410億美元的巨額融資 , 主要對手谷歌2024年的凈利潤高達1000億美元 。 在國內 , 新BAT的年度利潤同樣非常豐厚 , 這也為他們分別拋出千億乃至數千億規模的資本開支計劃提供了底氣 。
相比之下 , 腰部大廠竭盡全力也只能掏出百億量級的投入 , 只能放棄AI大模型主戰場 , 轉進更細分的賽道 。
C
在AI大模型這條賽道上 , 腰部大廠從野心勃勃轉變為勉強跟跑的狀態 , 一個關鍵節點是2025年初DeepSeek的崛起 。
去年春節期間 , DeepSeek橫空出世 , 震撼整個AI行業 , 并迅速成為全球用戶量第二的AI應用 。 除了改寫AI大模型技術范式之外 , DeepSeek的另一重價值在于 , 它徹底激活了國內大廠對于AI的野心 。
在DeepSeek席卷全球之前 , 國內AI大模型行業存在一種若有若無的悲觀情緒 , 其根源則是英偉達芯片越來越難以獲得 。 按照彼時的認知 , 沒有大量最先進的芯片 , 就無法構筑強大算力 , SOTA大模型也就無從談起 。 這幾乎封死了國內公司后來居上的理論路徑 。
但DeepSeek的到來改寫了這一切 。 頭部大廠仍然在大規模采購芯片 , 因為經過優化的算力利用效率越來越高 , 大廠不僅資金優勢得到進一步凸顯 , 而且還試圖從技術創新和人才密度方面打開突破口 。
頭部大廠兵馬未動 , 糧草先行 。 阿里拋出3800億的三年投資計劃;字節2026年的資本開支據稱將達到1600億;騰訊沒有披露計劃 , 但高盛在一份研報中認為 , 其2025~2027財年的資本開支總額將高達3500億元 。

除了千億級的資金投入 , 頭部大廠對于AI的野心還體現在對于AI細分領域的滲透上 。
這方面最積極的當數阿里 。 2025年下半年 , 阿里把“通義”更名為“千問” , 試圖成為AI用戶第一入口 , 如今月活已超3000萬;此外還有螞蟻“靈光”“阿?!钡華PP , 分別聚焦vibe coding和AI健康等賽道 。
頭部大廠走“小路” , 在客觀上進一步擠壓了腰部大廠做“小模型”和垂直AI應用的價值 。 同時 , 豆包、千問等通用AI APP正在基于Agent構建第三方服務生態 , 也會讓腰部大廠的壁壘被進一步打開 , 用戶也可能進一步被吸走 。
最后 , 頭部大廠正成為AI頂尖人才的吸鐵石 。
過去一年 , AI頂尖人才向頭部大廠集中的趨勢非常明顯 。 比如騰訊就挖來了前OpenAI研究員姚順雨 , 字節招來了谷歌DEEPMIND研究副總裁吳永輝 。 除了優厚的薪酬 , 頭部大廠的算力、資源和應用場景同樣是吸引人才紛至沓來的關鍵 。
相比之下 , 腰部大廠幾乎沒有拿得出手的牌 , AI人才很容易流失 。 不久前 , 快手推薦算法副總裁、基礎大模型及推薦模型負責人周國睿離職 , 坊間傳聞稱將加入Meta 。
站在2026年的起點 , 腰部大廠紛紛不碰大模型 , 一方面是錢包不夠厚實、實在掏不出千億級的資金;另一方面 , 頭部大廠攻勢太過兇猛、難以招架 , 也讓腰部大廠意興闌珊 。
頭部大廠圍繞AI大模型投入巨資 , 目標是成為AI時代的超級入口 。 近期豆包手機助手發起“突襲” , 很快遭到各大APP的狙擊 , 但AI超級入口的價值已經顯露無遺 。
相比之下 , 腰部大廠并無爭奪下一代入口的雄心壯志 。
在移動互聯網時代 , 通過封閉的APP花園 , 各家巨頭都可以實現一定程度的流量自主權 。 但在AI時代 , AI超級入口對于流量的壟斷將更加徹底;而腰部大廠們在失去AI主動權后 , 不僅無法擁有AGI夢想 , 甚至還將面臨流量被吸走的巨大挑戰 。 何去何從 , 丁磊們或許需要早做打算 。

    推薦閱讀