AI四小強重新上桌了?

AI四小強重新上桌了?

文章圖片

AI四小強重新上桌了?

文章圖片


當7月16日身著唐裝的黃仁勛在公開演講中 , 將MiniMax與“DeepSeek、阿里巴巴、百度”一同提及 , 并稱“開發的產品都是世界級”時 , 沉寂半年之久的AI四小強 , 頗似甄嬛回宮 , 手里拿上了逆襲劇本 。
實際上 , 進入7月 , 扎堆推出Deep Research的AI四小強 , 正躍躍欲試重新登上牌桌 。
近期 , 階躍星辰的階躍AI Deep Research正式開啟邀請測試 , 此前6月 , MiniMax連續5天上新了推理模型M1、視頻生成模型、Agent等 , 其中MiniMax-M1集成了包括Deep Research(深度研究)在內的技能 , 同在6月 , 月之暗面的Kimi Research跟上 。 而早在3月底 , 智譜發布了AutoGLM沉思版 , 作為智能體(AI Agent)也融合了Deep Research能力 。
截止發稿前 , AI四小強已全搶上這一波Deep Research的船票 , 并在7月爭先恐后在模型層上新 , 前半年低調發育的AI四小強 , 在大廠夾擊下正迅速追上 。
“現在大模型進入了深水區 , 單靠模型參數或者Demo已經沒辦法說服市場了 , ”某頭部創投機構聯創林晟(化名)告訴字母榜 , 對商業化壓力越來越大的AI四小強而言 , 在垂直領域做深 , 做更能交付價值的Deep Research以及Agent , 都是在大廠圍剿中較為安全的生態位 。
AI四小強也“需要通過跟上Deep Research這樣關鍵的技術迭代向投資人證明 , 他能在大模型下半場占有一席之地 。 ”林晟補充道 。
同時 , 對AI四小強來說 , 跟進Deep Research , 押注可以自主規劃任務并交付結果的AI Agent , 不僅是為重上牌桌 , 也是要搏一個“錢景” 。
據外媒報道 , 為了使用OpenAI面向ChatGPT Pro用戶推出的Agent “Deep Resaerch” , 約20%的用戶升級成了每月訂閱費高達200美元的Pro會員 。 同時 , 恒業資本管理合伙人江一告訴字母榜 , 隨著DeepSeek的爆火 , 他們慧辰股份推出的消費Agent , 原本在AI方面沒有投入預算的客戶 , 已經將原本信息化的預算挪向AI , 而這些應用Agent的訂單往往都在數百萬級別 。
這一次 , AI四小強能重新上桌嗎?
01
在2025年的AI Agent熱潮里 , Deep Resaerch(深度研究)類的產品是最早落地的一批 。
從去年底谷歌發布首個Deep Resaerch開始 , 數月內 , OpenAI、Anthropic等迅速跟進 , 能做PPT、寫財報分析、進行學術研究的Deep Resaerch成了新的技術標桿 , 也讓AI Agent在用AI 輔助人的道路上向前邁了一步 。
如今AI四小強都推出了自家的Deep Research , 正面硬剛字節、騰訊等大廠 。
不過需要注意的是 , Agent作為四小強關鍵的技術展示窗口 , 楊植麟們的表現頗為謹慎 。 都以內測版開路 , 通過一個月的小范圍內測 , 去收集專業用戶的反饋意見 , 在調試后才全量上線 。
這種謹慎開大的做法也顯露出AI四小強對這次亮相的重視 。
此外 , 在Deep Resaerch的路徑選擇上 , AI四小強也分裂出了兩種路徑 。
一條路徑崇尚傻瓜式操作 , 門檻更低 , 以月之暗面的Kimi-Researcher為代表 , 摸著OpenAI、Gemini過河 。 正如OpenAI demo所演示的一般 , 用戶只需發出指令 , 合上電腦等待 , 就能得到一份達到研究分析師水準的報告 。 和月之暗面選擇同樣路徑的 , 還有字節 。
這種路徑選擇讓AI自主思考和理解 , 推理和調用工具來解決問題 , 極大降低了用戶的使用門檻 。 “用戶不需要準備復雜的提示詞 , 只需要等待 , 甚至為了沒有耐心的大部分用戶 , OpenAI官方宣稱任務交付時長在1-30分鐘 , 測試下來Kimi-Researcher一般都會在10-20內生成結果 。 ”在某國企AI相關部門就職的宋城(化名)告訴字母榜 。
另一種則是高用戶互動型 , 結果很可控 , 包括智譜、Minimax , 選擇了類Manus的工作流(Workflow)模式 。
此外 , Kimi還會提供一份可視化的報告 , 提供提供卡片、表格、思維導圖等多種信息 , 目前ChatGPT 尚未提供類似的功能 。
在這種模式下 , 用戶需要準備復雜的提示詞 , 提示詞的復雜程度決定了生成效果 , 而且在Agent工作過程中 , 隨著持續調用工具 , 用戶需要加入提供反饋 , 宋城表示 , 這種模式AI的動作軌跡都一早設計好 , 可控性更高 , 只是用戶被綁在了任務上 , “如果一個任務需要跑1-2個小時 , 為了及時給AI做確認、糾偏 , 需要時刻注意頁面 。 ”
但最終兩種路線的分歧 , 實際上都指向了一個核心問題 , 即無論走哪一條路 , 當下大模型的能力還不足以支持更智能的Agent的推出 , 對用戶來說 , 每次任務執行都有開盲盒的錯覺 , 因此AI四小強也在補足自身的模型能力 。
無論是Mini Max推出的M1新模型 , 上下文的長度達到一兆 , 還是月之暗面的K2模型 , 總參數量達到一萬億 , 就在7月25日 , 階躍星辰場發布了Step 3大模型 。 針對國產卡32K上下文 , 這代模型推理效率最高可達到deepseek R1的300% 。
02
事實上 , 從AI六小龍到AI四小強 , 楊植麟們的2025年過的頗為艱難 。
隨著年初Deepseek帶起推理模型的新潮流 , 原本佛系觀戰的騰訊攜元寶強勢下場 , 阿里也用夸克瀏覽器爭奪新流量入口 , 字節的豆包短暫從下載榜滑落 , 但憑借頻繁的迭代上新持續探入垂直場景 。
“在年初我們(Kimi)停止投流之后 ,國內不少應用商店搜索 kimi 甚至第一頁都看不見 ,在蘋果 App Store 搜 kimi 會推薦豆包 ,在某度搜 kimi 會推薦 某度 DeepSeek-R1 滿血版 。 ”
Kimi發布K2 大模型后 , Kimi 的技術員公開表示 , 即便面對如此艱難的情況 , Kimi 也沒有恢復投流 。
去年在大模型賽道上激進砸錢推流的AI六小龍 , 一時之間陷入了對自身技術實力的自證漩渦 。 這似乎也讓楊植麟們意識到 , 技術實力似乎遠比用戶規模 , 更能決定大模型創企的發展 。
半年內 , AI四小強悄悄調整重心 , 在生存壓力下 , 放棄對用戶規模的追逐成了第一步 。
從去年12月至今 , 一批負責應用和商業化的六小龍高管相繼離開 。 其中包括但不限于前智譜COO張帆、前MiniMax商業化負責人魏偉、前月之暗面核心產品負責人明超平、前階躍星辰“冒泡鴨”產品負責人張心皓(尚未離職 , 轉為內部顧問)等等 。 月之暗面也傳出了調整投放策略的消息 。
從Deepseek的推理模型 , 海外科技大廠如Claude、XAI等在Deep Resaerch上的新突破 , 到Manus的Agent熱 , 大模型的競爭熱詞短短數月換了幾輪 , 被DeepSeek沖擊估值體系的AI四小強 , 不得不重新將技術迭代確立為公司的最高優先級 。
而在這場AI時代的“注意力資源”比拼之戰中 , 重新跟上節奏的AI四小強 , 需要向外界證明自己有重上牌桌的實力和可能性 。 Agent成了最好的發力點 。
“過去國內大模型都在對標OpenAI、復制OpenAI , 現在在Agent這樣的應用層 , 要打差異化了 。 ”江一告訴字母榜 , AI頭部創企正試圖在垂直技術的長板上去做突破 , 避免與大廠的同質化競爭 。
Kim7月推出萬億參數的 K2模型 , 為智能體任務(agentic tasks)做了專門優化 , 被Hugging Face、Perplexity CEO 發文稱贊 。 多模態則是MiniMax的舒適區 , 近期發布的視頻模型Hailuo 02在Artificial Analysis Video Arena評測榜上排名第二 , 僅次于字節的Seedance 1.0 。
可以看到 , 跑在前面的已經拿到了來自資本市場的好消息 。
智譜頻頻傳出融資消息 , 又成為首個正式開啟上市輔導備案的AI大模型創企 , MiniMax爆出即將完成近3億美元(約合人民幣22億元)新融資 , 并向港交所提交IPO申請 , 目標“今年內上市” , 估值從25億美元沖到40–50億美元之間 。
押注Agent , AI四小強已經跟上來了 。
03
不過 , 在Agent時代 , 跟上節奏的AI四小強還需再次證明自己的價值 。
技術卡位戰是楊植麟們首先要自證的第一道坎 。 盡管月之暗面6月發布的 Kimi-Researcher, 聲稱在「人類最后一場考試」(Humanity's Last Exam) 中 , 取得了 26.9% 的 Pass@1 成績 , 創下最新的 SOTA 水平 , 但可以看到 , 相比起引發熱議的Manus、Lovert , 前者拿到硅谷知名風投Benchmark領投的7500萬美元融資 , 亮相3個月完成文生圖、視頻生成功能的迅速迭代;后者頂著全球首個設計Agent的名頭得到了馬斯克的激情點贊 。
更為出圈的Manus、Lovert , 調用的都并非國內的大模型 。 對楊植麟們而言 , 拿出自研Agent只是第一步 。 他們需要用更出圈的應用案例 , 證明自身技術的優越性 。
“Agent需要給客戶創造愿意付費并且可量化的價值 。 ”
江一告訴字母榜 , 在Agent創企們拿著錘子找釘子的過程中 , 出圈的應用案例要給客戶提供真金白銀的可量化價值 , 而這往往并非用ChatBot這類基礎功能可以達到的 。 他們為一位大客戶交付了Agent矩陣 , 涉及到從門店銷售、找高潛門店售點鋪貨 , 到定市場策略、協同物流等多個流程 。 其中 , 客戶有20萬地推銷售 , 工資高 , 流動性更達到60%-70% , 培訓成本占到了營收的12% 。 通過培訓銷售使用Agent , 客戶將原本銷售30天的入職培訓時間縮短到了兩天 , 新人用agent也能達到中等偏上的銷售水平 。
對AI四小強來說 , 找到目標客戶后如何創造遠大于售賣價格的交付價值 , 用出圈的應用案例證明自己 , 是必然要闖的第一關 。
但在Agent大爆發的2025年 , 楊植麟們也缺“錢多、有耐心”的好客戶 。
盡管算力價格被大廠聯手打進“厘時代” , 但不同于單純對話的有限的算力消耗 , 需調用多個大模型、訪問多個網址的Agent , 每個任務的Token消耗量都不低 。 “生成一份還可用的調研報告 , 要22萬token , 用cursor(智能編程)一個來回就消耗300萬token” , 在某國企就職的宋城告訴字母榜 , 對企業來說 , 使用Agent的成本并不算低 。
同時 , 技術的迅速迭代也讓Agent的使用成本節節攀高 。 “Manus發布前核算完成單次任務的成本在2-3美元 , 幾輪優化后原本成本已經降低 , 但迭代添加視頻生成能力等等 , 成本又再次拉了上去 , ”前Manus員工方成(化名)告訴字母榜 。
而使用成本的高昂、單次任務執行動輒要半小時、甚至一小時完成任務 , 就連OpenAI也在“祈求”用戶的耐心 。
在OpenAI面向ChatGPT Pro用戶推出的Agent “Deep Resaerch”后 , 其團隊核心成員Issa Fulford接受采訪時就表示“(OpenAI Deep Resaerch)的目標用戶是專業消費者(prosumer) , 那些愿意為了一個詳細報告等待 30 分鐘的人 。 ”
根據SimilarWeb的監測數據顯示 , 2025年以來 , Manus的月訪問量從3月的2376萬次 , 跌到了6月的1730萬次;Genspark的月訪問量從4月的888萬次 , 下降到了6月的769次 。 頭部Agent 的增長頹勢也告訴我們 , Agent距離跑通PMF(產品市場匹配度)還有一段路要走 。
【AI四小強重新上桌了?】無論如何 , 可以肯定的是 , AI四小強 , 必須開始賺錢了 。

    推薦閱讀