AI四小強重新上桌了？

2026-04-24 人工智能 deepseek manus openai minimax

文章圖片

文章圖片

當7月16日身著唐裝的黃仁勛在公開演講中，將MiniMax與“DeepSeek、阿里巴巴、百度”一同提及，并稱“開發的產品都是世界級”時，沉寂半年之久的AI四小強，頗似甄嬛回宮，手里拿上了逆襲劇本。
實際上，進入7月，扎堆推出Deep Research的AI四小強，正躍躍欲試重新登上牌桌。
近期，階躍星辰的階躍AI Deep Research正式開啟邀請測試，此前6月， MiniMax連續5天上新了推理模型M1、視頻生成模型、Agent等，其中MiniMax-M1集成了包括Deep Research（深度研究）在內的技能，同在6月，月之暗面的Kimi Research跟上。而早在3月底，智譜發布了AutoGLM沉思版，作為智能體(AI Agent)也融合了Deep Research能力。
截止發稿前， AI四小強已全搶上這一波Deep Research的船票，并在7月爭先恐后在模型層上新，前半年低調發育的AI四小強，在大廠夾擊下正迅速追上。
“現在大模型進入了深水區，單靠模型參數或者Demo已經沒辦法說服市場了， ”某頭部創投機構聯創林晟（化名）告訴字母榜，對商業化壓力越來越大的AI四小強而言，在垂直領域做深，做更能交付價值的Deep Research以及Agent ，都是在大廠圍剿中較為安全的生態位。
AI四小強也“需要通過跟上Deep Research這樣關鍵的技術迭代向投資人證明，他能在大模型下半場占有一席之地。 ”林晟補充道。
同時，對AI四小強來說，跟進Deep Research ，押注可以自主規劃任務并交付結果的AI Agent ，不僅是為重上牌桌，也是要搏一個“錢景” 。
據外媒報道，為了使用OpenAI面向ChatGPT Pro用戶推出的Agent “Deep Resaerch” ，約20%的用戶升級成了每月訂閱費高達200美元的Pro會員。同時，恒業資本管理合伙人江一告訴字母榜，隨著DeepSeek的爆火，他們慧辰股份推出的消費Agent ，原本在AI方面沒有投入預算的客戶，已經將原本信息化的預算挪向AI ，而這些應用Agent的訂單往往都在數百萬級別。
這一次， AI四小強能重新上桌嗎？
01
在2025年的AI Agent熱潮里， Deep Resaerch（深度研究）類的產品是最早落地的一批。
從去年底谷歌發布首個Deep Resaerch開始，數月內， OpenAI、Anthropic等迅速跟進，能做PPT、寫財報分析、進行學術研究的Deep Resaerch成了新的技術標桿，也讓AI Agent在用AI 輔助人的道路上向前邁了一步。
如今AI四小強都推出了自家的Deep Research ，正面硬剛字節、騰訊等大廠。
不過需要注意的是， Agent作為四小強關鍵的技術展示窗口，楊植麟們的表現頗為謹慎。都以內測版開路，通過一個月的小范圍內測，去收集專業用戶的反饋意見，在調試后才全量上線。
這種謹慎開大的做法也顯露出AI四小強對這次亮相的重視。
此外，在Deep Resaerch的路徑選擇上， AI四小強也分裂出了兩種路徑。
一條路徑崇尚傻瓜式操作，門檻更低，以月之暗面的Kimi-Researcher為代表，摸著OpenAI、Gemini過河。正如OpenAI demo所演示的一般，用戶只需發出指令，合上電腦等待，就能得到一份達到研究分析師水準的報告。和月之暗面選擇同樣路徑的，還有字節。
這種路徑選擇讓AI自主思考和理解，推理和調用工具來解決問題，極大降低了用戶的使用門檻。 “用戶不需要準備復雜的提示詞，只需要等待，甚至為了沒有耐心的大部分用戶， OpenAI官方宣稱任務交付時長在1-30分鐘，測試下來Kimi-Researcher一般都會在10-20內生成結果。 ”在某國企AI相關部門就職的宋城（化名）告訴字母榜。
另一種則是高用戶互動型，結果很可控，包括智譜、Minimax ，選擇了類Manus的工作流（Workflow）模式。
此外， Kimi還會提供一份可視化的報告，提供提供卡片、表格、思維導圖等多種信息，目前ChatGPT 尚未提供類似的功能。
在這種模式下，用戶需要準備復雜的提示詞，提示詞的復雜程度決定了生成效果，而且在Agent工作過程中，隨著持續調用工具，用戶需要加入提供反饋，宋城表示，這種模式AI的動作軌跡都一早設計好，可控性更高，只是用戶被綁在了任務上， “如果一個任務需要跑1-2個小時，為了及時給AI做確認、糾偏，需要時刻注意頁面。 ”
但最終兩種路線的分歧，實際上都指向了一個核心問題，即無論走哪一條路，當下大模型的能力還不足以支持更智能的Agent的推出，對用戶來說，每次任務執行都有開盲盒的錯覺，因此AI四小強也在補足自身的模型能力。
無論是Mini Max推出的M1新模型，上下文的長度達到一兆，還是月之暗面的K2模型，總參數量達到一萬億，就在7月25日，階躍星辰場發布了Step 3大模型。針對國產卡32K上下文，這代模型推理效率最高可達到deepseek R1的300% 。
02
事實上，從AI六小龍到AI四小強，楊植麟們的2025年過的頗為艱難。
隨著年初Deepseek帶起推理模型的新潮流，原本佛系觀戰的騰訊攜元寶強勢下場，阿里也用夸克瀏覽器爭奪新流量入口，字節的豆包短暫從下載榜滑落，但憑借頻繁的迭代上新持續探入垂直場景。
“在年初我們（Kimi）停止投流之后，國內不少應用商店搜索 kimi 甚至第一頁都看不見，在蘋果 App Store 搜 kimi 會推薦豆包，在某度搜 kimi 會推薦某度 DeepSeek-R1 滿血版。 ”
Kimi發布K2 大模型后， Kimi 的技術員公開表示，即便面對如此艱難的情況， Kimi 也沒有恢復投流。
去年在大模型賽道上激進砸錢推流的AI六小龍，一時之間陷入了對自身技術實力的自證漩渦。這似乎也讓楊植麟們意識到，技術實力似乎遠比用戶規模，更能決定大模型創企的發展。
半年內， AI四小強悄悄調整重心，在生存壓力下，放棄對用戶規模的追逐成了第一步。
從去年12月至今，一批負責應用和商業化的六小龍高管相繼離開。其中包括但不限于前智譜COO張帆、前MiniMax商業化負責人魏偉、前月之暗面核心產品負責人明超平、前階躍星辰“冒泡鴨”產品負責人張心皓（尚未離職，轉為內部顧問）等等。月之暗面也傳出了調整投放策略的消息。
從Deepseek的推理模型，海外科技大廠如Claude、XAI等在Deep Resaerch上的新突破，到Manus的Agent熱，大模型的競爭熱詞短短數月換了幾輪，被DeepSeek沖擊估值體系的AI四小強，不得不重新將技術迭代確立為公司的最高優先級。
而在這場AI時代的“注意力資源”比拼之戰中，重新跟上節奏的AI四小強，需要向外界證明自己有重上牌桌的實力和可能性。 Agent成了最好的發力點。
“過去國內大模型都在對標OpenAI、復制OpenAI ，現在在Agent這樣的應用層，要打差異化了。 ”江一告訴字母榜， AI頭部創企正試圖在垂直技術的長板上去做突破，避免與大廠的同質化競爭。
Kim7月推出萬億參數的 K2模型，為智能體任務（agentic tasks）做了專門優化，被Hugging Face、Perplexity CEO 發文稱贊。多模態則是MiniMax的舒適區，近期發布的視頻模型Hailuo 02在Artificial Analysis Video Arena評測榜上排名第二，僅次于字節的Seedance 1.0 。
可以看到，跑在前面的已經拿到了來自資本市場的好消息。
智譜頻頻傳出融資消息，又成為首個正式開啟上市輔導備案的AI大模型創企， MiniMax爆出即將完成近3億美元（約合人民幣22億元）新融資，并向港交所提交IPO申請，目標“今年內上市” ，估值從25億美元沖到40–50億美元之間。
押注Agent ， AI四小強已經跟上來了。
03
不過，在Agent時代，跟上節奏的AI四小強還需再次證明自己的價值。
技術卡位戰是楊植麟們首先要自證的第一道坎。盡管月之暗面6月發布的 Kimi-Researcher，聲稱在「人類最后一場考試」(Humanity's Last Exam) 中，取得了 26.9% 的 Pass@1 成績，創下最新的 SOTA 水平，但可以看到，相比起引發熱議的Manus、Lovert ，前者拿到硅谷知名風投Benchmark領投的7500萬美元融資，亮相3個月完成文生圖、視頻生成功能的迅速迭代；后者頂著全球首個設計Agent的名頭得到了馬斯克的激情點贊。
更為出圈的Manus、Lovert ，調用的都并非國內的大模型。對楊植麟們而言，拿出自研Agent只是第一步。他們需要用更出圈的應用案例，證明自身技術的優越性。
“Agent需要給客戶創造愿意付費并且可量化的價值。 ”
江一告訴字母榜，在Agent創企們拿著錘子找釘子的過程中，出圈的應用案例要給客戶提供真金白銀的可量化價值，而這往往并非用ChatBot這類基礎功能可以達到的。他們為一位大客戶交付了Agent矩陣，涉及到從門店銷售、找高潛門店售點鋪貨，到定市場策略、協同物流等多個流程。其中，客戶有20萬地推銷售，工資高，流動性更達到60%-70% ，培訓成本占到了營收的12% 。通過培訓銷售使用Agent ，客戶將原本銷售30天的入職培訓時間縮短到了兩天，新人用agent也能達到中等偏上的銷售水平。
對AI四小強來說，找到目標客戶后如何創造遠大于售賣價格的交付價值，用出圈的應用案例證明自己，是必然要闖的第一關。
但在Agent大爆發的2025年，楊植麟們也缺“錢多、有耐心”的好客戶。
盡管算力價格被大廠聯手打進“厘時代” ，但不同于單純對話的有限的算力消耗，需調用多個大模型、訪問多個網址的Agent ，每個任務的Token消耗量都不低。 “生成一份還可用的調研報告，要22萬token ，用cursor（智能編程）一個來回就消耗300萬token” ，在某國企就職的宋城告訴字母榜，對企業來說，使用Agent的成本并不算低。
同時，技術的迅速迭代也讓Agent的使用成本節節攀高。 “Manus發布前核算完成單次任務的成本在2-3美元，幾輪優化后原本成本已經降低，但迭代添加視頻生成能力等等，成本又再次拉了上去， ”前Manus員工方成（化名）告訴字母榜。
而使用成本的高昂、單次任務執行動輒要半小時、甚至一小時完成任務，就連OpenAI也在“祈求”用戶的耐心。
在OpenAI面向ChatGPT Pro用戶推出的Agent “Deep Resaerch”后，其團隊核心成員Issa Fulford接受采訪時就表示“（OpenAI Deep Resaerch）的目標用戶是專業消費者（prosumer），那些愿意為了一個詳細報告等待 30 分鐘的人。 ”
根據SimilarWeb的監測數據顯示， 2025年以來， Manus的月訪問量從3月的2376萬次，跌到了6月的1730萬次；Genspark的月訪問量從4月的888萬次，下降到了6月的769次。頭部Agent 的增長頹勢也告訴我們， Agent距離跑通PMF（產品市場匹配度）還有一段路要走。
【AI四小強重新上桌了？】無論如何，可以肯定的是， AI四小強，必須開始賺錢了。

推薦閱讀

上一篇：2025國補后，堪稱“銷量冠軍”的3款手機，16GB+512GB備受歡迎

下一篇：WAIC機器人探展：我被全場最靚的崽「Moz1」種草了