領先ChatGPT Agent三個月,國民級產品為何闖進通用Agent領域?

領先ChatGPT Agent三個月,國民級產品為何闖進通用Agent領域?

文章圖片

領先ChatGPT Agent三個月,國民級產品為何闖進通用Agent領域?

文章圖片

領先ChatGPT Agent三個月,國民級產品為何闖進通用Agent領域?

文章圖片




【領先ChatGPT Agent三個月,國民級產品為何闖進通用Agent領域?】作者 商迪安


全球通用Agent領域的英雄榜 , 再次得到刷新 。

8月18日 , 百度文庫、百度網盤聯合發布全球首個全端通用Agent“GenFlow2.0” 。

在發布會后的訪談中 , 文庫事業部、網盤事業部負責人王穎講道:“文庫網盤 , 發出來的都是現貨 。 ”正如她所說 , 4個月前GenFlow以發布即可用的姿態闖進市場 。

最新的文庫GenFlow2.0延續了這種務實風格 , 已于即日起上線百度文庫網頁、App全端 , 無需邀請碼、立即可用 。 不僅如此 , GenFlow2.0能夠調度100+Agent同時運行任務 , 并行完成5個以上復雜任務只需3分鐘 , 速度可達同類產品的5-10倍 。



3分鐘完成超5個復雜任務 , 多智能體協作不再“翻車”

網紅通用Agent“一碼難求”“高價競購”的場景還留在用戶的記憶里 , 一場祛魅就已上演 。

理想情況下 , 用戶只需進行簡單的自然語言交互 , 就能讓通用Agent調動多智能體(Multi- Agent)協同、完成復雜任務 。 但隨著用戶真正“上手”實操 , 問題逐漸涌現了出來 。

不少用戶經過實踐后反饋 , 通用Agent存在需要反復調整描述輸入、任務交付質量低、等待時間過長、答案空洞有誤、無法編輯等種種問題 。 在各大論壇之中 , “為什么Multi- Agent總是失敗”也成了熱門討論話題 。

這甚至得到了數據支撐 , 來自加州大學伯克利分校等機構的團隊調研了海外5個Multi- Agent系統的故障率 , 其中一大工具甚至出現了高達86.7%的故障率數值 , 也從側面說明現有的許多通用Agent并不能精準捕捉需求和執行任務、距離理想狀態仍有不遠距離 。



凡此種種 , 折射出的是不少通用Agent受限于系統設計缺陷、數據缺失、知識庫協同不足等種種原因 , 而難以發揮出全部潛能 , 也為許多用戶留下了AI能力不足的“初印象” 。 在與媒體溝通時 , 百度文庫、網盤團隊分享道 , 這正是GenFlow2.0希望攻克的難題 。

為了測評文庫GenFlow2.0性能是否達到預期 , 「電廠」輸入了一個針對全球GPU芯片龍頭英偉達的企業研究任務 , 要求了解該公司的發展歷程、歷年財務狀況與業務布局 , 并要求以不同文件格式輸出研究結果 。

運行過程顯示 , 文庫GenFlow2.0第一時間拆分出了8個子任務 , 并使用深度檢索工具搜集核心信息 , 最終在幾分鐘的時間內執行完畢 , 并且生成內容基本準確 , 且格式符合企業調研要求 。


圖源/百度文庫GenFlow2.0

另一個針對初中物理教師教學材料的生成任務(含5個子任務)則在3分鐘內內運行完畢 。 官方數據顯示 , GenFlow2.0的運行速度是同類產品的10倍 , 實現了實現分鐘級“并行”工作和交付 。

運行速度提升背后 , 文庫GenFlow2.0 采用了自研的Multi-Agent基礎架構 , 而非主流的Agent串行工作流 。 為了提升交互體驗 , 文庫App端還將常規的“瀑布式”工作流升級為“并列式” 。

除此之外 , 在生成過程中 , 文庫GenFlow2.0支持用戶在任務過程隨時「干預」 , 用戶可根據場景需求、隨時在GenFlow2.0聊天窗口要求暫停、進行追問、修改思考內容、上傳文件參考等 , GenFlow2.0將根據最新要求實時調整生成內容 。

在交付能力上 , 除了「電廠」體驗的PPT、文檔、圖片之外 , GenFlow2.0還覆蓋了研報、視頻繪本、海報、圖表、HTML、代碼、游戲、網站等多模態內容 。 全模態的生成能力背后 , 文庫GenFlow2.0可調用100+多模態Agent組成的“AI專家團” , 全面滿足用戶需求 。

并且所有Agent均經過文庫網盤數億用戶驗證 。 比如 , 文庫PPT Agent的用戶訪問量已達全球第一、采納率接近90%;研報Agent則在行業率先實現了數萬字專業報告的分鐘級生成、同時生成專業級可視化圖表的能力 。

王穎透露 , 為保證用戶體驗 , 當下GenFlow2.0接入的Agent以百度自研居多 , 但隨著產品發展 , 第三方Agent也將日益豐富 。


兩年全面AI重構 , 文庫網盤展現煥新“增長力”要拆解GenFlow2.0性能提升的原因 , 除了前述功能設計之外 , 也不能脫離其根植于百度生態資源的背景 。

從2023年開始 , 文庫網盤就陸續開始了長達兩年的AI重構 。

在GenFlow2.0的發布會上 , 主創團隊介紹稱 , GenFlow的定位是提供一支“牢記初心、目標清晰、聽從指揮、能打勝仗”高效率的AI專家團隊 。 為此研發團隊在技術基座上進行了大量投入 。



比如 , 在模型層 , 文庫網盤自AI重構以來就堅持采用MoE(底層專家模型) , 可基于不同任務、步驟來調用不同模型——這也是當前大模型的主流架構選擇 , 從2024年開始 , 不少大模型玩家開始轉向MoE 。

在技術方面 , GenFlow2.0自建了Multi-Agent引擎 , 并積極優化上下文工程 , 為模型構建信息生態系統;通過動態混合推理、多模式智能化調度、公私域知識增強以及全模態渲染編輯 , 實現對復雜任務的一站式端到端交付;以及構建包括全周期消息總線、多模態數據理解、臨短長記憶中樞、多級風控體系等能力的基礎底座 , 致力于實現性能、效果和擴展性的最優解 。

在今年4月舉辦的百度Create 2025開發者大會上 , 百度文庫、百度網盤攜手推出內容操作系統“滄舟OS” , 并基于該系統首發“GenFlow1.0”版本 。 截至目前 , 百度文庫擁有超14億專業內容資源 , AI月活用戶超9700萬 , 擁有智能PPT、智能文檔、AI繪本等數百項AI能力;百度網盤已累計服務超10億用戶 , 月活用戶超2億 , AI月活用戶超8000萬 。



此外 , GenFlow2.0兼容MCP協議 , 可靈活接入第三方服務生態 , 支持廠商、企業用戶、智能體應用、開發者等接入 , 面向用戶提供更加豐富的服務項 。 當前 , 榮耀已作為全球首批接入MCP生態的硬件廠商 , 將GenFlow2.0原生接入榮耀智能助理YOYO 。

借此 , 榮耀MagicOS用戶可一鍵獲取個人網盤知識庫與文庫專業文檔 , 實現網盤檢索、內容分享、聯網搜索、圖片理解、文件總結與問答、文庫PPT生成等體驗 , 實現AI Agent與硬件廠商的系統級原生調度 。

而這 , 還遠未抵達通用Agent的終局 , 在那之前百度文庫網盤仍將持續發力 。

活動上 , 文庫網盤宣布升級開發者權益 , 將新開放和優化升級超100項能力 , 并針對所有能力提供免費額度 , 以賦能更多開發者 。

企業與市場脈搏共振 , 隨著用戶好奇心褪去、對于價值的拷問成了所有市場玩家無法面對的問題 , 當全球大模型應用市場步入深水區的同時 , 百度的AI重構也日益縱深 。

通用Agent市場還沒有標準答案 , 但唯有歷經不輟地探索與投入 , 才能將人們對“未來工作方式”“超級生產力”的想象落地現實 。 包括百度在內 , 市場仍在拔足狂奔 , 但許多有趣的變化已在發生 。

    推薦閱讀