對話百度文庫產品負責人鐘昊:AI 如何重塑內容創作生態

對話百度文庫產品負責人鐘昊:AI 如何重塑內容創作生態

文章圖片


當大模型從技術奇點躍遷為產業基座 , 當智能體從實驗室走進產線診室 , 人工智能的第三次浪潮正以前所未有的銳度重構全球經濟肌理 。
中國在這場變革中展現出雙重稟賦:既是擁有超大規模應用場景的試煉場 , 又在芯片突圍、算法開源等深水區發起攻堅 。 從單點技術破壁到生態級創新 , 從效率工具到新質生產力引擎 , 一條具有東方特色的AI發展路徑正加速浮現 。
7月26日 , 世界人工智能大會(WAIC 2025)以“智能時代 同球共濟”為主題 , 匯聚了來自AI領域的科技巨頭、學術先鋒與政策制定者 , 而這場覆蓋技術、倫理、藝術的超級盛宴 , 昭示著AI已從“產業變量”進化為“文明常量” 。
在這場關于人工智能產業的盛會上 , 36氪不僅作為產業觀察者 , 更以產業連接者的角色深度參與 , 在展館中搭建了“氪星直播間” , 以對話的形式 , 揭秘人工智能產業進階的底層邏輯 。
在對談中 , 百度文庫產品負責人鐘昊表示:百度文庫經過AI重構 , 能夠充分高效理解用戶意圖、滿足用戶需求 , 一站式、端到端解決用戶問題 。 百度文庫從最開始就堅持了MoE(混合專家模型)架構 , 并通過Genflow進行全局調度 , 出發點就是讓 AI 像人一樣學習工作 , 成為人類最好的搭子 , 幫助用戶更好進行內容的創作和消費 。
以下為對談實錄 , 經36氪編輯:
36kr:首先請您介紹一下自己和業務的情況吧 。
鐘昊:我是百度文庫的產品負責人 。 大家對于百度文庫比較了解的是資料庫屬性 , 經過兩年多的 AI 重構后 , 我們把很多 AI 能力和專業資料內容做了很好的結合 。 現在百度文庫是一站式 AI 內容獲取和創作平臺 , 有幾百個多模態 AI Agent , 可以幫助用戶端到端解決很多創作問題 。 現在的百度文庫已經煥然一新 , 大家可以到 APP 或 PC 端網頁體驗 。
36kr:這次來WAIC的感受是什么樣?有哪些收獲?
鐘昊:百度文庫網盤今年也有參展 。 AI 行業發展確實迅速 。 第一 , 大模型本身在進化 , 不管是文生文、文生圖還是視頻模態 , 模型邊界比往年大大拓寬 , 看到很多有意思的應用 。 另外不管是初創企業還是大公司 , 在都加大了投入決心 , 今年是百花齊放的展會 , 既有共識部分 , 也有突破邊界的部分 。 我個人更期望看到更多突破邊界、更有想象力的嘗試 , 不是很早就陷入局部最優或短期共識解法中 。
36kr:您印象最深刻的展臺是哪一個?
鐘昊:各個展臺有自己的特色 , 文庫網盤更多展示的是場景化和端到端解決具體問題 , 最早我們關注的是用戶對最終交付的內容 , 無論是AI創作還是AI和人共同創作的內容的采納率和使用率 。
文庫和網盤的展臺是按用戶場景設計的 , 不管學習、辦公、生活還是娛樂 , 不同場景都有文庫、網盤的分場景解決方案 , 用戶能感受到需求被充分滿足 。
36kr:在百度文庫AI重構的過程中 , 您認為最大的技術難點是什么?最好用的 AI 功能是哪一個?
鐘昊:最好用且做得最深的是智能 PPT , 我們在國內最早做這個能力 , 現在針對十幾個場景做了深入細化 。 用戶不僅能基于指令生成 , 還可以基于圖片、文檔、素材 , 甚至授權的個人網盤內容生成 PPT , 我們還能支持上傳模板和自定義模板 , 還能直接生成圖表、數據等 。
在智能PPT這個場景 , 我們做得比較深、比較完整 , 在智能PPT的基礎之上 , 我們把同樣思路運用到很多場景 , 現在文庫能生成長短文、研報、思維導圖、AI 繪本、海報等 。
對于技術難點 , 文庫的AI重構 , 已不限于 AI agent 本身的構造 , 更多是理解用戶意圖 , 讓 AI 聰明調度多個 Agent 解決問題 。 比如一個剛剛入學不久的大學新生 , 他需要策劃社團活動方案 , 可能不會明確說要 PPT、海報或策劃文檔 , AI 需要基于專業內容和類似場景解決方案 , 主動給到綜合交付 , 調度不同 Agent 完成任務 。
這對技術的要求會更高 , 你既要能夠理解用戶 , 還要深入挖掘 Query 背后的意圖和需求邊界 , 怎么能高效、合理地為用戶解決問題 。 這樣更偏場景挖掘、場景需求理解和場景解決方案的能力 , 有更深的技術要求 , 以及讓AI變得更聰明才能做到 , 同時它底層有需要細顆粒度、靈活的 Agent , 以及 AI 閱讀器、編輯器等基建支持 , 都是為了完成更綜合的任務挑戰 。
36kr:百度文庫作為國民級產品 , 經歷 AI 原生重構后 , 帶來了哪些顛覆性改變?
鐘昊:最大改變是 , 過去作為百度文庫資料庫只解決用戶需求的一小部分 , 用戶來到文庫 , 找到一篇他需要的內容 , 下載體驗后就結束了 , 他的訴求還沒有被完全滿足 。 現在文庫不僅能高效找到內容 , 還能從零開始或基于現有內容完成綜合任務 。 一方面有 AI 實時人機交互理解需求 , 另一方面借助 AI 融合編輯器等基建 , 用戶可邊思考邊創作 , 調度 AI 完成任務 。 有了這些基建之后 , AI能夠幫你全自動地解決 , 融合編輯器會幫他半自動解決這些過程 , 用戶無需跨多個軟件 , 在一個應用就能快速完成工作 , 產品從資料庫變成一站式平臺 , 這是用戶真正想要的 。
36kr:大模型結合 AI 技術時 , 大家會考慮成本、效果、時延等 “不可能三角” 問題 , 文庫網盤是如何解決的?
鐘昊:百度文庫從重構時就采用 MoE 架構 , 當時行業流行 Prompt 工程 , 但我們發現難以突破模型能力邊界 , 且會碰到不可能三角問題 。 我們先結合具體場景針對性優化 Agent , 比如智能 PPT、長短文、研報、思維導圖等 , 在每個場景打磨中找到最佳平衡點 , 再局部解決不可能三角的問題 。 比如 PPT 配圖時 , 是生成圖片還是直接調取文庫內容 , 后者可能又好又快 。 在一個個分場景的細節打磨中 , 我們逐漸找到了最佳的平衡點 , 以及能讓用戶又快又好獲得高質量交付 。
在此基礎上 , 我們推出 GenFlow 調度中樞 , 馬上就會推出 2.0 版本 。 GenFlow能結合用戶意圖自動調度 Agent 解決問題 , 同樣需求用A方案比B方案更 “多快好省” 。 最底層是 MoE , 之上是細分場景 Agent 打磨 , 在幾百個場景實現局部最佳平衡 , 再通過 Genflow 全局調度 。 越理解用戶需求和 Query 背后意圖 , 越能解決問題 , 基本功在于離場景多近、是否沉下心打磨 。
行業中很多產品遇到了不可能三角的問題 , 會急著找通用方案解決所有用戶的問題 , 但這其實很難 , 在短期內找到最優平衡點 , 反而要沉下心場景打磨 , 這很難 , 但卻離最終目標更近 。
36kr:其實是在具體場景內靈活調整 。
鐘昊:是的 , 通過PMF 滿足用戶需求 , 比如文庫的研報能力剛上線時 , 是解決用戶分析、研究類的需求 , 我們如何保證他需要簡單分析的時候 , 不會生成一篇上萬字的研報?雖然當時能力很領先 , 但這不一定是用戶要的 , 用戶可能只需要簡單分析 , 我們就避免生成冗余內容 , 既節約成本時間 , 又解決不可能三角問題 。 很多時候答案在場景細節里 , 愿意沉下心打磨就離目標更近 。
36kr:其實能做到這一點 , 還是基于百度在AI技術上的積累 。
鐘昊:是的 , 我們投入最早 , 最開始就堅持了 MOE 架構 。 作為應用端產品 , 我們在文心系列模型基礎上探索邊界 , 最終把好食材炒成大餐 , 不僅靠技術積淀 , 更要走進用戶和場景 , 讓技術積累發揮最大化 。
36kr:GenFlow是怎么把模型轉換成生產力的?在多智能體協作上有什么優勢?
鐘昊:我們對GenFlow的最早構思 , 是解決用戶不知道平臺有眾多能力的問題 , 很多用戶不知道文庫網盤又數百個能力 , 用戶和AI進行交互的時候是帶著訴求來的 , 極客愛好者會深度探索 , 但普通用戶沒必要挖掘所有功能 , AI 應該更主動提供服務 , 解決用戶prompt描述清楚或找到入口才能使用的問題 。 我們希望 AI 像人一樣主動工作 , 在交互的過程中允許你提出更多追問和建議 , 并行給你解決方案 , 能夠多線程地去處理很多工作 , 符合上述特征才算的上是主動的AI 。
因此GenFlow 2.0版本即將推出干預模式、并行模式和主動思考能力 , 能主動挖掘用戶過往溝通內容和記憶庫 , 了解用戶對話背后的需求 , 能夠去并行處理N個任務 。
這是我們在行業當中的創新 。 因現在大多數 AI 是串行解決任務 , 但人是能夠并行處理工作的 , 我們認為AI也可以 , 所以我們實現了并行處理 , 推出干預模式讓用戶可隨時打斷、補充、修改內容 , AI了解用戶歷史對話和授權資料 , 主動靈活解決問題 , 過程中能流暢交談 , 這種主動性的提升 , 讓GenFlow的技術能力最大化 。 我們的出發點是解決人機交互問題 , 落腳點是讓 AI 更主動、全面服務人 。
36kr:展望未來 3 到 5 年 , 伴隨著技術越來越成熟 , 整個行業會發生哪些更新的變化?在戰略上是否會有一些新的部署?
鐘昊:未來人機交互一定會更加深入和全面 , 會滲透到人類的工作、學習、生活、娛樂各個方面 , 交互方式的邊界也會更加模糊 , 更多是人類和AI共同完成的 。
【對話百度文庫產品負責人鐘昊:AI 如何重塑內容創作生態】就像為什么文庫、網盤推出GenFlow一樣 , 首先我們希望AI能像人一樣思考 , 學習、工作 , 讓AI成為人類最好的搭子 , 從布局上來講 , 我們一直沿著內容的主航道布局 , 從內容生產的起點到內容消費的終點 , 是百度文庫和百度網盤一直在做的事情 。 我們希望讓 AI 幫助大家更好進行內容的創作和消費 。
未來某一天 , 我們會嘗試新形式的辦公和學習 , 不一定需要電腦 , 可能從口袋里拿出一個設備 , 在3-5分鐘就能完成原來一、兩個星期才能完成的工作 。
比如在娛樂放松的時候 , 能很方便地把小說轉變成動畫的形式 , 不需要去逐行讀文字 , 讓AI實現我們的想象力 , 我們看很多文學作品的時候也會有自己的想法 , 這時候我們又變成了創作者 。
這是AI是我最好的幫手 , 因為我沒學過繪畫 , 也不是專業的剪輯師 , 但AI可以像一個團隊一樣幫我實現 , 最大程度降低創作門檻 , 讓每一個有創造力的人 , 都能充分發揮自己的想法 , 并且被更多人看到 。
AI在理解每一個用戶需求的同時 , 給他推薦更好的內容 , 同時提升效率 , 節省時間 , 人們通過更低門檻的AI平臺發揮自己的創想 , 生產出來的內容又被更多人消費 , 我非常期待這樣一個新世界 。

    推薦閱讀