百度亮出秘密武器:一個自我演化的AI,給出了人類做不到的最優解

百度亮出秘密武器:一個自我演化的AI,給出了人類做不到的最優解

文章圖片

百度亮出秘密武器:一個自我演化的AI,給出了人類做不到的最優解

文章圖片

百度亮出秘密武器:一個自我演化的AI,給出了人類做不到的最優解

文章圖片

百度亮出秘密武器:一個自我演化的AI,給出了人類做不到的最優解

文章圖片


機器之心報道
【百度亮出秘密武器:一個自我演化的AI,給出了人類做不到的最優解】編輯:澤南
從「執行者」到「發明家」 , AI 進化的幅度又加快了 。
這就是未來解決難題的方式?
只要你輸入自然語言指令和必要的數據 , 一群智能體就可以針對復雜問題設立項目進行研究 , 自己去尋找解法 。

不論是金融、交通還是港口物流領域 , 人類專家需要幾十天才能完成的工作 , 使用 AI 智能體只需要幾天甚至幾小時 , 還能找出更優的解法 。


這一系列效率的提升 , 都來自于昨天百度世界大會上新發布的全球首個可商用、自我演化超級智能體百度伐謀 , 由百度智能云團隊打造 。 目前 , 伐謀已正式對外開放 , 并通過邀請碼的形式提供服務 。
在大會現場 , 李彥宏表示 , 這是一個全新的、能自我進化的智能體 , 能夠在各種重要工業應用場景中自動找出全局最優解 , 「只要問題的解法是明確可驗證的 , 伐謀就可以模擬甚至超越頂尖的算法專家 。 」

從入門的代碼生成 , 到高階的全業務流程優化 , ChatGPT 出現還沒滿三年 , AI 就已經實現了能力維度上的擴展 , 實現了從「執行指令」到「自主發現」的跨越 , 甚至還能發現人類無法想到的解決方案 。
四大核心技術
打造 AI 優化引擎標桿
伐謀是一個讓 AI 算法自主進化、尋找全局最優的多智能體系統 , 可以高效率地解決高難度的問題 。 它結合了大語言模型和進化搜索算法 , 旨在通過大語言模型的推理能力與大規模進化搜索來解決復雜的現實世界問題 。
面對現實世界的復雜問題 , 如何能讓 AI 代替算法工程師來尋找解法 , 并進行調優 , 是一個很有挑戰的任務 。
百度智能云團隊發布了伐謀(FM Agent)的技術報告 , 我們可以從中了解其主要的技術特點 。

伐謀系統在處理復雜算法問題時的工作流程 。
技術報告鏈接:https://arxiv.org/abs/2510.26144整體來看 , 伐謀具備跨領域、端到端的自動化問題求解能力 , 涵蓋以下四大場景:
機器學習——包括自動化特征工程、特征組合、模型融合;可實現端到端構建機器學習流程 , 無需人工干預 。 組合優化——可以自主設計啟發式算法、增強傳統求解器(如 MIP、CP)的能力 , 直接生成高質量解 。 GPU 內核生成——能自動優化 CUDA 內核 , 提升計算效率 , 在 KernelBench 上實現 2 倍到 20 倍的加速 。 數學問題求解——在圓填充、不確定性不等式、距離比最小化等問題中達到 SOTA;可以結合符號推理與進行數值優化 。在工作的整體邏輯上 , 伐謀在收到指令后首先使用智能體尋找算法 , 選擇優勢品種進行進化 , 在這其中應用的方法既包括經典的專家策略 , 也有 AI 搜索 , 在這之后 , 生成的方法會被組合成為一個復雜的 Prompt 交給大模型 , 形成一個新算法 。 新的算法會交給到人類寫好的評估器上判斷質量 , 打分會作為依據交給下一輪的再采樣生成 。
在技術方面 , 伐謀具有四大核心技術特點:
首先是冷啟動初始化 , 伐謀使用多個生成智能體并行構建高質量、多樣化的初始解集 , 可以利用「專家引導」模式加速收斂 。 其次是自適應多樣性采樣 , 伐謀的 Agent 會使用多島嶼并行的方式進化模型 , 每個島嶼獨立演化 , 通過動態調整探索與利用的平衡 , 避免早熟收斂 。 這是關鍵的一步 , 可以快速生成多樣性的方法 。 在生成解法后 , 領域專用評估器會對生成功能的正確性、運行效率、LLM 質量進行判斷 , 支持多維度的反饋 。 最后 , 伐謀依托的分布式異步基礎設施基于 Ray 框架 , 支持大規模的并行演化 。使用昆侖芯一體機進行運算 , 難度較大的任務可能需要數十小時、幾天的求解時間 , 簡單的任務可能只需要幾小時 。
報告顯示 , 伐謀在多個領域都有出色的表現 , 在多個權威基準測試中都取得了領先的性能 。 在 MLE-Bench 上達到了 43.56% 的獎牌率 , 比人類中位數高出 51.56%;在 ALE-Bench 上得分為 1976.3 , 比專門設計的 ALE-Agent 高出 5.2%;在 KernelBench 上則實現了 2.08 到 20.77 倍的加速比 。

需要注意的是 , 所有實驗均是全自動運行的 , 沒有人類干預 。 伐謀在打榜時也沒有針對 Benchmark 進行針對性的優化 。
目前能看到一些學術上的同類工作 , 大多集中于單點問題上 , 而如何在實際場景中解決問題、提升效率 , 才是伐謀關注的重點 。 伐謀的產品負責人表示 , 伐謀在很多一個月才能解決的復雜問題上優勢更大 。
如果做一個比喻的話 , 在各行各業的專家團隊中 , 應用 AI 以前需要專家團隊自己來寫算法 , 應用伐謀之后 , 相當于有了數倍的算法工程師一起來寫算法 , 他們能夠生成的算法水平更好 。
另外 , 隨著業務的落地 , AI 生成的方法可以持續進行動態調整 , 打磨出更好的效果 。 可以說 , 伐謀不僅推動了智能體的技術發展 , 也為企業 AI 技術落地提供了可行的工程范本 。
面向產業級應用
AI 自主優化引擎 , 已在大規模落地
作為面向實際的 AI 優化引擎 , 伐謀在很多行業生產、研發場景中的重要環節上都能展現能力 , 它能夠自動將實際問題抽象成數學算法問題進行解決 。
在這個過程中 , AI 提出的評估指標明確 , 產生的解決方案價值很高 , 而且可以持續迭代優化 。 伐謀能夠搞定的領域包括但不限于:路徑規劃、過程控制、排產調度、資源優化、機器學習和性能優化 。

輸入必要的數據并使用自然語言給出指令 , 伐謀就可以對問題進行準確的理解 , 自行提出思路進行解決和優化 。 伐謀利用大語言模型作為核心 , 并支持代碼生成 , 可以修改代碼文件 。 在生成解決路徑的過程中 , 伐謀擅長于平衡對新算法的探索 , 在生成解法的過程中鼓勵多樣性 。
它會使用自動化評估機制對生成的程序進行評分 , 這些評估結果也會被用于指導后續的代碼生成 。 這樣 , 就形成了一個「抽象 - 建模 - 演化」的智能閉環 。
百度的工程師表示 , 伐謀旨在解決那些難度極大、人類解決得不太好的問題 。 基于人類專家們的知識 , 伐謀的自動輸出就像是給人類智慧進行了 Scaling Up 。
目前 , 伐謀已經在很多場景中展示了能力:
在金融領域 , 伐謀在中信百信銀行的風控特征挖掘與建設的過程中獲得了驗證 , 其提出的方法將風險區分度提升了 2.41% , 處理速度還比常規方法更快 , 特征挖掘效率提升了 100% 。 在城市交通領域 , 伐謀通過對于上千紅綠燈的大規模優化求解 , 能夠精準找到紅綠燈配時的「全局最優解」 , 提升了整體交通效率 。 在超級工程領域 , 面對海上風電「三維迷宮」般的電纜布置難題 , 伐謀產出高質量的優化方案 , 找到了比人工設計更短的電纜路徑 , 項目交付節省數倍時間 。 伐謀還正在水務、物流、能源等領域中進行測試 , 預期可以在很多環節中實現優化 , 進而降低能耗 , 提升工作效率 。此外在 AI 的性能優化上 , 百度正在利用伐謀優化 LayerNorm、FlashAttention 等 CUDA 算法 , 據說比 PyTorch 官方實現的速度還要更快 。
隨著大模型分析、推理能力提升 , 我們可以逐漸地把評估 , Coding 等任務交給 AI 。 解決復雜問題的多個步驟 , 現在可以被智能體加外部環境構成的系統進行接管 。
一個新的范式正在逐漸形成 —— 由人類來定義問題 , 發現和抽象需求 , AI 來負責進行實踐 。
進化式智能體
AI 發展新趨勢
在 AI 前沿領域 , 能夠進化式編程的智能體已經成為新的發展方向 。 利用 AI 大模型的能力 , 多智能體系統能夠自主生成、測試并迭代優化算法 , 甚至發現全新的算法 , 這標志著 AI 在算法優化和編程領域邁出了突破性的一步 。
相比于基于數學、運籌學的求解器與單一大模型系統 , 自主優化的智能體可以解決更多、更復雜的問題 , 提出創新形式的解法 , 同時還降低了對于使用者專業知識的門檻 。
其中的典型就是今年 5 月谷歌 DeepMind 發布的 AlphaEvolve , 這是一款用于發現和優化通用算法的平臺 , 基于 Gemini 大語言模型與進化算法策略開發 , 具備自主生成和優化通用算法的能力 。 AlphaEvolve 正式發布之前 , 谷歌已經在內部進行了落地 , 它能把大模型加速注意力算法 FlashAttention 的核心效率提升 32.5% , 還優化了 50 年沒有改進的矩陣最佳算法 。

AlphaEvolve 幫助谷歌構建了更高效的數字生態系統 , 從數據中心調度、硬件設計到 AI 模型訓練都有涉足 。
上周 , 著名數學家陶哲軒在其新研究中展示了 AlphaEvolve 自主發現數學構造的能力 , AI 方法推動了人們對長期未解數學難題的理解 。
可見 , 在一些真實世界的復雜任務上 , 智能體已經可以幫助人們高效率地解決問題了 。 如果這種技術大規模應用 , 可以在很多領域上為人們帶來生產力的提升 。
不過 , 此前我們看到 AI 解決復雜問題的能力 , 主要面向的是科學研究領域 , 而百度新發布的伐謀作為全球首個同類商業化產品 , 更加面向行業 , 還做到了更全面、更加自動化 。
AI 革新生產力
布局才剛剛展開
李彥宏表示:「當 AI 能力被內化 , 成為一種原生的能力 , 智能就不再是成本 , 而是生產力 。 AI 能夠提升決策質量、發現新增長點 , 讓成本更低、利潤率更高、創新周期更短 。 」
不論是從技術角度 , 還是從實用的角度看 , 伐謀都是一款通用、強大且可擴展的智能體框架 , 引領了目前 AI 大規模技術落地的前沿方向 。
如今 , 智能體正在從與我們「對話」走向幫我們「決策」 。 從已經出現的落地案例來看 , 還有很多各行各業的關鍵生產環節有能被 AI 優化的潛力 。
在百度看來 , 目前基于 AI 的自主優化引擎僅僅處于落地的初期 。 隨著標桿客戶的驗證 , AI 的優化能力會在業務鏈條上的每個環節上逐漸顯現 。
伐謀的能力 , 將會服務于千行百業 。
據百度介紹 , 百度伐謀發布首日已經吸引了超 1000 家企業申請接入測試 , 覆蓋交通、能源、金融、物流等行業 。 目前百度伐謀測試名額持續開放中 , 首批將通過邀請碼形式優先向具有高復雜決策需求的企業開放 。
申請測試:
https://cloud.baidu.com/product/famou.html

    推薦閱讀