唯快不破,Anthropic幾天搞定智能體生產

唯快不破,Anthropic幾天搞定智能體生產

文章圖片

唯快不破,Anthropic幾天搞定智能體生產

文章圖片

唯快不破,Anthropic幾天搞定智能體生產

文章圖片

唯快不破,Anthropic幾天搞定智能體生產

文章圖片



凌晨 , Anthropic 發布了Claude Managed Agents , 一套用于構建和部署云端智能體的托管工具 。

用最簡單的話來介紹 , 開發者不需要再處理安全、狀態管理和權限等基礎設施 , 能直接讓Agent運行在生產環境 。

官方稱 , 一個原本需要數月才能上線的Agent , 現在可以在幾天內投入生產 。
01
以10倍速度進入生產
在此之前 , Agent開發真正的難點從來不在模型本身 , 而在工程 。
我們可以很快用Claude或其他大模型做出一個看起來不錯的demo:能寫代碼、能分析文檔、甚至能自動調用工具 。 但一旦想把它變成一個能穩定運行的產品 , 問題就出現了 。
明明它看起來什么都能做 , 可就是很難真正用在生產環境里 。
demo做出來以后 , 開發者還需要自己搭一整套基礎設施:安全的代碼執行環境、長時間運行的狀態管理、不同工具之間的權限控制 , 以及在出錯時能夠恢復的機制 。 這些能力每一個都不算復雜 , 但組合在一起 , 就是一件非常耗時的大工程了 。
更麻煩的是 , 這些工作幾乎無法復用 。
模型一旦升級 , harness里原本寫死的那些假設往往不再那么適配 , 不同Agent之間也很難共享一套穩定的運行框架 。
Agent開發翻來覆去:每個團隊都在解決同一類問題 , 但很少有人真正把它做到穩定 。
因此我們經??吹?, Agent可以輕松做出demo , 卻遲遲才能上線 。
Claude Managed Agents試圖解決的正是這一問題:安全執行、狀態管理、權限控制、錯誤恢復……它把這些原本要自己搭的一整套東西全部打包 , 統一由Anthropic提供 。
開發者不需要再關心Agent是怎么跑起來的 , 只要告訴它做什么、能用什么工具、有哪些限制 , 剩下的執行過程都由系統自動完成 。
帶來的變化也很直接:原本要花幾個月搭出來的一整套系統 , 現在變成了一個可以快速嘗試、反復調用的接口 。
它沒有讓Agent變得更聰明 , 但它狠狠縮短了demo和生產之間的距離 。
除了加速上線的“工具包” , 它還做了以下幾件事:
首先是對長時間運行任務的支持 。 Agent可以在后臺自主運行數小時 , 進度和輸出會被持續保存 , 即使發生中斷也不會丟失 。
其次是多Agent之間的協作能力 。 Agent可以創建并調度其他Agent , 以并行方式處理復雜工作 。 該能力目前以research preview形式提供 , 需要單獨申請訪問 。
然后是對真實系統的訪問與治理機制 。 AgentAgent能夠訪問帶有范圍權限、身份管理和執行追蹤的真實系統 , 但能調用哪些工具、拿到哪些權限、使用哪些憑證 , 模型自己說了不算 。
除此之外 , 系統還內置了一個用于任務執行的編排機制(a built-in orchestration harness) , 用于決定何時調用工具、如何管理上下文以及在出現錯誤時如何恢復 。 這意味著開發者無需手動編排Agent的執行流程 , 系統會在運行過程中自動進行調度 。

這些能力本身并不新 , 但被放進同一個系統里之后 , 就省下了很多事情 。
02
不只是能用 , 而是已經在用
在發布中 , Anthropic 也給出了一批已經落地的案例 , 基本覆蓋了協作工具、企業系統和開發工具這幾個典型場景 。
例如Notion(一款將文檔、知識庫和項目管理整合在一起的協作工具)直接把Claude塞進了工作區里:工程師讓它寫代碼 , 內容團隊讓它做網站、做PPT , 多個任務還能并行 。
在企業側 , Rakuten(日本大型互聯網與電商集團 , 業務涵蓋電商、金融和通信)已經在多個部門部署Agent , 包括產品、銷售、市場、財務和人力資源 。 他們的做法很直接:把Agent接進Slack和Teams , 讓員工像派活一樣分配任務 , 然后拿回表格、幻燈片甚至應用 。 官方說 , 一個Agent一周就能部署完成 。
Asana(一家提供團隊任務管理和項目協作工具的軟件公司)的思路更激進一點 。 這家公司本來就是做項目管理的 , 現在干脆把Agent變成項目成員 , 直接參與任務推進和內容產出 , 起的名字也很直白:AI Teammates 。
開發者這邊的代表是Sentry(提供錯誤監控和性能分析的開發者工具) , 它原本就是用來監控bug的 , 現在Agent可以自動生成修復代碼并創建Pull Request , 把發現問題到提交修復的流程串起來 。
還有Vibecode(一個通過自然語言生成并部署應用的AI開發工具平臺) , 這類AI原生工具走得更遠一點:用戶只需要寫一句需求 , 就可以從提示直接生成并部署一個應用 , 而Managed Agents成了它背后的默認基礎設施 。
如此種種可以看出 , 不管是寫代碼、做內容還是處理企業流程 , Agent已經開始直接接手任務了
某種意義上 , 當安全、狀態、權限和調度都變成默認能力之后 , Agent不再需要被“包裝”成系統 , 它本身就可以作為系統運行 。
Agent缺的從來不是能力 , 只是難以落地而已 。
過去開發者需要先搭好一整套框架 , 才能讓Agent開始落地干活;現在這套框架已經提前存在 , Agent可以直接被部署進去 。
這就是Claude Managed Agents的意義所在 。
03
工具很好 , 但問題才剛開始
Claude Managed Agents一推出就引發了大量討論 。
很多人對Anthropic的推進速度感到驚訝 , 心情就如同下面的meme:每天一起床就又看到一個Claude更新 。

這不 , 泄露事件之后立馬更新了Claude Code 2.1.90 , Claude Mythos Preview的熱度還沒過 , Claude Managed Agents又馬上出來了 。
Anthropic你盡管推出 , 我們一點也不苦一點也不累 。

開個玩笑 。 在感嘆發布速度的同時 , 對新工具的質疑也幾乎同時出現 。
最直接的問題 , 是它到底能不能真正跑好“長期任務” 。
有開發者指出 , Agent最大的挑戰從來不在短任務 , 而是那些需要持續運行、反復決策的場景 。 一旦時間拉長 , 錯誤會不斷累積 , 系統穩定性也會迅速下降 。
能跑起來 , 不等于能跑得久 。
更進一步 , 是“可靠性”的問題 。
在小規模測試中 , Agent往往表現不錯 , 但一旦進入真實生產環境 , 任務復雜度上升、調用鏈變長 , 各種邊界情況就會不斷出現 。
這恰恰是大多數Agent平臺最容易失效的地方 。

還有人把問題問得更實際一些:既然現在已經有多Agent能力 , 那它到底能不能直接替代現有的工作流工具?
還是說 , 像n8n這樣的系統 , 依然是必需的?

本質上關心的還是同一件事:n8n就是為了保證流程穩定、可控、可復現 , 要想替代它 , 這套多Agent協調的系統必須足夠穩定 , 足夠“可靠” 。
值得注意的是 , Anthropic在工程設計上也在嘗試解決這個問題 。
在最新的技術文章中 , 他們將Agent系統拆成三個獨立的部分:模型與調度邏輯(“大腦”)、執行環境與工具(“手”) , 以及記錄全部過程的會話日志(session) 。
三者通過接口連接 , 任何一層失敗都可以單獨恢復 , 而不會影響整體運行 。
這套設計 , 把Agent從一次性執行的流程 , 變成了一個可以中斷、恢復甚至重啟的系統 。

另外 , 對于那些需要長時間運行的任務 , Anthropic沒有把所有信息都塞進模型的上下文里 , 而是記錄在外部日志中 , 需要時再取回來用 , 這樣就不會占滿上下文窗口 。
同樣地 , 權限也不再交給模型保管 , 而是單獨隔離出去 , 這樣即使出錯 , 也不會直接暴露敏感信息 。
不過工程設計只能解決結構問題 , 沒辦法保證結果 。
可以說 , 大家并不懷疑Claude Managed Agents能做什么 , 懷疑的是它能不能穩定、可控地一直做下去 。
這一點 , 就需要時間來驗證了 。
Claude Managed Agents介紹:
https://claude.com/blog/claude-managed-agents
【唯快不破,Anthropic幾天搞定智能體生產】工程博客:
https://www.anthropic.com/engineering/managed-agents

    推薦閱讀