
文章圖片

機器之心報道
編輯:Panda
當前 , AI 領域最火熱的浪潮無疑是 AI Agent(智能體) 。 從科技巨頭到創業公司 , 無數開發者正投身于構建能夠自主理解、規劃和執行復雜任務的智能系統 。
然而 , 在這股「淘金熱」的背后 , 開發者們也面臨著巨大的挑戰:如何系統性地設計智能體的行為?如何確保系統的穩定性和可靠性?如何避免一次又一次地「重造輪子」?整個領域迫切需要一套經過實踐檢驗的「建筑圖紙」和方法論 。
學習 , 如有一本好書 , 往往事半功倍 。
近日 , 谷歌資深工程主管、杰出工程師 Antonio Gulli 在網上公開發布了自己的新書《Agentic Design Patterns(智能體設計模式)》 。
對許多開發者來說 , 「設計模式(Design Pattern)」這個詞并不陌生 。 它曾在軟件工程領域扮演了「圣經」般的角色 , 將無數前輩的最佳實踐固化為可復用的解決方案 。 而 Antonio Gulli 此舉的意義 , 正是在于為方興未艾的智能體開發領域 , 提供了首批系統性的「設計模式」 , 幫助開發者讓打造強大、可靠的智能體變得有章可循 。
現在 , 雖然該書已經在亞馬遜開啟預售(作者表示全部版稅將捐贈給拯救兒童組織) , 但感興趣的讀者也可以在谷歌文檔上免費查看全書 。
地址:https://docs.google.com/document/d/1rsaK53T3Lg5KoGwvf8ukOUvbELRtH-V0LnOIFDxBryE/preview?tab=t.0#
光看其目錄 , 就能感覺到 , 讀完這本書 , 你就能非常全面地理解智能體 + 代碼:
從目錄的編排上 , 我們也能看出作者的深思熟慮 。 這本 400 多頁的著作的結構堪稱一份精心設計的學習路線圖 。
第一部分從提示鏈、路由和工具使用等最核心的單元操作入手 , 如同教授智能體的基本語法 。 隨后 , 內容逐步深入到記憶、學習、多智能體協作等高級主題 , 最終在第四部分落腳于安全護欄、評估監」和資源優化等至關重要的生產實踐環節 。
這條路徑清晰地將讀者從構建一個簡單的原型 , 一路引導至打造一個真正能在現實世界中穩健運行的復雜智能系統 。 因此 , 這本指南不僅是技術的集合 , 更是一次寶貴的機會 , 讓我們得以一窺頂級科技公司內部解決復雜 AI 工程問題的思維框架和實戰智慧 。
這是我們整理的目錄中文版:
引言
是什么讓 AI 系統成為「智能體」?
第一部分
第一章:提示鏈
第二章:路由
第三章:并行化
第四章:反思
第五章:工具使用
第六章:規劃
第七章:多智能體
第二部分
第八章:記憶管理
第九章:學習與適應
第十章:模型上下文協議 (MCP)
第十一章:目標設定與監控
第三部分
第十二章:異常處理與恢復
第十三章:人機協作(Human-in-the-Loop)
第十四章:知識檢索 (RAG)
第四部分
第十五章:智能體間通信 (A2A)
第十六章:資源感知型優化
第十七章:推理技術
第十八章:護欄 / 安全模式
第十九章:評估與監控
第二十章:優先級排序
第二十一章:探索與發現
附錄
附錄 A:高級提示技術
附錄 B:AI 智能體…… 從 GUI 到現實世界環境
附錄 C:智能體框架速覽
附錄 D:使用 AgentSpace 構建智能體(僅在線)
附錄 E:命令行中的 AI 智能體
附錄 F:深入底層:探秘智能體推理引擎
附錄 G:編碼智能體
下面 , 我們就來看看這本書的引言部分 , 以便對該書有一個大致的了解:
歡迎閱讀《智能體設計模式:構建智能系統的實踐指南》 。 縱觀現代 AI 的發展 , 我們能清晰地看到一條演進路徑:從簡單的反應式程序 , 到能夠理解上下文、做出決策并與環境及其他系統動態交互的復雜自主實體 。 這些實體 , 就是我們所說的智能體 , 以及由它們構成的智能體系統 。
強大的大型語言模型(LLMs)的出現 , 為理解和生成類人文本與媒體內容提供了前所未有的能力 , 并擔當了許多智能體的「認知引擎」 。 然而 , 要將這些能力整合進一個能夠可靠達成復雜目標的系統 , 僅僅擁有一個強大的模型是遠遠不夠的 。 這還需要精心的結構、巧妙的設計 , 以及對智能體如何感知、規劃、行動和交互的深思熟慮 。
你可以將構建智能系統想象成在一塊「畫布」上進行復雜的藝術創作或工程建設 。 這塊畫布并非空白的視覺空間 , 而是指底層的技術設施與框架 , 它們為智能體的存在和運作提供了環境與工具 。 它是你構建智能應用的基礎 , 負責管理狀態、通信、工具調用以及邏輯流 。
在這塊智能體的畫布上高效地進行構建 , 絕非簡單地堆砌組件 。 你需要理解那些經過驗證的技術 —— 即「模式」—— 它們專為應對設計和實現智能體行為時的常見挑戰而生 。 正如架構模式指導建筑物的建造 , 或設計模式構建軟件的結構一樣 , 智能體設計模式為你提供了一套可復用的解決方案 , 用以處理在畫布上賦予智能體生命時會反復遇到的問題 。
什么是智能體系統?
從核心上講 , 智能體系統是一種計算實體 。 它被設計用來感知其環境(數字環境 , 甚至可能包括物理環境) , 基于這些感知和一系列預設或習得的目標來做出明智決策 , 并自主執行動作以達成這些目標 。 與遵循刻板、逐步指令的傳統軟件不同 , 智能體展現出了一定程度的靈活性和主動性 。
想象一下 , 你需要一個系統來處理客戶咨詢 。 傳統系統可能會遵循固定的腳本 。 而一個智能體系統則能夠洞察客戶詢問的細微差別 , 訪問知識庫 , 與訂單管理等其他內部系統交互 , 甚至可能會提出澄清性問題 , 并主動解決問題 , 有時還能預見客戶未來的需求 。 這些智能體就在你應用程序基礎設施這塊「畫布」上運行 , 利用其上可用的服務和數據 。
智能體系統通常具備以下特征:自主性(無需持續的人工監督即可行動)、主動性(為達成目標而主動發起行動)和反應性(能有效應對環境變化) 。 它們從根本上是目標導向的 , 始終為實現目標而努力 。 一項關鍵能力是工具使用 , 這使其能與外部 API、數據庫或服務交互 —— 相當于有效地將其能力延伸到了自身畫布之外 。 它們擁有記憶 , 能在多次交互中保留信息 , 并能與用戶、其他系統 , 甚至是在相同或互聯畫布上運行的其他智能體進行通信 。
要有效地實現這些特性 , 會引入相當大的復雜性 。 例如 , 智能體如何在畫布上的多個步驟之間維持狀態?它如何決定何時以及如何使用工具?不同智能體之間的通信如何管理?你又該如何構建系統的彈性 , 以應對意外結果或錯誤?
為何模式在智能體開發中至關重要
正因存在這些復雜性 , 智能體設計模式才變得不可或缺 。 它們并非僵化的規則 , 而是久經考驗的模板或藍圖 , 為智能體領域的標準設計與實現挑戰提供了行之有效的方案 。 通過識別和應用這些設計模式 , 你將獲得能增強智能體結構、可維護性、可靠性和效率的解決方案 , 從而更好地在你的畫布上進行構建 。
使用設計模式可以幫助你避免為管理對話流、集成外部能力或協調多智能體行動等任務「重造輪子」 。 它們提供了一種通用語言和結構 , 使你的智能體邏輯更清晰 , 也更容易被他人(以及未來的你)理解和維護 。 應用專為錯誤處理或狀態管理設計的模式 , 可以直接構建出更健壯、更可靠的系統 。 借助這些成熟的方法 , 你能加快開發進程 , 從而專注于應用的獨有之處 , 而非智能體行為的基礎機制 。
本書提煉了 21 個關鍵的設計模式 , 它們是在各種技術畫布上構建復雜智能體的基礎模塊和核心技術 。 理解并應用這些模式 , 將極大地提升你有效設計和實現智能系統的能力 。
本書概覽及使用方法
《智能體設計模式:構建智能系統的實踐指南》旨在成為一份實用且易于上手的資源 。 本書的核心重點是清晰地解釋每一種智能體模式 , 并提供具體、可運行的代碼示例來展示其實現 。 在 21 個專門的章節中 , 我們將探索從構建序列化操作(提示鏈)和外部交互(工具使用)等基礎概念 , 到多智能體協作和自我修正等高級主題的各種設計模式 。
本書按章節組織 , 每一章深入探討一個智能體模式 。 在每個章節中 , 你都會看到:
模式概覽:清晰解釋該模式及其在智能體設計中的作用 。 實際應用與用例:通過真實場景說明該模式的寶貴價值及其帶來的好處 。 動手代碼示例:提供實用、可運行的代碼 , 演示如何使用主流智能體開發框架實現該模式 。 在這里 , 你將看到如何在技術畫布的上下文中應用模式 。 關鍵要點:總結最核心的內容 , 便于快速回顧 。 參考文獻:提供用于進一步探索的資源 , 幫助你更深入地學習該模式及相關概念 。雖然各章節按循序漸進的方式編排 , 但你完全可以將本書作為參考手冊 , 直接翻到能解決你項目中特定挑戰的章節 。 附錄部分全面介紹了高級提示技巧、在真實環境中應用 AI 智能體的原則 , 以及主流智能體框架的概覽 。 作為補充 , 我們還提供了僅在線發布的實踐教程 , 為你提供使用 AgentSpace 等特定平臺以及命令行界面構建智能體的分步指導 。 全書始終強調實際應用 , 我們強烈建議你運行代碼示例 , 親手實驗 , 并將其改造 , 用以在你的畫布上構建屬于你自己的智能系統 。
我常聽到的一個好問題是:「AI 發展如此之快 , 為何要寫一本可能很快就過時的書?」我的初衷恰恰相反 。 正是因為技術日新月異 , 我們才更需要退后一步 , 去識別那些正在穩定下來的底層原則 。 我所討論的 RAG、反思、路由、記憶等模式 , 正在成為基礎的構建模塊 。 本書旨在邀請讀者一同反思這些核心思想 , 它們為我們未來的構建工作奠定了基石 。 人類需要這樣沉淀基礎模式的時刻 。
所用框架簡介
為了給代碼示例提供一個可觸摸的「畫布」(亦可參見附錄) , 我們將主要使用三個主流的智能體開發框架 。 LangChain 及其狀態化擴展 LangGraph , 提供了一種靈活的方式來鏈接語言模型和其他組件 , 為構建復雜的操作序列和圖譜提供了一塊堅實的畫布 。 Crew AI 提供了一個結構化的框架 , 專門用于編排多個 AI 智能體的角色和任務 , 使其成為一塊特別適合協作型智能體系統的畫布 。 谷歌智能體開發工具包 (Google ADK) 則提供了一系列用于構建、評估和部署智能體的工具與組件 , 構成了另一塊有價值的畫布 , 且通常與谷歌的 AI 基礎設施集成 。
這些框架代表了智能體開發畫布的不同側面 , 各有千秋 。 通過展示跨越這些工具的示例 , 你將更廣泛地理解 , 無論你為自己的智能體系統選擇何種特定技術環境 , 這些模式都可以應用 。 所有示例都旨在清晰地闡明模式的核心邏輯及其在相應框架畫布上的實現 , 并以清晰易懂和實用為重 。
【谷歌大神出手,免費發布《智能體設計模式》,AI Agent開發終極秘籍】讀完本書 , 你不僅將理解 21 個核心智能體模式背后的基本概念 , 還將掌握有效應用它們的實踐知識和代碼示例 , 從而能夠在自己選定的開發畫布上 , 構建出更加智能、更能干、更自主的系統 。 現在 , 就讓我們開啟這段實踐之旅吧!
推薦閱讀
- 1億簽約金搶AI大神?谷歌AI元老勸退全網:別再讀博了
- 谷歌Pixel 11或搭載聯發科M90基帶,帶來通信提升
- OpenAI推出智能購物系統挑戰谷歌亞馬遜
- 谷歌智能家居新品發布,Gemini AI再升級
- CUDA內核之神、全球最強GPU程序員?OpenAI的這位幕后大神是誰
- 韓國如何用本土AI技術挑戰OpenAI和谷歌
- 微軟出手“立規矩”,AI公司不能白拿數據
- 谷歌Veo 3論文竟無一作者來自美國!揭秘零樣本「看懂」世界
- 向華為鴻蒙學習,谷歌變聰明了,要推出安卓PC版操作系統
- 首款推理具身模型,谷歌DeepMind造!自主理解/規劃/執行復雜任務
