揭秘Agent落地困局!93%企業項目卡在POC到生產最后一公里

揭秘Agent落地困局!93%企業項目卡在POC到生產最后一公里

編輯部 整理自 凹非寺量子位 | 公眾號 QbitAI
Agent的真正價值不在于演示效果多驚艷 , 而在于能否真正跑在生產環境里 。數據顯示 , 超過93%的企業Agent項目卡在了從POC(概念驗證)到生產的最后一公里 。
在量子位MEET2026智能未來大會上 , 亞馬遜云科技大中華區產品部總經理陳曉建系統闡述了企業級Agent從開發到生產的完整路徑 。
這個數字背后 , 是無數企業在Agent落地過程中踩過的坑:開發門檻高、工程化能力缺失、模型定制困難、安全邊界模糊 。

在剛剛結束的AWS re:Invent 2025大會上 , 亞馬遜云科技將聚光燈對準了Agent 。 不是因為其他技術不重要 , 而是整個行業都意識到:Agent正在成為AI生產力釋放的關鍵樞紐 。
陳曉建的分享 , 正是圍繞“如何讓Agent真正跑起來”這一核心命題展開 。
MEET2026智能未來大會是由量子位主辦的行業峰會 , 近30位產業代表與會討論 。 線下參會觀眾近1500人 , 線上直播觀眾350萬+ , 獲得了主流媒體的廣泛關注與報道 。
核心觀點梳理 一個成功的Agent需要三個模塊:模型(大腦)、代碼(邏輯)、工具(連接物理世界的手腳) 。 三者的有效連接是最大的工程挑戰 。 十幾行代碼實現過去數千行才能完成的功能 , 這就是模型驅動開發帶來的效率躍遷 。 93%的Agent項目卡在POC到生產的跨越上 , 核心原因是數據質量落差和工程化能力缺失 。 模型定制的最佳時機是在基礎模型訓練階段 , 就像人類學習語言 , 年幼時效果遠好于成年后 。 對Agent既不能嚴防死守 , 也不能過度放任 , 正確做法是通過策略框架劃定行為邊界 。 ……以下為陳曉建演講全文:
Agent成功的三要素:模型、代碼與工具Agent正在從各個維度釋放AI的生產力潛能 , 它可以替代許多人類以往的工作 , 甚至能夠完成人類此前無法企及的任務 。 然而從創意到落地 , 中間需要跨越的鴻溝遠比想象中更寬 。
我們認為 , 一個成功的Agent需要三個至關重要的模塊 。
第一是底層模型 。
模型是Agent的大腦 , 負責產生智慧、提供決策 , 承擔推理、規劃與執行的核心職能 。
第二是代碼 。
任何Agent都需要服務于特定場景 , 提供該場景所需的功能邏輯 。 這些邏輯需要像構建傳統軟件一樣 , 通過代碼來實現 。 這一點與大多數已有軟件并無本質區別 。
第三是工具 。
如果把模型比作大腦 , 那么工具就是連接大腦與物理世界的手和腳 。 在整個架構中 , 工具層包括連接不同信息源的各類協議 , 以及執行各種行為的代碼——比如知識庫、數據庫、代碼庫 , 或者瀏覽器等外部能力 。
當然 , 我們看到很多客戶在嘗試用自己的方式構建Agent 。 但如何有效連接這三個模塊 , 帶來了巨大的復雜性與挑戰 。 如何高效調用模型能力?如何組織代碼邏輯?如何打通與物理世界的連接?不同工具之間的編排 , 更是給開發者帶來了前所未有的新課題 。
十幾行代碼完成過去數千行的工作基于這些挑戰 , 我們從2024年開始規劃:如何構建一套工具 , 降低開發者構建Agent的門檻?如何讓工具編排更加自動化?如何讓大模型調用更加便捷?
今年 , 我們正式推出了Strands Agents 。
Strands Agents采用模型驅動的方法論 , 讓大語言模型能夠自主處理各種場景 , 從而大幅簡化開發Agent所需的代碼量 。 我們經常收到客戶反?。 汗バ枰寫氬拍蕓⒌某【?, 現在只需要短短十幾行就能實現 。
在推出Strands Agents時 , 我們就將其定位為一個開源項目 。 用戶不僅可以直接使用 , 還可以獲取完整源碼 。 更重要的是 , Strands Agents采用開放架構 , 不僅適配亞馬遜云科技自身的產品 , 也兼容業界各種流行的開源或商用框架 。
在上周的re:Invent大會上 , 我們同步發布了兩項重要更新 。
一是支持TypeScript語言 。 TypeScript是業界廣泛使用的編程語言 , 通過支持這一語言 , 可以幫助更多開發者構建更適用的Agent方案 。
二是支持邊緣設備部署 。 邊緣設備正日益成為人類生活與工作不可分割的一部分 , Strands Agents可以為汽車、游戲、機器人等各類終端提供Agent能力 , 讓Agent不僅能在云端運行 , 也能在前端智能設備上運行 。
93%的項目卡在POC到生產的跨越上除了開發工具 , 我們還看到大量客戶在Agent的部署與上線階段遭遇困難 。
有一組來自第三方調研的數據值得關注:93%的客戶在從POC階段邁向生產階段時遇到了重大障礙 。 換言之 , 可能只有不到10%的客戶能夠真正將Agent從POC推進到最終生產環境 。
原因是什么?
POC與生產環境之間存在本質差異 。 在POC階段 , 我們可能只需要關注代碼效果如何 。 但到了生產階段 , 很多客戶發現 , 原先在POC階段表現優異的效果突然變得不盡如人意 。
一個重要原因是數據 。在POC階段 , 數據可以經過精心挑選 , 保證高質量 。 但在真實生產環境中 , 數據是無法被人為篩選和優化的 。 數據質量的落差 , 往往是POC與生產效果差異的核心原因 。
另一個主要原因是工程化挑戰 。一旦業務從POC走向生產 , 就必須直面一系列生產環境特有的問題:安全、擴容、成本、高可用……這些問題在POC階段完全不需要考慮 , 但上了生產就必須正視 。
正是基于這些考量 , 我們意識到:不僅要提供降低編程門檻的開發工具 , 還需要提供工程化能力 , 幫助客戶跨越從POC到生產的鴻溝 。
這就是我們在2025年7月推出Amazon Bedrock AgentCore的原因 。
AgentCore是一個完整的工具箱 , 提供多種能力幫助客戶實現底層基礎架構的編排 。 當您的Agent部署上云時 , 無需關心底層的計算資源、網絡資源、安全配置、可觀測性如何實現——AgentCore會幫您完成這些底層資源的動態管理 。 這將極大地幫助客戶解決從POC到生產過程中遇到的工程化難題 。
模型定制:在“年幼時”學習效果最好當Agent進入生產環境后 , 還會面臨一系列效率問題:延遲、可擴展性、敏捷性……這些都是實際生產中必須關注的特性 。 如果延遲從幾百毫秒飆升到秒級以上 , 用戶體驗會受到極大影響;如果可擴展性不足 , 業務高峰期同樣會出現瓶頸 。
這里要談談模型定制的挑戰 。
在很多場景下 , 通用大模型在標準場合表現出色 , 但在特定垂直場景中可能無法滿足需求 。 因此 , 許多客戶嘗試基于自有數據對開源模型進行定制 。 但模型定制本身也面臨諸多挑戰——需要專業技能 , 需要高質量數據 , 才能獲得理想效果 。
在這方面 , 我們的Amazon SageMaker AI產品提供了豐富的模型定制支持 。 在本次re:Invent大會上 , 我們發布了四種不同的模型定制能力 , 包括強化微調、模型定制化訓練、無檢查點訓練 , 以及Amazon Nova Forge 。
這里特別想介紹Nova Forge 。 Nova Forge允許用戶在基礎模型訓練階段就注入自己的數據 。
打個比方:一個人學習語言 , 什么時候效果最好?在年幼時期 , 大腦還在發育階段 , 學習能力最強 , 幾乎不知不覺就能掌握一門語言 。 但如果到了大學階段再去學一門新語言 , 可能需要付出極大努力 , 效果卻不如幼年時期 。
大語言模型的定制邏輯與此類似 。 如果能在模型開發階段就進行定制 , 效果遠優于模型完成后再做調整 。
劃定邊界:讓Agent既自主又可控當我們把Agent交付給用戶使用時 , 如果缺乏適當的約束 , 可能會產生意想不到的后果 。 這是我們必須規避的風險 。
目前業界常見兩種極端做法:一種是對Agent嚴防死守 , 另一種是過度依賴人工干預 。 顯然 , 這兩種方式都不是理想選擇 。
針對這一問題 , 我們在本次re:Invent大會上為AgentCore發布了一項新特性——Policy(策略) 。
通過Policy , 可以為Agent定義一個行為框架 。 在這個框架內 , Agent可以自主完成任務;但Policy能夠明確界定Agent不可逾越的邊界 。 比如 , 合規性限制、安全紅線等都可以通過Policy來配置 。 我們已經有客戶在實際使用這一工具 , 通過Policy實現安全可靠的Agent運行 。
再談談自動化 。
過去 , 人類實現工作流自動化主要依賴RPA(機器人流程自動化 , Robotic Process Automation)技術 。 但大模型的出現帶來了新的可能性:大模型能夠處理更復雜、更靈活的任務 , 但如何讓它與現有工作流深度結合?
為此 , 我們開發了Amazon Nova Act 。
Nova Act深度集成了大模型能力與AgentCore的工程化能力 , 打造了全新的工作流自動化方案 。 與傳統RPA工具不同 , Nova Act因為融合了大模型的智能 , 整體成功率可以達到80%以上 。 通過Nova Act , 大模型可以直接與執行器、瀏覽器進行交互 , 實現端到端的工作流自動化 。
最后介紹兩個案例 。
Blue Origin(藍色起源) 是美國一家商業航天公司 , 專注于火箭與太空探索 。 他們已經通過Bedrock和Strands Agents等服務構建了超過2700個內部Agent , 實現了75%的交付效率提升 , 設計質量相比原始方案提高了40% 。
Sony(索尼) 是全球領先的電子與娛樂公司 。 Sony通過構建Agent能力打造了內部的“Data Ocean”數據平臺 。 他們基于Bedrock構建企業級大模型 , 每天服務超過57000名內部用戶 , 處理多達15萬次推理請求 。 同時 , Sony還使用微調能力對Amazon Nova 2.0 Lite進行了定制 , 將合規審核效率提升了整整100倍 。
re:Invent 2025發布了大量新產品 , 由于時間有限 , 今天只能介紹其中一部分 。 通過這些產品 , 我們希望能夠幫助更多企業獲得更強的工程化能力 , 在Agent應用中取得更高的效率 。
也希望大家在構建和應用Agent時 , 可以嘗試今天提到的這些能力 。
【揭秘Agent落地困局!93%企業項目卡在POC到生產最后一公里】讓我們一起構建未來 。

    推薦閱讀