亞馬遜Agent克服遺忘的“秘訣”，被中國團隊掌握，讓大模型遺忘率趨近于0

2026-04-11 掃地機器人人工智能 irobot

文章圖片

文章圖片

文章圖片

智東西
作者 | 江宇
編輯 | 漠影
AI很聰明，但記性很差。
你大概也遇到過這樣的場景：第一輪對話里告訴智能客服“我對海鮮過敏” ，聊到第十輪，它卻依然熱情推薦海鮮自助。
在企業服務里，用戶換一個渠道、換一個Agent ，之前提供的信息就像從沒出現過一樣，用戶體驗被“AI的健忘癥”一再打斷。
對于正在大規?！吧显啤焙汀吧螦I”的企業來說，這是每天都會撞上的真實業務問題：模型上下文窗口有限，多Agent之間形成“記憶孤島” ，語義歧義和知識遺忘在長鏈路服務中被不斷放大。
如果不能讓AI持續記住用戶、記住業務現場，再強的大模型也很難扛起真實的服務指標。
這種痛點在全球云廠商的實踐中已經被驗證。亞馬遜云科技在今年的Agentic AI基礎設施實踐經驗系列中專門拿出一篇，討論大模型在“記憶”上的先天缺陷，并提出要在Agent體系里單獨建設記憶模塊，區分短期記憶和長期記憶，將“記憶”從附屬能力升級為Agentic AI基礎設施的一部分。
亞馬遜AWS官方博客
在海外巨頭已經將“記憶系統”提升到基礎設施層的同時，國內也開始出現以記憶為主線構建產品和架構的團隊。
紅熊AI便是其中之一。公司成立于2024年，圍繞多模態大模型與記憶科學開展研發，并將這些能力用于為企業提供智能客服、營銷自動化與AI智能體服務。
12月1日，紅熊AI正式發布記憶科學開源產品“記憶熊”（Memory Bear）。
這套系統已接入紅熊AI自研的Agent互動服務平臺，并在原有客服、營銷、教育等多個業務場景中完成了落地。平臺數據顯示，單日最大AI接待量約35萬次， AI自助解決率達98.4% ，人工替代率達到70% 。在接入記憶熊后，多輪對話的token消耗下降97% ，大模型知識遺忘率被壓至0.1%以下。與此同時，紅熊AI的業績也從最初預期的3000萬元，上調至1.9億元。
目前，紅熊AI已將記憶熊的核心框架開源，并上線官網MemoryBear.AI ，希望把“記憶”做成一項可以被開發者與企業直接調用的基礎能力。
“記憶熊”官網MemoryBear.AI
在國內Agent落地還以“問答和工具調用”為主流路徑的當下，紅熊AI算是較早一批把“記憶架構”單拎出來做成獨立產品、并在真實業務場景里跑通指標的團隊之一。

一、AI的“記憶缺失” ，難以支撐企業智能服務在紅熊AI接入的多個客服與營銷項目中，其團隊很快發現一個共性：不補上“記憶”這一塊，再強的大模型也難以在B端場景中穩定扛住業務指標。
紅熊AI發現，最先暴露出來的是單模型層面的知識遺忘。大模型依賴有限的上下文窗口來“記住”當前對話，早期信息會在長對話中被不斷擠出，靜態知識庫也無法吸收用戶在對話中補充的個性化信息。
此外，注意力機制天然存在“近因效應” ，越靠后的信息越容易被模型抓住，越往前的細節越容易被忽略，這就造成了典型的“答完就忘” 。同一個用戶重復強調過幾次的偏好和限制條件，只要跨過一定輪次，很容易在后續回答中消失。
亞馬遜云科技在今年的Agent記憶實踐文章里也做了類似總結：LLM本質是無狀態的，每次調用都是一次新的推理，長上下文不僅不能徹底解決記憶問題，反而會帶來性能下降和Token成本攀升，這一點和紅熊在項目中的經驗總結是高度一致。
其次是多Agent之間的記憶斷層，咨詢、售后、推薦等Agent都會各自維護獨立記憶，切換時狀態將無法完整繼承，容易引發決策沖突。
第三類問題來自語義層面的歧義與行業術語。企業服務里的表達往往是口語化、多語言混用且高度依賴上下文的，具體指向什么，必須結合歷史對話才能解釋清楚。如果模型只能在當前輪次里做模式匹配，很容易給出模棱兩可甚至錯誤的回復。
正是在這種背景下，紅熊AI意識到， “記憶”需要被單獨抽象為一套可設計、可治理的系統能力。
與AWS在Agent框架中加入專門記憶模塊的思路類似，紅熊團隊選擇從“重構記憶系統”入手，把“記性好不好”這件事交給一塊獨立的基礎設施來負責。在模型之外再造一套獨立、可控、可審計的記憶系統，這也是記憶熊的起點。

二、從記憶到認知，記憶熊如何把“類人記憶”做成底層能力記憶熊沒有從堆疊更多參數入手，而是先把“人怎么記東西”這件事拆開：先搞清楚人類記憶的分類，再去給AI搭一套對應的記憶架構。
從記憶科學出發，記憶熊把人類感知記憶、工作記憶、顯性記憶、隱性記憶、情緒記憶逐一映射到AI的多模態輸入緩存、短期任務內存、結構化知識庫、行為習慣模塊和情感加權記憶等組件。
人類記憶與記憶熊的記憶映射
簡單來說，看到什么、當下在處理什么、長期知道些什么、習慣怎么做決策、以及對不同事件“在意程度”有多高，都會在系統里有各自的位置和處理方式。
在此基礎上，記憶熊把“人是如何記東西”的認知科學抽象成一整套可工程化的記憶架構：從多模態采集出發，到結構化圖譜，再到分級審核與在線應用。
Memory Bear . AI記憶熊在線應用
企業可以像接入數據庫一樣，為自身的AI系統接入一塊可控、可演進的“記憶大腦” 。

三、從客服到教育，記憶讓AI大幅度提高在業務中的價值從紅熊AI披露的項目數據看，它已經實打實頂住了企業每天幾十萬次交互的業務現場。
其Agent互動服務平臺在激烈競爭壓力下，保持了較高的穩定性和服務質量：單日最大AI接待量達到35萬次， AI自助解決率達98.4% ，人工替代率達70% ，復雜問題自動路由率達91.7% ，模型幻覺率低于0.2% ，業務回答準確率穩定在99%左右。
紅熊AI Agent互動服務平臺實踐效果
這些核心指標也反映出“記憶”在提升服務連續性與一致性方面已發揮出一定的作用。
在技術評估上，記憶熊同樣展現出明顯優勢。根據LOCOMO數據集測試結果，記憶熊在單跳、多跳、開放域以及時序類任務中的F1、BLEU與Judge分數均優于Mem0、Zep、LangMem等主流記憶方案，整體性能處于領先。
在具體行業場景中，紅熊AI的能力也通過多個典型應用得到驗證。從智能客服、營銷自動化到教育輔導、企業內部知識管理等場景中，記憶熊通過跨會話、跨角色、跨渠道的統一記憶體系，讓Agent始終保持連貫理解與穩定決策。
在生態層面，記憶熊已將核心框架開源至Github ，并上線官網MemoryBear.AI ，希望與開發者共同完善記憶科學技術體系。
隨著Agent化應用越來越多、企業對“可控記憶”和“組織記憶中樞”的需求增強，像記憶熊這樣的記憶平臺有機會成為AI基礎設施的一環。

結語：記憶，能讓AI變得更“有用”紅熊AI在記憶科學上的進展，把長期被忽視的“記憶”能力打造為可直接依賴的基礎設施：一端承接多模態大模型和Agent的推理與生成能力，一端對接企業真實的業務流程與長期信息，使模型不再在每次交互中從零開始。
對行業而言，補上“記憶”這一塊，大模型的表現將不再單一受限于上下文長度，而是由一套可持續積累、可持續調用的結構化記憶體系來支撐，使其在復雜的任務中保持更穩定的有效性。
隨著多模態大模型、Agent框架與記憶科學不斷融合， “記憶”這條技術主線會向更高層次的能力延展，讓AI從短暫回應的工具，逐步演化為能理解、能延續，也能長時間工作的系統。
【亞馬遜Agent克服遺忘的“秘訣”，被中國團隊掌握，讓大模型遺忘率趨近于0】AI從“能回答”邁向“長期記憶、持續反饋”的那一步，很可能就建立在這塊看不見卻持續發揮作用的記憶基座之上。

推薦閱讀

上一篇：華為新架構砍了Transformer大動脈！任意模型推理能力原地飆升

下一篇：出貨1億顆，格科高端CIS產品還拿下ODM訂單