亞馬遜Agent克服遺忘的“秘訣”,被中國團隊掌握,讓大模型遺忘率趨近于0

亞馬遜Agent克服遺忘的“秘訣”,被中國團隊掌握,讓大模型遺忘率趨近于0

文章圖片

亞馬遜Agent克服遺忘的“秘訣”,被中國團隊掌握,讓大模型遺忘率趨近于0

文章圖片

亞馬遜Agent克服遺忘的“秘訣”,被中國團隊掌握,讓大模型遺忘率趨近于0

文章圖片


智東西
作者 | 江宇
編輯 | 漠影
AI很聰明 , 但記性很差 。
你大概也遇到過這樣的場景:第一輪對話里告訴智能客服“我對海鮮過敏” , 聊到第十輪 , 它卻依然熱情推薦海鮮自助 。
在企業服務里 , 用戶換一個渠道、換一個Agent , 之前提供的信息就像從沒出現過一樣 , 用戶體驗被“AI的健忘癥”一再打斷 。
對于正在大規?!吧显啤焙汀吧螦I”的企業來說 , 這是每天都會撞上的真實業務問題:模型上下文窗口有限 , 多Agent之間形成“記憶孤島” , 語義歧義和知識遺忘在長鏈路服務中被不斷放大 。
如果不能讓AI持續記住用戶、記住業務現場 , 再強的大模型也很難扛起真實的服務指標 。
這種痛點在全球云廠商的實踐中已經被驗證 。 亞馬遜云科技在今年的Agentic AI基礎設施實踐經驗系列中專門拿出一篇 , 討論大模型在“記憶”上的先天缺陷 , 并提出要在Agent體系里單獨建設記憶模塊 , 區分短期記憶和長期記憶 , 將“記憶”從附屬能力升級為Agentic AI基礎設施的一部分 。
亞馬遜AWS官方博客
在海外巨頭已經將“記憶系統”提升到基礎設施層的同時 , 國內也開始出現以記憶為主線構建產品和架構的團隊 。
紅熊AI便是其中之一 。 公司成立于2024年 , 圍繞多模態大模型與記憶科學開展研發 , 并將這些能力用于為企業提供智能客服、營銷自動化與AI智能體服務 。
12月1日 , 紅熊AI正式發布記憶科學開源產品“記憶熊”(Memory Bear) 。
這套系統已接入紅熊AI自研的Agent互動服務平臺 , 并在原有客服、營銷、教育等多個業務場景中完成了落地 。 平臺數據顯示 , 單日最大AI接待量約35萬次 , AI自助解決率達98.4% , 人工替代率達到70% 。 在接入記憶熊后 , 多輪對話的token消耗下降97% , 大模型知識遺忘率被壓至0.1%以下 。 與此同時 , 紅熊AI的業績也從最初預期的3000萬元 , 上調至1.9億元 。
目前 , 紅熊AI已將記憶熊的核心框架開源 , 并上線官網MemoryBear.AI , 希望把“記憶”做成一項可以被開發者與企業直接調用的基礎能力 。
“記憶熊”官網MemoryBear.AI
在國內Agent落地還以“問答和工具調用”為主流路徑的當下 , 紅熊AI算是較早一批把“記憶架構”單拎出來做成獨立產品、并在真實業務場景里跑通指標的團隊之一 。

一、AI的“記憶缺失” , 難以支撐企業智能服務在紅熊AI接入的多個客服與營銷項目中 , 其團隊很快發現一個共性:不補上“記憶”這一塊 , 再強的大模型也難以在B端場景中穩定扛住業務指標 。
紅熊AI發現 , 最先暴露出來的是單模型層面的知識遺忘 。 大模型依賴有限的上下文窗口來“記住”當前對話 , 早期信息會在長對話中被不斷擠出 , 靜態知識庫也無法吸收用戶在對話中補充的個性化信息 。
此外 , 注意力機制天然存在“近因效應” , 越靠后的信息越容易被模型抓住 , 越往前的細節越容易被忽略 , 這就造成了典型的“答完就忘” 。 同一個用戶重復強調過幾次的偏好和限制條件 , 只要跨過一定輪次 , 很容易在后續回答中消失 。
亞馬遜云科技在今年的Agent記憶實踐文章里也做了類似總結:LLM本質是無狀態的 , 每次調用都是一次新的推理 , 長上下文不僅不能徹底解決記憶問題 , 反而會帶來性能下降和Token成本攀升 , 這一點和紅熊在項目中的經驗總結是高度一致 。
其次是多Agent之間的記憶斷層 , 咨詢、售后、推薦等Agent都會各自維護獨立記憶 , 切換時狀態將無法完整繼承 , 容易引發決策沖突 。
第三類問題來自語義層面的歧義與行業術語 。 企業服務里的表達往往是口語化、多語言混用且高度依賴上下文的 , 具體指向什么 , 必須結合歷史對話才能解釋清楚 。 如果模型只能在當前輪次里做模式匹配 , 很容易給出模棱兩可甚至錯誤的回復 。
正是在這種背景下 , 紅熊AI意識到 , “記憶”需要被單獨抽象為一套可設計、可治理的系統能力 。
與AWS在Agent框架中加入專門記憶模塊的思路類似 , 紅熊團隊選擇從“重構記憶系統”入手 , 把“記性好不好”這件事交給一塊獨立的基礎設施來負責 。 在模型之外再造一套獨立、可控、可審計的記憶系統 , 這也是記憶熊的起點 。

二、從記憶到認知 , 記憶熊如何把“類人記憶”做成底層能力記憶熊沒有從堆疊更多參數入手 , 而是先把“人怎么記東西”這件事拆開:先搞清楚人類記憶的分類 , 再去給AI搭一套對應的記憶架構 。
從記憶科學出發 , 記憶熊把人類感知記憶、工作記憶、顯性記憶、隱性記憶、情緒記憶逐一映射到AI的多模態輸入緩存、短期任務內存、結構化知識庫、行為習慣模塊和情感加權記憶等組件 。
人類記憶與記憶熊的記憶映射
簡單來說 , 看到什么、當下在處理什么、長期知道些什么、習慣怎么做決策、以及對不同事件“在意程度”有多高 , 都會在系統里有各自的位置和處理方式 。
在此基礎上 , 記憶熊把“人是如何記東西”的認知科學抽象成一整套可工程化的記憶架構:從多模態采集出發 , 到結構化圖譜 , 再到分級審核與在線應用 。
Memory Bear . AI記憶熊在線應用
企業可以像接入數據庫一樣 , 為自身的AI系統接入一塊可控、可演進的“記憶大腦” 。

三、從客服到教育 , 記憶讓AI大幅度提高在業務中的價值從紅熊AI披露的項目數據看 , 它已經實打實頂住了企業每天幾十萬次交互的業務現場 。
其Agent互動服務平臺在激烈競爭壓力下 , 保持了較高的穩定性和服務質量:單日最大AI接待量達到35萬次 , AI自助解決率達98.4% , 人工替代率達70% , 復雜問題自動路由率達91.7% , 模型幻覺率低于0.2% , 業務回答準確率穩定在99%左右 。
紅熊AI Agent互動服務平臺實踐效果
這些核心指標也反映出“記憶”在提升服務連續性與一致性方面已發揮出一定的作用 。
在技術評估上 , 記憶熊同樣展現出明顯優勢 。 根據LOCOMO數據集測試結果 , 記憶熊在單跳、多跳、開放域以及時序類任務中的F1、BLEU與Judge分數均優于Mem0、Zep、LangMem等主流記憶方案 , 整體性能處于領先 。
在具體行業場景中 , 紅熊AI的能力也通過多個典型應用得到驗證 。 從智能客服、營銷自動化到教育輔導、企業內部知識管理等場景中 , 記憶熊通過跨會話、跨角色、跨渠道的統一記憶體系 , 讓Agent始終保持連貫理解與穩定決策 。
在生態層面 , 記憶熊已將核心框架開源至Github , 并上線官網MemoryBear.AI , 希望與開發者共同完善記憶科學技術體系 。
隨著Agent化應用越來越多、企業對“可控記憶”和“組織記憶中樞”的需求增強 , 像記憶熊這樣的記憶平臺有機會成為AI基礎設施的一環 。

結語:記憶 , 能讓AI變得更“有用”紅熊AI在記憶科學上的進展 , 把長期被忽視的“記憶”能力打造為可直接依賴的基礎設施:一端承接多模態大模型和Agent的推理與生成能力 , 一端對接企業真實的業務流程與長期信息 , 使模型不再在每次交互中從零開始 。
對行業而言 , 補上“記憶”這一塊 , 大模型的表現將不再單一受限于上下文長度 , 而是由一套可持續積累、可持續調用的結構化記憶體系來支撐 , 使其在復雜的任務中保持更穩定的有效性 。
隨著多模態大模型、Agent框架與記憶科學不斷融合 , “記憶”這條技術主線會向更高層次的能力延展 , 讓AI從短暫回應的工具 , 逐步演化為能理解、能延續 , 也能長時間工作的系統 。
【亞馬遜Agent克服遺忘的“秘訣”,被中國團隊掌握,讓大模型遺忘率趨近于0】AI從“能回答”邁向“長期記憶、持續反饋”的那一步 , 很可能就建立在這塊看不見卻持續發揮作用的記憶基座之上 。

    推薦閱讀