AI Agent 记忆持久化 2026:Letta vs Mem0 vs A-MEM 实测对比

没有持久化记忆的 Agent 每次会话都从零开始。在同一个多会话负载下实测 Letta、Mem0、A-MEM:到底谁能真正留住上下文、谁更省钱、什么时候应该自研。

  • Letta
  • Mem0
  • A-MEM
  • Vector DB
  • Python
  • Apache-2.0 / MIT
  • 更新于 2026-05-25

{{< resource-info >}}

AI Agent 记忆持久化 2026:Letta vs Mem0 vs A-MEM #

Meta Description:没有记忆的 Agent 每次重启都归零。在多会话负载下实测 Letta、Mem0、A-MEM,到底谁能留住上下文、谁更便宜、什么时候该自己造轮子。

持久化记忆是 Agent 从「工具」走向「伙伴」的分水岭。2025-2026 年期间,有三个开源框架成为认真候选。本文在同一个多会话负载下实测了它们。

⚡ TL;DR #

Letta:类 OS 的记忆分层(core / archival / recall),最为成熟复杂。

Mem0:开发者体验最佳,最适合给现有 Agent 快速加记忆。

A-MEM:偏研究,带主动遗忘 + 衰减,最适合长跑 Agent。

不必用:一次性简单任务,直接上 MCP memory server。

三种路线 #

Letta(前身 MemGPT) #

Stars:约 13K。技术栈:Python。 模型:受操作系统启发的分层结构。Core memory(驻留上下文)、archival memory(向量数据库)、recall memory(分页历史)。Agent 自主编辑自己的记忆。

Mem0 #

Stars:约 8K。技术栈:Python。 模型:简洁的 add/search API。记忆条目是被总结并向量化的用户陈述。开发者体验最佳。

A-MEM #

Stars:约 3K。技术栈:Python(学术界出身)。 模型:带衰减的主动遗忘机制。近期记忆权重更高,更适合长跑 Agent。

实测:10 会话多轮负载 #

模拟两周内的 10 次会话,对象是一个编程助手 Agent。追踪指标:

  • 记忆保留准确率(Agent 还记得 session 1 设定的用户偏好吗?)
  • 记忆层带来的额外延迟
  • 接入时间
  • 成本(token 消耗 + 数据库)

保留准确率(事实正确召回的比例) #

记忆框架Session 2Session 5Session 10
Letta95%90%85%
Mem092%80%65%
A-MEM88%85%80%
无记忆(基线)0%0%0%

结论:Letta 长期保留最佳。A-MEM 跨会话表现最稳。

额外延迟 #

LettaMem0A-MEM
p95 额外延迟180ms80ms120ms

结论:Mem0 最轻量。Letta 最重(越复杂 = 查询越多)。

接入时间 #

LettaMem0A-MEM
跑通集成所需时间1-2 小时20 分钟30-45 分钟

结论:Mem0 接入最快。

各自适用场景 #

Letta 胜出的场景: #

  • 多轮 Agent 长期服务同一用户(数月起)
  • 记忆复杂度有讲究(优先级、演化中的偏好)
  • 愿意投入接入时间换取生产级打磨

Mem0 胜出的场景: #

  • 给现有 Agent 快速加上记忆
  • 简单的「记住这些事实」工作流
  • 在乎开发者体验

A-MEM 胜出的场景: #

  • 长跑 Agent 需要衰减(旧事实相关性下降)
  • 研究 / 实验导向
  • 想自己调记忆动态参数

不需要专用记忆层的场景: #

  • 一次性任务
  • 单会话工作流
  • 仅需「记住用户名」这类简单需求 —— 上 MCP memory server 即可

实际接入 #

以 Mem0(最简)为例,给现有 Agent 加记忆:

from mem0 import Memory
m = Memory()
m.add("User prefers TypeScript over JavaScript", user_id="alice")
m.add("User's project uses pnpm not npm", user_id="alice")

# Later session
relevant = m.search("What package manager?", user_id="alice")
# Returns: "User's project uses pnpm not npm"

relevant 注入 Agent 上下文。就这么简单。

Letta 集成更重,但能拿到更完整的分层能力。

成本影响 #

记忆框架确实会增加成本:

  • 写入新记忆嵌入:每次 add 0.0001-0.0005 美元
  • 每轮检索:0.0002-0.001 美元
  • 向量数据库托管:每月 20-100 美元

对面向付费用户的 Agent:相对营收微不足道。对免费 / 业余 Agent:明显感觉得到。请提前规划预算。

推荐基础设施 #

记忆框架 + 向量数据库托管推荐:

联盟链接 —— 价格一致,支持 dibi8.com。

结语 #

复杂生产级 Agent 选 Letta。给已有 Agent 快速加记忆选 Mem0。长跑 + 需要衰减选 A-MEM。它们解决同一个问题,但切入点不同 —— 按你的优先级挑就行。

简单场景下,MCP memory server 已经够用,不要过度工程化。只有当记忆质量真正成为产品差异化点时,专用记忆框架的复杂度才值得投入。


相关阅读AI Agent 记忆系统 2026 · MCP Servers 2026 排行榜 · 开源 AI Agent 框架 Top 10

💬 留言讨论