lang: zh slug: agentmemory-mcp-persistent-memory-2026 title: ‘2026 年 AI 编码代理的持久内存’ description: ‘停止重新教授 Claude Code 您的项目约定。 通过设置教程和团队共享策略,了解代理内存和模型上下文协议 (MCP) 如何为 AI 编码代理提供持久的跨会话内存。’ tags: [“agents”, “ai-agent”, “ai-coding”, “ai-tools”, “automation”, “coding”, “development”, “guide”, “mcp”, “memory”, “model-context-protocol”, “open-source”, “persistence”, “persistent-memory”, “reference”, “tutorial”] date: 2026-05-17 00:00:00+08:00 lastmod: 2026-05-17 00:00:00+08:00 tech_stack: [] application_domain: Llm Frameworks source_version: ’' licensing_model: Open Source license_type: Apache-2.0 file_size: ’' file_md5: ’' download_url: ’' backup_url: ’' github_repo: ‘https://github.com/rohitg00/agentmemory' last_maintained: ‘2026-05-17’ draft: false featureImage: /images/articles/7f08e993-agentmemory-the-persistent-memory-system.png aliases:- /posts/agentmemory-mcp-persistent-memory-2026/ 常见问题解答:

  • q: ‘什么是代理内存以及它解决什么问题?’ a:‘agentmemory (rohitg00/agentmemory) 是一个用于 AI 编码代理的 Apache-2.0 开源持久内存层,通过模型上下文协议 (MCP) 为它们提供跨会话内存。 它解决了“无状态代理”问题,即 Claude Code、Cursor 和 Codex CLI 等工具在每个新会话中都会忘记项目的架构和约定。
  • q: ‘使用 Claude Code 设置代理内存需要多长时间?’ a:“设置大约需要 5 分钟:克隆 GitHub 存储库,运行 npm install 和 npm run build,然后使用 –stdio 标志将 MCP 客户端配置(例如 ~/.claude/mcp.json)指向构建的 mcp-server.js。 它需要 Node.js 18+ 和 Claude Code v2.1.45+ 或任何 MCP 兼容的客户端。
  • q: ‘agentmemory 如何跨会话存储内存?’ a:“它使用四层整合管道:感觉记忆(实时对话缓冲区)、工作记忆(通过 sqlite-vec 保存约 100 个最近交互的 SQLite 支持的向量索引)、长期记忆(用于时间推理的实体关系三元组的知识图)和元记忆(每个条目的 0-1 置信度得分,用于修剪低置信度噪音)。”
  • q: ‘团队如何与代理内存共享代理内存?’ a:“两个选项:将 SQLite 数据库视为 Git 共享工件,以便每个成员将其 MCP 配置指向共享数据库,或者通过 SSE 部署单个集中式 MCP 服务器(建议 10 人以上的团队使用),以实现实时同步、审计跟踪和基于角色的访问控制。 团队报告说,入职速度提高了 2-3 倍,重复的会议解释次数减少了 80%。
  • q: ‘什么时候不应该使用持久代理内存?’ a:“对于一次性脚本或设置开销超出价值的探索性工作、API 密钥等环境机密(属于正确的机密管理,而不是内存图)以及快速更改的临时配置,请避免使用它。 置信度分数是启发式的,而不是事实,因此建议每季度进行一次内存审核。 特征图片:/images/articles/resources-llm-frameworks-agentmemory-mcp-persistent-memory-2026.jpg—— AgentMemory:用于 AI 编码代理的 #1 持久内存系统 — 真实世界基准 22,000 颗星 — 2026 年实用指南OpenAI Codex CLI:2026 年权威指南 终端本机 {</* 资源信息 */>}## 问题:每次新的会议都是土拨鼠日如果您每天使用 Claude Code、Cursor 或 Codex CLI,您就会知道该怎么做。 您花了 20 分钟来解释代码库的架构、命名约定以及棘手的错误解决方法。 代理收到了。 你取得进步。 然后你关闭终端。明天? 空白石板。 经纪人忘记了一切。 你是教室里的老师,每个学生都患有永久性失忆症。这不是一个错误——这是默认的架构。 大多数人工智能编码代理在设计上都是无状态的。它们将每次对话视为一个孤立的事务,没有任何机制来传递所学知识。rohitg00/agentmemory 是一个 Apache-2.0 开源持久内存层,于 2026 年 5 月在 GitHub Trending 上火爆。它拥有超过 6,500 颗星,每日星数超过 1,000 颗,是 AI 代理生态系统中增长最快的基础设施项目之一。 它通过干净的模型上下文协议 (MCP) 接口支持 15 多个代理客户端,包括 Claude Code、Cursor、Windsurf、Codex CLI 和任何 MCP 兼容工具。本指南介绍了代理忘记的原因、代理内存如何修复它以及今天部署它的确切步骤。—## 为什么上下文窗口是一个陷阱### 百万代币海市蜃楼Gemini 3.1 Pro 提供了 100 万个代币的上下文窗口。 Claude 3.7 达到 200K。 人们很容易想到“把所有东西都倒在那里”。 不。上下文衰减是真实存在的。 Cloudflare 的 Agent Memory beta 发布引用的研究表明,一旦上下文超过约 500K 令牌,输出质量就会显着下降。 除了原始退化之外,还存在一个成本问题:100 万个代币调用仅输入代币就花费约 0.50 美元。 通过专用系统选择性记忆检索? 0.05 美元-0.15 美元。 这意味着 10-20 倍的成本降低。最大的隐性成本不是金钱,而是注意力污染。 将不相关的历史记录填充到上下文窗口中会迫使模型执行本应在上游进行的检索工作。 你需要支付前沿模型的费用来请天才大海捞针。### 团队知识税对于团队来说,痛苦会加剧。 一名新工程师加入一个没有共享代理内存的项目意味着需要 4-6 周的时间重新教授仅存在于部落知识中的约定。 通过共享内存配置文件,团队报告入职速度加快了 2-3 倍,因为代理已经了解团队的标准、反模式和架构历史。—## 架构:四层内存整合AgentMemory 通过在会话边界自动运行的整合管道对人类记忆进行建模。### 第 1 层:感觉记忆(即时情境)这是原始对话缓冲区。 代理内存不会取代它——它通过在对话仍然活跃时将结构化实体(类名、函数签名、架构决策)提取到向量表示中来丰富它。### 第 2 层:工作记忆(短期检索)SQLite 支持的向量索引(通过 sqlite-vec)将最后约 100 次交互保存为可检索的语义块。 查询在几毫秒内解析。 这是大多数“我们对 X 做了什么决定?”的地方。 发生查找。### 第 3 层:长期记忆(知识图谱)举重者。 代理内存将核心事实存储为实体-关系-实体三元组的知识图:```` (项目A)–[uses_framework]–>(反应) (ProjectA) –[约定]–>(名为 useXxx 的挂钩) (ProjectA) –[解决方法]–>(问题 #442 修复)
2. **纠正事件** — 手动纠正的记忆会重置其置信度
3. **时间衰退**——较旧的记忆会线性减轻,除非得到强化这不仅仅是簿记。 这是一种**遗忘机制**——系统主动修剪低置信度噪声,以保持知识图谱干净、快速。---## MCP:“AI USB-C”的实现AgentMemory 的真正战略优势不是它的图算法,而是它的**协议选择**。 通过完全基于 MCP(模型上下文协议)构建,它继承了与整个 MCP 生态系统的即时兼容性。### MCP 的工作原理````
┌──────────────┐ JSON-RPC ┌──────────────────┐
│ MCP 客户端 │ ◄──────────────► │ MCP 服务器 │
│(克劳德·代码)│ (s```
┌──────────────┐ JSON-RPC ┌──────────────────┐
│ MCP 客户端 │ ◄──────────────► │ MCP 服务器 │
│(克劳德代码)│ (stdio/SSE) │ (agentmemory) │
└──────────────┘ └──────────────────┘
│
┌────┴────┐
│ SQLite │
│ +矢量 │
│ +图表 │
└──────────┘
``宿主内部的阳离子层
- **服务器**:代理内存,作为独立进程运行服务器公开**工具**(LLM 可以调用的函数)、**资源**(LLM 可以读取的数据)和**提示**(常见任务的模板)。 LLM 根据用户的意图决定调用哪个工具。### 50+ 原子工具AgentMemory 公开了一个细粒度的工具界面——每个工具只做一件事:| Tool | Function | When It Fires |
|------|----------|---------------|
| `memory_add` | Write new memory | After architectural decisions |
| `memory_search` | Semantic retrieval | User asks "how did we handle auth?" |
| `memory_update` | Adjust confidence | User corrects an outdated memory |
| `memory_graph_query` | Relational lookup | "Which modules depend on this API?" |
| `memory_consolidate` | Run consolidation | At session end |### 工具搜索革命2026 年初 MCP 的重大升级改变了游戏规则。 以前,暴露 50 多个工具的 MCP 服务器会将所有文档预加载到上下文窗口中,消耗 67K+ 令牌。 新的**工具搜索**机制使用延迟加载:当工具描述超过可用上下文的10%时,系统切换到轻量级搜索索引。 内部测试显示代币使用量从约 134K 下降至约 5K,**减少了 85%**。 社区基准还报告了 MCP 评估准确性的提升:从 49% 提高到 74% (Opus 4),从 79.5% 提高到 88.1% (Opus 4.5)。对于代理内存用户来说,这意味着您可以公开完整的 50 个工具表面,而无需支付上下文窗口税。---## 部署指南:5 分钟实现持久内存### 先决条件- Node.js 18+
- Claude Code v2.1.45+(或任何 MCP 兼容客户端)
- git### 第 1 步:安装代理内存````
bas
h
git 克隆 https://github.com/rohitg00/agentmemory.git
CD代理内存
npm 安装
npm 运行构建# 验证服务器是否启动
节点 dist/mcp-server.js --stdio
````### 步骤 2:配置您的 MCP 客户端编辑 MCP 配置文件(对于 Claude Code,通常为 `~/.claude/mcp.json`):```
jso
n
{
“mcp服务器”:{
“代理内存”:{
“命令”:“节点”,
“参数”:[
“/绝对/路径/到/agentmemory/dist/mcp-server.js”,
“--stdio”
],
“环境”:{
"AGENTMEMORY_DB_PATH": "~/.agentmemory/内存.db",
"AGENTMEMORY_LOG_LEVEL": "信息"
}
}
}
}
````### 步骤 3:测试内存持久性

bas h git 克隆 https://github.com/rohitg00/agentmemory.git CD代理内存 npm 安装 npm 运行构建

验证服务器是否启动 #

节点 dist/mcp-server.js –stdio

这个项目的 Hook 命名约定是什么? 
````如果配置正确,克劳德将按照您存储的确切规则进行回答 - **内存在会话边界中幸存下来**。### 步骤 4:自动合并(可选)添加到`~/.claude/settings.json`:```
jso
n
{
“钩子”:{
```
jso
n
{
“mcp服务器”:{
“代理内存”:{
“命令”:“节点”,
“参数”:[
“/绝对/路径/到/agentmemory/dist/mcp-server.js”,
“--stdio”
],
“环境”:{
"AGENTMEMORY_DB_PATH": "~/.agentmemory/内存.db",
"AGENTMEMORY_LOG_LEVEL": "信息"
}
}
}
}
``emory 存储库最简单的团队设置:将 SQLite 数据库视为共享工件。````
bas
h
# 克隆团队的共享内存存储库
git 克隆 git@github.com:yourteam/agentmemory-core.git
cd 代理内存核心# 将每个成员的 MCP 配置指向共享数据库
# 在 ~/.claude/mcp.json 中:
# "AGENTMEMORY_DB_PATH": "~/workspace/agentmemory-core/memory.db"
````当恩吉```
请记住:此项目中的所有 React Hook 都必须使用 useXxx 命名约定。 没有下划线。 
````
### 选项 B:集中式 MCP 服务器(建议 10 个以上团队使用)部署单个共享实例:````
bas
h
# 在共享服务器上
npx a```
这个项目的 Hook 命名约定是什么? 
``` 远程连接
{
“mcp服务器”:{
“代理内存”:{
"url": "http://internal-server:3000/sse"
}
}
}
````好处:
- **实时同步**:一次写入,立即到处读取
- **审计跟踪**:谁更改了哪些内存以及何时更改
- **ACC```
jso
n
{
“钩子”:{
“会话结束”:{
“命令”:“mcp”,
“工具”:“内存巩固”,
“自动”:正确
}
}
}
``ort:
- **新工程师入职速度加快 2-3 倍**
- **相同约定的重复解释减少 80%**
- 代码风格一致性得分(根据团队 lint 规则衡量)从 62% 提高到 **89%**---## agentmemory 与替代方案相比如何| 解决方案 | 协议| 开源 | 特定编码 | 团队分享| 置信度评分 |
|----------|----------|-------------|-----------------|--------```
bas
h
# 克隆团队的共享内存存储库
git 克隆 git@github.com:yourteam/agentmemory-core.git
cd 代理内存核心

# 将每个成员的 MCP 配置指向共享数据库
# 在 ~/.claude/mcp.json 中:
# "AGENTMEMORY_DB_PATH": "~/workspace/agentmemory-core/memory.db"
``ermemory MCP | MCP| 麻省理工学院 | ✅ | ❌ | ❌ |**选型指南:**
- **单独开发人员**:Supermemory MCP(零配置)或agentmemory(完整功能)
- **小团队 (<10)**:agentmemory + Git 同步
- **大型团队/企业**:mem0(21 个框架集成)或 Cloudflare Agent Memory(托管 SLA)
- **重时间推理**:Zep/Graphiti(LongMemEval 63.8% 对比 mem0 的 49.0%)---## 限制和诚实警告### 不要把内存用于所有事情- **一次性脚本```
bas
h
# 在共享服务器上
npx 代理内存服务器 --端口 3000 --transport sse

# 团队成员远程连接
{
“mcp服务器”:{
“代理内存”:{
"url": "http://internal-server:3000/sse"
}
}
}
``日常,不要永垂不朽### 置信度分数是启发式的,而不是事实低置信度的记忆并不一定是错误的。 基础设施迁移后,高可信度内存仍然可能过时。 安排**季度内存审计**——像对待任何其他需要园艺的知识库一样对待您的代理的内存。### 性能基准在 M3 MacBook Pro 上测试:
- 从 10K 条目内存中检索:**< 50ms**
- 会话结束巩固(100轮对话):**~800ms**
- 存储增长:每轮对话约 5KB(包括矢量索引)---## 结论2026 年,人工智能编码代理将从受会话限制的助理升级为**长期团队成员**。 基础设施已经成熟:基准套件 (LongMemEval)、托管服务 (Cloudflare) 和开源框架(agentmemory、mem0)已将“代理内存”从研究好奇心转变为生产级架构。agentmemory 对 MCP 的押注尤其明智。 它不是构建将用户锁定在生态系统中的专有 SDK,而是插入每个主要工具已经支持的标准端口。 结果:5 分钟的设置,你的 Claude Code 实例终于记住了你是谁、你正在建造什么以及尸体埋在哪里。如果您还没有配置持久内存,那么今天就到了。---## 参考- [GitHub 上的 rohitg00/agentmemory](https://github.com/rohitg00/agentmemory)
- [模型上下文协议规范](https://modelcontextprotocol.io/)
- [LongMemEval 基准](https://github.com/...)
- [Cloudflare代理内存公告](https://blog.cloudflare.com/...)
- [克劳德代码 MCP 连接器文档](https://docs.anthropic.com/...)---## 推荐的自托管基础设施如果您想 24/7 可靠地运行该堆栈,基础设施的选择很重要:- **{< aff "digitalocean" "footer-cta-legacy" "DigitalOcean" >}}** — 200 美元免费赠金,为期 60 天,覆盖全球 14 个以上区域。 运行开源人工智能工具的独立开发者的默认选项。 
- **{< aff "htstack" "footer-cta-legacy" "HTStack" >}}** — 从中国大陆低延迟访问的香港 VPS。 这与托管 dibi8.com 的 IDC 是同一个 IDC——在生产中经过了实际考验。*附属链接 - 它们不会花费您额外的费用,并且有助于保持 dibi8.com 的运行。**撰写于 2026 年 5 月 17 日。星数和 MCP 规范版本具有时间敏感性; 在引用之前先核实官方来源。*<!--自动引用-->
## 参考文献和来源- [代理内存](https://github.com/rohitg00/agentmemory)
- [模型上下文协议(MCP)](https://modelcontextprotocol.io/)
- [sqlite-vec](https://github.com/asg017/sqlite-vec)
- [mem0](https://github.com/mem0ai/mem0)
- [Graphiti (Zep)](https://github.com/getzep/graphiti)
- [LongMemEval](https://github.com/xiaowu0162/LongMemEval)

💬 留言讨论