Giới thiệu dự án
Bạn có từng trải qua cảm giác này? Mở Claude Code, Cursor, hay bất kỳ AI coding agent nào lên sau một đêm — và bạn phải giải thích lại toàn bộ dự án từ đầu. Agent quên sạch những gì đã làm hôm qua. Quên thư mục nào chứa logic quan trọng. Quên các quyết định kiến trúc bạn đã thảo luận vài giờ trước. Bạn phải dán lại cả đoạn mô tả dự án, nhắc lại cấu trúc thư mục, liệt kê lại các công nghệ đang dùng… cứ như thể ngày mới bắt đầu hoàn toàn từ số không.
Đó chính là vấn đề mà agentmemory giải quyết — và tại sao dự án này vừa leo lên xu hướng GitHub Trending với hơn 3.700 ngôi sao (tăng tới 533 ngôi sao chỉ trong một ngày), được viết bởi nhà phát triển rohitg00.
agentmemory là một động cơ bộ nhớ bền vững mã nguồn mở, được xây dựng bằng TypeScript và phân phối dưới giấy phép Apache 2.0. Phiên bản hiện tại v0.9.5 được phát hành vào ngày 9 tháng 5 năm 2026, mang đến giải pháp bộ nhớ cho AI coding agents dựa trên benchmark thực tế. Thay vì mỗi lần tương tác đều phải cấp ngữ cảnh mới từ con số không, agentmemory giúp AI nhớ mọi thứ — từ những thay đổi mã nguồn nhỏ nhất đến các quyết định kiến trúc lớn — giữa các phiên làm việc.
Điều khiến agentmemory nổi bật là cách nó kết hợp ba thành phần tìm kiếm song song: BM25 truyền thống, vector embedding, và đồ thị tri thức (Knowledge Graph). Ba luồng này được hợp nhất thông qua thuật toán Reciprocal Rank Fusion, tạo ra kết quả truy xuất đạt 95,2% R@5 trên bảng đo lường LongMemEval-S — cao hơn đáng kể so với phương pháp chỉ dùng BM25 thuần túy (86,2%).
Dự án cũng đạt con số ấn tượng về tiết kiệm token: giảm 92% lượng token tiêu thụ hàng năm, từ 19,5 triệu tokens xuống còn khoảng 170 nghìn tokens. Chi phí API giảm từ mức gần như không khả thi (khoảng 500 USD/năm) xuống còn khoảng 10 USD, hoặc thậm chí bằng 0 khi sử dụng embedding nội địa.
Tính năng cốt lõi chi tiết
1. Giải quyết bài toán “bộ nhớ ngắn hạn” của AI coding agents
Hầu hết AI coding agents hoạt động theo mô hình trạng thái vô hồn — mỗi lần bạn mở một phiên mới, agent bắt đầu với ngữ cảnh trống rỗng. Chúng không ghi nhớ lịch sử cuộc hội thoại trước đó, không lưu trữ thông tin về quyết định kỹ thuật đã đưa ra, và đặc biệt không hiểu được mối quan hệ giữa các phần khác nhau của mã nguồn vượt ra khỏi ngữ cảnh hiện tại.
agentmemory khắc phục điều này bằng cách cung cấp một lớp bộ nhớ bền vững nằm ngoài session của agent. Mọi thông tin — từ câu lệnh terminal đã chạy, đến đoạn mã đã sửa đổi, đến các quyết định kiến trúc đã thảo luận — đều được ghi lại, tổ chức và sẵn sàng cho lần truy xuất tiếp theo.
2. Mô hình bốn tầng củng cố bộ nhớ (Four-Tier Memory Consolidation)
Lấy cảm hứng từ cách hoạt động của não bộ con người, agentmemory áp dụng quy trình chuyển đổi bộ nhớ thành bốn giai đoạn liên tiếp:
- Bộ nhớ làm việc (Working Memory): Ghi nhận ngay lập tức tất cả sự kiện từ session của coding agent — file đọc, file viết, lệnh thực thi, lỗi gặp phải. Đây là lớp dữ liệu thô, được giữ tạm thời.
- Bộ nhớepisodic (Episodic Memory): Sau khi xử lý, các sự kiện liên quan được nhóm lại thành các chuỗi sự kiện có ý nghĩa — ví dụ: “ngày hôm qua tôi đã refactor module X, gặp lỗi Y ở dòng Z, và khắc phục bằng cách W”.
- Bộ nhớ ngữ nghĩa (Semantic Memory): Từ các sự kiện episodic, agentmemory trích xuất tri thức trừu tượng hơn — quan hệ giữa các module, quy ước đặt tên, mô hình thiết kế đã được áp dụng, phạm vi của các thư viện bên ngoài đang dùng.
- Bộ nhớ thủ tục (Procedural Memory): Tầng cuối cùng là các quy tắc, thói quen và phương pháp tối ưu — những điều agent đã “học được” qua nhiều phiên: cách di chuyển thư mục an toàn, những lỗi phổ biến cần tránh, pattern nào nên tái sử dụng.
Sự phân tầng này đảm bảo rằng tri thức quý giá được bảo tồn và dễ dàng truy xuất khi cần, thay vì bị lãng quên sau mỗi session.
3. Tìm kiếm đa luồng (Triple-Stream Search)
Một tính năng kỹ thuật nổi bật của agentmemory là cơ chế tìm kiếm kết hợp ba phương pháp:
- Tìm kiếm văn bản全文 (BM25): Truy xuất nhanh dựa trên khớp từ khóa và tần suất xuất hiện trong tài liệu. Hiệu quả cho các tìm kiếm trực tiếp như tên file, tên hàm.
- Tìm kiếm vector (Vector Embedding): Sử dụng embedding để nắm bắt ý nghĩa ngữ cảnh. Khi bạn hỏi “đoạn mã xử lý thanh toán”, hệ thống hiểu intent dù không khớp chính xác từ “thanh toán” trong tài liệu.
- Đồ thị tri thức (Knowledge Graph): Biểu diễn mối quan hệ giữa các thực thể — file nào import file nào, hàm nào gọi hàm nào, dependency giữa các package. Giúp trả lời các câu hỏi kiểu “module nào chịu trách nhiệm cho việc xác thực?”.
Ba kết quả tìm kiếm từ ba luồng riêng biệt được hợp nhất thông qua thuật toán Reciprocal Rank Fusion, tối ưu hóa điểm số để trả về kết quả tổng hợp tốt nhất. Chính sự kết hợp này tạo nên độ chính xác truy xuất vượt trội.
4. Hỗ trợ toàn bộ các AI coding agent phổ biến
agentmemory hoạt động như một lớp trung立的, tương thích với hầu hết mọi coding agent hàng đầu:
- Claude Code
- Cursor
- Gemini CLI
- Codex CLI
- OpenCode
- Cline
- Goose
- Kilo Code
- Roo Code
- Aider
- Windsurf
- Claude Desktop
Không matter bạn dùng công cụ nào, agentmemory đều có thể tích hợp và duy trì bộ nhớ xuyên suốt các nền tảng.
5. 51 MCP Tool cho thao tác bộ nhớ
Với danh sách gồm 51 MCP tool chuyên biệt cho các thao tác bộ nhớ, developers có đầy đủ công cụ để:
- Lưu và truy xuất ký ức (memory entries)
- Quản lý các episode và semantic data
- Thao tác với knowledge graph
- Tìm kiếm across tất cả các tầng bộ nhớ
- Xem và replay session history
- Quản lý cấu hình bộ nhớ
6. Tự lưu trữ, không phụ thuộc dịch vụ bên ngoài
agentmemory được thiết kế để tự host hoàn toàn. Cơ sở dữ liệu sử dụng SQLite nhẹ nhàng, và engine embedding sử dụng iii-engine. Không cần đăng ký dịch vụ cloud, không yêu cầu API key bên ngoài nào — mọi dữ liệu nằm trên máy của bạn.
Đối với embedding, agentmemory hỗ trợ model all-MiniLM-L6-v2 chạy offline, hoàn toàn miễn phí và không cần kết nối internet. Điều này phù hợp với các team có yêu cầu bảo mật cao về mã nguồn.
7. Giao diện xem trực tiếp
Mỗi instance agentmemory đi kèm real-time viewer tại localhost:3113, hiển thị toàn bộ dữ liệu bộ nhớ theo thời gian thực. Bạn có thể xem từng memory entry, kiểm tra知识 graph relationship, và duyệt qua các session history.
8. Tính năng Replay Session
Tính năng replay session cho phép xem lại toàn bộ quá trình làm việc của một session trước đó — từng file được đọc, từng lệnh được chạy, từng thay đổi được thực hiện. Đây là công cụ tuyệt vời để debug, review, hoặc đơn giản là回顾 lại những gì đã làm.
9. Bảo vệ quyền riêng tư
Trước khi bất kỳ dữ liệu nào được lưu trữ, agentmemory tự động lọc tất cả secrets và API keys. Đảm bảo rằng thông tin nhạy cảm không bao giờ chạm vào bộ nhớ hệ thống.
Hướng dẫn sử dụng
Cài đặt cơ bản
Để cài đặt agentmemory, bạn cần Node.js và npm (hoặc yarn/pnpm) đã được cấu hình. Chạy lệnh sau để install global:
npm install -g agentmemory
Hoặc nếu bạn muốn clone trực tiếp từ repository:
git clone https://github.com/rohitg00/agentmemory.git
cd agentmemory
npm install
npm run build
npm link
Cấu hình với Claude Code
Tạo file cấu hình .agentmemory/config.yaml:
database:
driver: sqlite
path: ~/.agentmemory/data.db
embedding:
model: all-MiniLM-L6-v2
local: true
session:
max_entries: 10000
consolidation_interval: 3600
working_memory_ttl: 86400
search:
fusion_algorithm: reciprocal_rank_fusion
fallback_strategy: bm25_only
top_k: 5
privacy:
filter_secrets: true
redact_patterns:
- "AKIA[0-9A-Z]{16}"
- "ghp_[a-zA-Z0-9]+"
- "sk-[a-zA-Z0-9]+"
- "\\$2[aby]\\$"
Kết nối với Claude Code bằng cách thêm MCP integration vào config:
claude mcp add agentmemory http://localhost:3113/mcp
Cấu hình với Cursor
Trong file settings của Cursor, thêm configuration để tích hợp agentmemory:
{
"mcp": {
"agentmemory": {
"transport": "stdio",
"command": "agentmemory",
"args": ["serve"],
"env": {
"AGENTMEMORY_CONFIG": "~/.agentmemory/config.yaml"
}
}
}
}
Sử dụng qua CLI
Sau khi cài đặt, bạn có thể tương tác với agentmemory trực tiếp từ terminal:
# Khởi tạo database mới
agentmemory init --project my-awesome-app
# Lưu một memory entry
agentmemory save --type episodic \
--title "Refactor authentication module" \
--content "Đã refactor module auth/src/auth.ts, thay thế JWT verify bằng library jsonwebtoken v9.x" \
--files "src/auth.ts,package.json"
# Truy xuất memory liên quan
agentmemory search --query "xác thực jwt" --top-k 5
# Xem knowledge graph
agentmemory query-graph --entity auth --depth 2
# Replay session trước đó
agentmemory replay --session sess_20260509_001
Tích hợp với Docker
Nếu bạn prefer deployment qua Docker, agentmemory cung cấp official image:
docker run -d \
--name agentmemory \
-p 3113:3113 \
-v ~/agentmemory-data:/data \
-v ~/.agentmemory/config.yaml:/config/config.yaml:ro \
ghcr.io/rohitg00/agentmemory:latest
Sau đó truy cập giao diện web tại http://localhost:3113.
Ví dụ: Tự động capture memory trong workflow hàng ngày
Giả sử bạn có một script bash tự động capture những thay đổi quan trọng:
#!/bin/bash
# auto-capture.sh — Tự động lưu memory sau mỗi push
TIMESTAMP=$(date +%Y%m%d_%H%M%S)
REPO_DIR="${PWD}"
# Capture git diff summary
DIFF_SUMMARY=$(git diff --cached --stat | head -20)
# Lưu vào agentmemory
agentmemory save \
--type episodic \
--title "Git commit -$TIMESTAMP" \
--content "$DIFF_SUMMARY" \
--repository "$REPO_DIR"
echo "✅ Memory captured: $TIMESTAMP"
Script này có thể được kích hoạt bởi pre-commit hook, giúp mọi thay đổi code được tự động ghi lại mà không cần can thiệp thủ công.
Trường hợp sử dụng thực tế
Case 1: Developer làm việc độc lập sau nhiều tuần nghỉ
Bạn rời project hai tuần để xử lý việc cá nhân. Trở lại, bạn không nhớ mình đã dừng ở đâu, module nào còn dang dở, hay những bug nào đang pending. Với agentmemory, chỉ cần mở localhost:3113 và tìm kiếm “task progress” — hệ thống trả về toàn bộ các task còn lại, các bug report đã tạo, và những thay đổi cuối cùng bạn đã commit. Không còn cần ngồi đọc lại toàn bộ commit history.
Case 2: Team nhỏ có nhiều thành viên chuyển đổi ngữ cảnh
Trong team ba người đang develop cùng lúc một ứng dụng, A làm phần backend, B lo frontend, C phụ trách deployment. Khi B chuyển sang fix bug liên quan đến endpoint /api/payments, agentmemory giúp AI agent của B ngay lập tức truy xuất tất cả các memory entries liên quan đến payments module — từ những PR trước đó, các issue báo cáo lỗi, đến các discussion trong session của A. Giảm thiểu sự chậm trễ do thiếu context-sharing.
Case 3: Audit và debug phức tạp
Khi cần debug một lỗi nghiêm trọng xảy ra production, agentmemory cho phép replay toàn bộ session của developer đã deploy phiên bản đó. Bạn có thể xem chính xác file nào đã bị thay đổi, tại sao thay đổi, và environment variables đang dùng. Thông tin hữu ích gấp bội so với việc chỉ nhìn vào diff của một commit duy nhất.
Case 4: Onboarding developer mới
Thay vì tốn cả tuần để developer mới đọc qua toàn bộ repository và cố gắng hiểu lịch sử thay đổi, bạn có thể export các memory entries từ agentmemory — cung cấp cái nhìn tóm tắt về những quyết định quan trọng đã được đưa ra, các pattern kiến trúc phổ biến, và những sai lầm thường gặp. Onboarding trở nên nhanh chóng và có cấu trúc.
So sánh với đối thủ cạnh tranh
agentmemory vs mem0
mem0 là một solution khá nổi tiếng cho persistent memory của AI agents. Tuy nhiên, mem0 chủ yếu tập trung vào conversational memory — ghi nhớ những gì user nói trong chat, chứ không chuyên sâu vào technical context của coding workflows.
agentmemory, mặt khác, được xây dựng từ gốc cho coding agents. Knowledge Graph của agentmemory biểu diễn explicit relationships giữa files, functions, và modules — điều mà mem0 chưa làm được. Về cost, mem0 yêu cầu dịch vụ cloud trả phí, trong khi agentmemory chạy hoàn toàn local-free.
| Tiêu chí | agentmemory | mem0 |
|---|---|---|
| Hosting | Self-hosted, local | Cloud-based |
| Chi phí | ~$0 (local embedding) | Theo usage tier |
| Knowledge Graph | Có | Không |
| Triple-stream search | BM25 + Vector + KG | Chủ yếu vector |
| MCP integration | 51 tools | Ít hơn |
| Độ chính xác R@5 | 95,2% | ~86,2% |
| Privacy | Dữ liệu trên máy bạn | Dữ liệu qua cloud |
agentmemory vs Letta
Letta là một project mã nguồn mở hướng đến agentic AI với memory mechanism, nhưng focus chính của họ là building fully autonomous agents chứ không phải augment coding experience. Letta có complexity cao hơn và đòi hỏi setup khá phức tạp.
agentmemory có phạm vi hẹp hơn nhưng sâu hơn — chỉ dành cho coding agents, với sự tinh chỉnh cao độ cho workflow lập trình cụ thể. Nếu bạn đang dùng Claude Code hay Cursor hàng ngày, agentmemory tích hợp mượt mà hơn hẳn.
| Tiêu chí | agentmemory | Letta |
|---|---|---|
| Target audience | Coding developers | Autonomous agents |
| Setup complexity | Thấp (5 phút) | Cao (cần config phức tạp) |
| Supported agents | 12+ coding tools | Limited integrations |
| Memory tiers | 4 layers | Customizable but complex |
| Deployment | SQLite local | Requires external services |
agentmemory vs CLAUDE.md
CLAUDE.md (hay các biến thể như .cursorrules) là file static chứa instructions để Claude/Cursor hiểu project của bạn. Ý tưởng tốt — ghi rõ rules, conventions, và guidelines vào một file text. Nhưng CLAUDE.md có ba hạn chế lớn:
- Static: File không tự động cập nhật. Khi bạn thay đổi quy ước, bạn phải nhớ edit file. agentmemory tự động học và update memory entries.
- One-direction: CLAUDE.md chỉ cung cấp information từ bạn → agent. agentmemory tạo vòng feedback hai chiều — agent cũng học và đóng góp ngược lại.
- No search capability: CLAUDE.md là toàn bộ text bạn paste vào prompt. agentmemory cho phép tìm kiếm semantic, truy xuất có chọn lọc theo ngữ cảnh, và giảm token usage đáng kể.
Agentmemory không loại bỏ hoàn toàn vai trò của CLAUDE.md — thực tế, nhiều developer dùng kết hợp cả hai: CLAUDE.md cho high-level project rules cố định, và agentmemory cho dynamic, evolving knowledge.
Cách bắt đầu
Yêu cầu hệ thống
- Node.js 18+ (hoặc Bun để tốc độ nhanh hơn)
- Disk space tối thiểu 500MB cho database và embedded models
- RAM ít nhất 2GB
- Không yêu cầu kết nối internet khi sử dụng local embedding
Quick start trong 5 bước
Bước 1: Cài đặt
npm install -g agentmemory
Bước 2: Khởi tạo
mkdir ~/my-project
cd ~/my-project
agentmemory init --project my-project
Bước 3: Cấu hình embedding
Tạo file ~/.agentmemory/config.yaml như ví dụ trong phần hướng dẫn sử dụng ở trên. Để dùng local embedding hoàn toàn miễn phí, đảm bảo flag local: true được set.
Bước 4: Kết nối coding agent của bạn
Ví dụ với Cursor:
// .cursor/settings.json
{
"mcp": {
"agentmemory": {
"transport": "stdio",
"command": "agentmemory",
"args": ["serve"]
}
}
}
Bước 5: Bắt đầu lưu memory
Mỗi khi bạn làm việc với Claude Code, Cursor, hoặc agent supported khác, agentmemory sẽ tự động capture và lưu các memory entries. Truy cập http://localhost:3113 để xem real-time dashboard.
Migrating từ các tool cũ
Nếu bạn đang dùng mem0, Letta, hoặc các solution tương tự, agentmemory cung cấp migration utility:
agentmemory migrate --from mem0 --source ~/.mem0/data
Migration process tự động convert các memory entries sang format four-tier của agentmemory, preserve các relationships đã được học, và re-index toàn bộ dataset.
Tối ưu performance
- Tắt local embedding (
local: false) nếu bạn có kết nối internet ổn định và muốn dùng remote embedding service cho accuracy cao hơn - Tăng
max_entriestrong config nếu làm project rất lớn (> 100.000 memory entries) - Điều chỉnh
consolidation_intervalthấp hơn nếu bạn muốn episodic data chuyển sang semantic nhanh hơn - Kích hoạt
filter_secrets: trueđể bảo mật tối đa
Kết luận
agentmemory giải quyết một trong những vấn đề đau đớn nhất của AI coding agents hiện nay: sự forgetting lặp đi lặp lại giữa các session. Với mô hình bốn tầng bộ nhớ lấy cảm hứng từ não bộ, cơ chế tìm kiếm triple-stream tiên tiến, 51 MCP tools phong phú, và khả năng tích hợp rộng rãi với mọi coding agent phổ biến, agentmemory xứng đáng là tool bạn thử nghiệm.
Điểm cộng lớn nhất là tính chất self-hosted, zero external dependencies — dữ liệu của bạn stays local, chi phí có thể bằng 0 với local embedding, và privacy được đảm bảo tuyệt đối. Con số 95,2% R@5 trên LongMemEval-S cũng chứng tỏ đây không chỉ là project concept mà đã được validate bằng benchmark nghiêm túc.
Tại thời điểm version v0.9.5 được phát hành ngày 9 tháng 5 năm 2026, với hơn 3.700 stars trên GitHub và giấy phép Apache 2.0 thân thiện với thương mại, agentmemory đang là một trong những dự án open-source đáng chú ý nhất trong lĩnh vực AI developer tools.
Hãy bắt đầu dùng thử và cho AI coding agent của bạn đôi mắt remembers — bạn sẽ thấy hiệu suất tăng lên rõ rệt.
Đây là bài viết trong series tìm hiểu về các trending projects trên GitHub. Bài tiếng Anh cùng series: agentmemory: Persistent Memory Engine for AI Coding Agents
📦 GitHub repository: https://github.com/rohitg00/agentmemory
🔗 Các bài viết liên quan: