agentmemory: Khiến AI Coding Agent Nhớ Mãi Mã Nguồn Của Bạn

Giới thiệu dự án

Bạn có từng trải qua cảm giác này? Mở Claude Code, Cursor, hay bất kỳ AI coding agent nào lên sau một đêm — và bạn phải giải thích lại toàn bộ dự án từ đầu. Agent quên sạch những gì đã làm hôm qua. Quên thư mục nào chứa logic quan trọng. Quên các quyết định kiến trúc bạn đã thảo luận vài giờ trước. Bạn phải dán lại cả đoạn mô tả dự án, nhắc lại cấu trúc thư mục, liệt kê lại các công nghệ đang dùng… cứ như thể ngày mới bắt đầu hoàn toàn từ số không.

Đó chính là vấn đề mà agentmemory giải quyết — và tại sao dự án này vừa leo lên xu hướng GitHub Trending với hơn 3.700 ngôi sao (tăng tới 533 ngôi sao chỉ trong một ngày), được viết bởi nhà phát triển rohitg00.

agentmemory là một động cơ bộ nhớ bền vững mã nguồn mở, được xây dựng bằng TypeScript và phân phối dưới giấy phép Apache 2.0. Phiên bản hiện tại v0.9.5 được phát hành vào ngày 9 tháng 5 năm 2026, mang đến giải pháp bộ nhớ cho AI coding agents dựa trên benchmark thực tế. Thay vì mỗi lần tương tác đều phải cấp ngữ cảnh mới từ con số không, agentmemory giúp AI nhớ mọi thứ — từ những thay đổi mã nguồn nhỏ nhất đến các quyết định kiến trúc lớn — giữa các phiên làm việc.

Điều khiến agentmemory nổi bật là cách nó kết hợp ba thành phần tìm kiếm song song: BM25 truyền thống, vector embedding, và đồ thị tri thức (Knowledge Graph). Ba luồng này được hợp nhất thông qua thuật toán Reciprocal Rank Fusion, tạo ra kết quả truy xuất đạt 95,2% R@5 trên bảng đo lường LongMemEval-S — cao hơn đáng kể so với phương pháp chỉ dùng BM25 thuần túy (86,2%).

Dự án cũng đạt con số ấn tượng về tiết kiệm token: giảm 92% lượng token tiêu thụ hàng năm, từ 19,5 triệu tokens xuống còn khoảng 170 nghìn tokens. Chi phí API giảm từ mức gần như không khả thi (khoảng 500 USD/năm) xuống còn khoảng 10 USD, hoặc thậm chí bằng 0 khi sử dụng embedding nội địa.

Tính năng cốt lõi chi tiết

1. Giải quyết bài toán “bộ nhớ ngắn hạn” của AI coding agents

Hầu hết AI coding agents hoạt động theo mô hình trạng thái vô hồn — mỗi lần bạn mở một phiên mới, agent bắt đầu với ngữ cảnh trống rỗng. Chúng không ghi nhớ lịch sử cuộc hội thoại trước đó, không lưu trữ thông tin về quyết định kỹ thuật đã đưa ra, và đặc biệt không hiểu được mối quan hệ giữa các phần khác nhau của mã nguồn vượt ra khỏi ngữ cảnh hiện tại.

agentmemory khắc phục điều này bằng cách cung cấp một lớp bộ nhớ bền vững nằm ngoài session của agent. Mọi thông tin — từ câu lệnh terminal đã chạy, đến đoạn mã đã sửa đổi, đến các quyết định kiến trúc đã thảo luận — đều được ghi lại, tổ chức và sẵn sàng cho lần truy xuất tiếp theo.

2. Mô hình bốn tầng củng cố bộ nhớ (Four-Tier Memory Consolidation)

Lấy cảm hứng từ cách hoạt động của não bộ con người, agentmemory áp dụng quy trình chuyển đổi bộ nhớ thành bốn giai đoạn liên tiếp:

Bộ nhớ làm việc (Working Memory): Ghi nhận ngay lập tức tất cả sự kiện từ session của coding agent — file đọc, file viết, lệnh thực thi, lỗi gặp phải. Đây là lớp dữ liệu thô, được giữ tạm thời.
Bộ nhớepisodic (Episodic Memory): Sau khi xử lý, các sự kiện liên quan được nhóm lại thành các chuỗi sự kiện có ý nghĩa — ví dụ: “ngày hôm qua tôi đã refactor module X, gặp lỗi Y ở dòng Z, và khắc phục bằng cách W”.
Bộ nhớ ngữ nghĩa (Semantic Memory): Từ các sự kiện episodic, agentmemory trích xuất tri thức trừu tượng hơn — quan hệ giữa các module, quy ước đặt tên, mô hình thiết kế đã được áp dụng, phạm vi của các thư viện bên ngoài đang dùng.
Bộ nhớ thủ tục (Procedural Memory): Tầng cuối cùng là các quy tắc, thói quen và phương pháp tối ưu — những điều agent đã “học được” qua nhiều phiên: cách di chuyển thư mục an toàn, những lỗi phổ biến cần tránh, pattern nào nên tái sử dụng.

Sự phân tầng này đảm bảo rằng tri thức quý giá được bảo tồn và dễ dàng truy xuất khi cần, thay vì bị lãng quên sau mỗi session.

3. Tìm kiếm đa luồng (Triple-Stream Search)

Một tính năng kỹ thuật nổi bật của agentmemory là cơ chế tìm kiếm kết hợp ba phương pháp:

Tìm kiếm văn bản全文 (BM25): Truy xuất nhanh dựa trên khớp từ khóa và tần suất xuất hiện trong tài liệu. Hiệu quả cho các tìm kiếm trực tiếp như tên file, tên hàm.
Tìm kiếm vector (Vector Embedding): Sử dụng embedding để nắm bắt ý nghĩa ngữ cảnh. Khi bạn hỏi “đoạn mã xử lý thanh toán”, hệ thống hiểu intent dù không khớp chính xác từ “thanh toán” trong tài liệu.
Đồ thị tri thức (Knowledge Graph): Biểu diễn mối quan hệ giữa các thực thể — file nào import file nào, hàm nào gọi hàm nào, dependency giữa các package. Giúp trả lời các câu hỏi kiểu “module nào chịu trách nhiệm cho việc xác thực?”.

Ba kết quả tìm kiếm từ ba luồng riêng biệt được hợp nhất thông qua thuật toán Reciprocal Rank Fusion, tối ưu hóa điểm số để trả về kết quả tổng hợp tốt nhất. Chính sự kết hợp này tạo nên độ chính xác truy xuất vượt trội.

4. Hỗ trợ toàn bộ các AI coding agent phổ biến

agentmemory hoạt động như một lớp trung立的, tương thích với hầu hết mọi coding agent hàng đầu:

Claude Code
Cursor
Gemini CLI
Codex CLI
OpenCode
Cline
Goose
Kilo Code
Roo Code
Aider
Windsurf
Claude Desktop

Không matter bạn dùng công cụ nào, agentmemory đều có thể tích hợp và duy trì bộ nhớ xuyên suốt các nền tảng.

5. 51 MCP Tool cho thao tác bộ nhớ

Với danh sách gồm 51 MCP tool chuyên biệt cho các thao tác bộ nhớ, developers có đầy đủ công cụ để:

Lưu và truy xuất ký ức (memory entries)
Quản lý các episode và semantic data
Thao tác với knowledge graph
Tìm kiếm across tất cả các tầng bộ nhớ
Xem và replay session history
Quản lý cấu hình bộ nhớ

6. Tự lưu trữ, không phụ thuộc dịch vụ bên ngoài

agentmemory được thiết kế để tự host hoàn toàn. Cơ sở dữ liệu sử dụng SQLite nhẹ nhàng, và engine embedding sử dụng iii-engine. Không cần đăng ký dịch vụ cloud, không yêu cầu API key bên ngoài nào — mọi dữ liệu nằm trên máy của bạn.

Đối với embedding, agentmemory hỗ trợ model all-MiniLM-L6-v2 chạy offline, hoàn toàn miễn phí và không cần kết nối internet. Điều này phù hợp với các team có yêu cầu bảo mật cao về mã nguồn.

7. Giao diện xem trực tiếp

Mỗi instance agentmemory đi kèm real-time viewer tại localhost:3113, hiển thị toàn bộ dữ liệu bộ nhớ theo thời gian thực. Bạn có thể xem từng memory entry, kiểm tra知识 graph relationship, và duyệt qua các session history.

8. Tính năng Replay Session

Tính năng replay session cho phép xem lại toàn bộ quá trình làm việc của một session trước đó — từng file được đọc, từng lệnh được chạy, từng thay đổi được thực hiện. Đây là công cụ tuyệt vời để debug, review, hoặc đơn giản là回顾 lại những gì đã làm.

9. Bảo vệ quyền riêng tư

Trước khi bất kỳ dữ liệu nào được lưu trữ, agentmemory tự động lọc tất cả secrets và API keys. Đảm bảo rằng thông tin nhạy cảm không bao giờ chạm vào bộ nhớ hệ thống.

Hướng dẫn sử dụng

Cài đặt cơ bản

Để cài đặt agentmemory, bạn cần Node.js và npm (hoặc yarn/pnpm) đã được cấu hình. Chạy lệnh sau để install global:

npm install -g agentmemory

Hoặc nếu bạn muốn clone trực tiếp từ repository:

git clone https://github.com/rohitg00/agentmemory.git
cd agentmemory
npm install
npm run build
npm link

Cấu hình với Claude Code

Tạo file cấu hình .agentmemory/config.yaml:

database:
  driver: sqlite
  path: ~/.agentmemory/data.db

embedding:
  model: all-MiniLM-L6-v2
  local: true

session:
  max_entries: 10000
  consolidation_interval: 3600
  working_memory_ttl: 86400

search:
  fusion_algorithm: reciprocal_rank_fusion
  fallback_strategy: bm25_only
  top_k: 5

privacy:
  filter_secrets: true
  redact_patterns:
    - "AKIA[0-9A-Z]{16}"
    - "ghp_[a-zA-Z0-9]+"
    - "sk-[a-zA-Z0-9]+"
    - "\\$2[aby]\\$"

Kết nối với Claude Code bằng cách thêm MCP integration vào config:

claude mcp add agentmemory http://localhost:3113/mcp

Cấu hình với Cursor

Trong file settings của Cursor, thêm configuration để tích hợp agentmemory:

{
  "mcp": {
    "agentmemory": {
      "transport": "stdio",
      "command": "agentmemory",
      "args": ["serve"],
      "env": {
        "AGENTMEMORY_CONFIG": "~/.agentmemory/config.yaml"
      }
    }
  }
}

Sử dụng qua CLI

Sau khi cài đặt, bạn có thể tương tác với agentmemory trực tiếp từ terminal:

# Khởi tạo database mới
agentmemory init --project my-awesome-app

# Lưu một memory entry
agentmemory save --type episodic \
  --title "Refactor authentication module" \
  --content "Đã refactor module auth/src/auth.ts, thay thế JWT verify bằng library jsonwebtoken v9.x" \
  --files "src/auth.ts,package.json"

# Truy xuất memory liên quan
agentmemory search --query "xác thực jwt" --top-k 5

# Xem knowledge graph
agentmemory query-graph --entity auth --depth 2

# Replay session trước đó
agentmemory replay --session sess_20260509_001

Tích hợp với Docker

Nếu bạn prefer deployment qua Docker, agentmemory cung cấp official image:

docker run -d \
  --name agentmemory \
  -p 3113:3113 \
  -v ~/agentmemory-data:/data \
  -v ~/.agentmemory/config.yaml:/config/config.yaml:ro \
  ghcr.io/rohitg00/agentmemory:latest

Sau đó truy cập giao diện web tại http://localhost:3113.

Ví dụ: Tự động capture memory trong workflow hàng ngày

Giả sử bạn có một script bash tự động capture những thay đổi quan trọng:

#!/bin/bash
# auto-capture.sh — Tự động lưu memory sau mỗi push

TIMESTAMP=$(date +%Y%m%d_%H%M%S)
REPO_DIR="${PWD}"

# Capture git diff summary
DIFF_SUMMARY=$(git diff --cached --stat | head -20)

# Lưu vào agentmemory
agentmemory save \
  --type episodic \
  --title "Git commit -$TIMESTAMP" \
  --content "$DIFF_SUMMARY" \
  --repository "$REPO_DIR"

echo "✅ Memory captured: $TIMESTAMP"

Script này có thể được kích hoạt bởi pre-commit hook, giúp mọi thay đổi code được tự động ghi lại mà không cần can thiệp thủ công.

Trường hợp sử dụng thực tế

Case 1: Developer làm việc độc lập sau nhiều tuần nghỉ

Bạn rời project hai tuần để xử lý việc cá nhân. Trở lại, bạn không nhớ mình đã dừng ở đâu, module nào còn dang dở, hay những bug nào đang pending. Với agentmemory, chỉ cần mở localhost:3113 và tìm kiếm “task progress” — hệ thống trả về toàn bộ các task còn lại, các bug report đã tạo, và những thay đổi cuối cùng bạn đã commit. Không còn cần ngồi đọc lại toàn bộ commit history.

Case 2: Team nhỏ có nhiều thành viên chuyển đổi ngữ cảnh

Trong team ba người đang develop cùng lúc một ứng dụng, A làm phần backend, B lo frontend, C phụ trách deployment. Khi B chuyển sang fix bug liên quan đến endpoint /api/payments, agentmemory giúp AI agent của B ngay lập tức truy xuất tất cả các memory entries liên quan đến payments module — từ những PR trước đó, các issue báo cáo lỗi, đến các discussion trong session của A. Giảm thiểu sự chậm trễ do thiếu context-sharing.

Case 3: Audit và debug phức tạp

Khi cần debug một lỗi nghiêm trọng xảy ra production, agentmemory cho phép replay toàn bộ session của developer đã deploy phiên bản đó. Bạn có thể xem chính xác file nào đã bị thay đổi, tại sao thay đổi, và environment variables đang dùng. Thông tin hữu ích gấp bội so với việc chỉ nhìn vào diff của một commit duy nhất.

Case 4: Onboarding developer mới

Thay vì tốn cả tuần để developer mới đọc qua toàn bộ repository và cố gắng hiểu lịch sử thay đổi, bạn có thể export các memory entries từ agentmemory — cung cấp cái nhìn tóm tắt về những quyết định quan trọng đã được đưa ra, các pattern kiến trúc phổ biến, và những sai lầm thường gặp. Onboarding trở nên nhanh chóng và có cấu trúc.

So sánh với đối thủ cạnh tranh

agentmemory vs mem0

mem0 là một solution khá nổi tiếng cho persistent memory của AI agents. Tuy nhiên, mem0 chủ yếu tập trung vào conversational memory — ghi nhớ những gì user nói trong chat, chứ không chuyên sâu vào technical context của coding workflows.

agentmemory, mặt khác, được xây dựng từ gốc cho coding agents. Knowledge Graph của agentmemory biểu diễn explicit relationships giữa files, functions, và modules — điều mà mem0 chưa làm được. Về cost, mem0 yêu cầu dịch vụ cloud trả phí, trong khi agentmemory chạy hoàn toàn local-free.

Tiêu chí	agentmemory	mem0
Hosting	Self-hosted, local	Cloud-based
Chi phí	~$0 (local embedding)	Theo usage tier
Knowledge Graph	Có	Không
Triple-stream search	BM25 + Vector + KG	Chủ yếu vector
MCP integration	51 tools	Ít hơn
Độ chính xác R@5	95,2%	~86,2%
Privacy	Dữ liệu trên máy bạn	Dữ liệu qua cloud

agentmemory vs Letta

Letta là một project mã nguồn mở hướng đến agentic AI với memory mechanism, nhưng focus chính của họ là building fully autonomous agents chứ không phải augment coding experience. Letta có complexity cao hơn và đòi hỏi setup khá phức tạp.

agentmemory có phạm vi hẹp hơn nhưng sâu hơn — chỉ dành cho coding agents, với sự tinh chỉnh cao độ cho workflow lập trình cụ thể. Nếu bạn đang dùng Claude Code hay Cursor hàng ngày, agentmemory tích hợp mượt mà hơn hẳn.

Tiêu chí	agentmemory	Letta
Target audience	Coding developers	Autonomous agents
Setup complexity	Thấp (5 phút)	Cao (cần config phức tạp)
Supported agents	12+ coding tools	Limited integrations
Memory tiers	4 layers	Customizable but complex
Deployment	SQLite local	Requires external services

agentmemory vs CLAUDE.md

CLAUDE.md (hay các biến thể như .cursorrules) là file static chứa instructions để Claude/Cursor hiểu project của bạn. Ý tưởng tốt — ghi rõ rules, conventions, và guidelines vào một file text. Nhưng CLAUDE.md có ba hạn chế lớn:

Static: File không tự động cập nhật. Khi bạn thay đổi quy ước, bạn phải nhớ edit file. agentmemory tự động học và update memory entries.
One-direction: CLAUDE.md chỉ cung cấp information từ bạn → agent. agentmemory tạo vòng feedback hai chiều — agent cũng học và đóng góp ngược lại.
No search capability: CLAUDE.md là toàn bộ text bạn paste vào prompt. agentmemory cho phép tìm kiếm semantic, truy xuất có chọn lọc theo ngữ cảnh, và giảm token usage đáng kể.

Agentmemory không loại bỏ hoàn toàn vai trò của CLAUDE.md — thực tế, nhiều developer dùng kết hợp cả hai: CLAUDE.md cho high-level project rules cố định, và agentmemory cho dynamic, evolving knowledge.

Cách bắt đầu

Yêu cầu hệ thống

Node.js 18+ (hoặc Bun để tốc độ nhanh hơn)
Disk space tối thiểu 500MB cho database và embedded models
RAM ít nhất 2GB
Không yêu cầu kết nối internet khi sử dụng local embedding

Quick start trong 5 bước

Bước 1: Cài đặt

npm install -g agentmemory

Bước 2: Khởi tạo

mkdir ~/my-project
cd ~/my-project
agentmemory init --project my-project

Bước 3: Cấu hình embedding

Tạo file ~/.agentmemory/config.yaml như ví dụ trong phần hướng dẫn sử dụng ở trên. Để dùng local embedding hoàn toàn miễn phí, đảm bảo flag local: true được set.

Bước 4: Kết nối coding agent của bạn

Ví dụ với Cursor:

// .cursor/settings.json
{
  "mcp": {
    "agentmemory": {
      "transport": "stdio",
      "command": "agentmemory",
      "args": ["serve"]
    }
  }
}

Bước 5: Bắt đầu lưu memory

Mỗi khi bạn làm việc với Claude Code, Cursor, hoặc agent supported khác, agentmemory sẽ tự động capture và lưu các memory entries. Truy cập http://localhost:3113 để xem real-time dashboard.

Migrating từ các tool cũ

Nếu bạn đang dùng mem0, Letta, hoặc các solution tương tự, agentmemory cung cấp migration utility:

agentmemory migrate --from mem0 --source ~/.mem0/data

Migration process tự động convert các memory entries sang format four-tier của agentmemory, preserve các relationships đã được học, và re-index toàn bộ dataset.

Tối ưu performance

Tắt local embedding (local: false) nếu bạn có kết nối internet ổn định và muốn dùng remote embedding service cho accuracy cao hơn
Tăng max_entries trong config nếu làm project rất lớn (> 100.000 memory entries)
Điều chỉnh consolidation_interval thấp hơn nếu bạn muốn episodic data chuyển sang semantic nhanh hơn
Kích hoạt filter_secrets: true để bảo mật tối đa

Kết luận

agentmemory giải quyết một trong những vấn đề đau đớn nhất của AI coding agents hiện nay: sự forgetting lặp đi lặp lại giữa các session. Với mô hình bốn tầng bộ nhớ lấy cảm hứng từ não bộ, cơ chế tìm kiếm triple-stream tiên tiến, 51 MCP tools phong phú, và khả năng tích hợp rộng rãi với mọi coding agent phổ biến, agentmemory xứng đáng là tool bạn thử nghiệm.

Điểm cộng lớn nhất là tính chất self-hosted, zero external dependencies — dữ liệu của bạn stays local, chi phí có thể bằng 0 với local embedding, và privacy được đảm bảo tuyệt đối. Con số 95,2% R@5 trên LongMemEval-S cũng chứng tỏ đây không chỉ là project concept mà đã được validate bằng benchmark nghiêm túc.

Tại thời điểm version v0.9.5 được phát hành ngày 9 tháng 5 năm 2026, với hơn 3.700 stars trên GitHub và giấy phép Apache 2.0 thân thiện với thương mại, agentmemory đang là một trong những dự án open-source đáng chú ý nhất trong lĩnh vực AI developer tools.

Hãy bắt đầu dùng thử và cho AI coding agent của bạn đôi mắt remembers — bạn sẽ thấy hiệu suất tăng lên rõ rệt.

Đây là bài viết trong series tìm hiểu về các trending projects trên GitHub. Bài tiếng Anh cùng series: agentmemory: Persistent Memory Engine for AI Coding Agents

📦 GitHub repository: https://github.com/rohitg00/agentmemory

🔗 Các bài viết liên quan:

Giới thiệu dự án#

Tính năng cốt lõi chi tiết#

1. Giải quyết bài toán “bộ nhớ ngắn hạn” của AI coding agents#

2. Mô hình bốn tầng củng cố bộ nhớ (Four-Tier Memory Consolidation)#

3. Tìm kiếm đa luồng (Triple-Stream Search)#

4. Hỗ trợ toàn bộ các AI coding agent phổ biến#

5. 51 MCP Tool cho thao tác bộ nhớ#

6. Tự lưu trữ, không phụ thuộc dịch vụ bên ngoài#

7. Giao diện xem trực tiếp#

8. Tính năng Replay Session#

9. Bảo vệ quyền riêng tư#

Hướng dẫn sử dụng#

Cài đặt cơ bản#

Cấu hình với Claude Code#

Cấu hình với Cursor#

Sử dụng qua CLI#

Tích hợp với Docker#

Ví dụ: Tự động capture memory trong workflow hàng ngày#

Trường hợp sử dụng thực tế#

Case 1: Developer làm việc độc lập sau nhiều tuần nghỉ#

Case 2: Team nhỏ có nhiều thành viên chuyển đổi ngữ cảnh#

Case 3: Audit và debug phức tạp#

Case 4: Onboarding developer mới#

So sánh với đối thủ cạnh tranh#

agentmemory vs mem0#

agentmemory vs Letta#

agentmemory vs CLAUDE.md#

Cách bắt đầu#

Yêu cầu hệ thống#

Quick start trong 5 bước#

Migrating từ các tool cũ#

Tối ưu performance#

Kết luận#