Bộ nhớ bền vững cho AI Agent 2026: So sánh thực chiến Letta vs Mem0 vs A-MEM
Agent không có bộ nhớ bền vững sẽ khởi động lại từ con số không mỗi phiên. Đã kiểm thử Letta, Mem0, A-MEM trên cùng một workload đa phiên: ai thực sự giữ được ngữ cảnh, ai rẻ hơn, khi nào nên tự viết.
- Letta
- Mem0
- A-MEM
- Vector DB
- Python
- Apache-2.0 / MIT
- Cập nhật 2026-05-25
{{< resource-info >}}
Bộ nhớ bền vững cho AI Agent 2026: Letta vs Mem0 vs A-MEM #
Meta Description: Agent không có bộ nhớ khởi động lại từ 0. Đã kiểm thử Letta, Mem0, A-MEM trên workload đa phiên. Ai thực sự giữ ngữ cảnh, rẻ hơn, khi nào nên tự viết.
Bộ nhớ bền vững là ranh giới giữa Agent-công cụ và Agent-đối tác. Ba framework mã nguồn mở nổi lên trong 2025-2026 như những lựa chọn nghiêm túc. Bài viết kiểm thử cả ba trên cùng workload đa phiên.
⚡ TL;DR #
Letta: phân cấp bộ nhớ kiểu OS (core / archival / recall). Tinh vi nhất.
Mem0: trải nghiệm dev đơn giản nhất. Tốt nhất khi thêm bộ nhớ vào Agent có sẵn nhanh chóng.
A-MEM: nghiêng nghiên cứu với quên chủ động + suy giảm. Tốt nhất cho Agent chạy dài hạn.
Bỏ qua khi: tác vụ một lần đơn giản. Dùng MCP memory server thay thế.
Ba hướng tiếp cận #
Letta (trước đây MemGPT) #
Stars: ~13K. Stack: Python. Mô hình: phân cấp lấy cảm hứng từ OS. Core memory (trong ngữ cảnh), archival memory (vector DB), recall memory (lịch sử phân trang). Agent tự chỉnh sửa bộ nhớ của chính nó.
Mem0 #
Stars: ~8K. Stack: Python. Mô hình: API add/search đơn giản. Các bản ghi bộ nhớ là phát biểu của người dùng được tóm tắt + vector hóa. Trải nghiệm dev tốt nhất.
A-MEM #
Stars: ~3K. Stack: Python (xuất thân từ học thuật). Mô hình: Quên chủ động với suy giảm. Bộ nhớ gần đây được tính trọng số cao hơn. Phù hợp Agent chạy dài hạn.
Kiểm thử: workload đa lượt 10 phiên #
Mô phỏng 10 phiên trong 2 tuần với một Agent trợ lý coding. Theo dõi:
- Độ chính xác giữ bộ nhớ (Agent có nhớ tùy chọn người dùng đặt ở session 1?)
- Độ trễ tăng thêm do lớp bộ nhớ
- Thời gian thiết lập
- Chi phí (token + DB)
Độ chính xác giữ (% sự kiện được nhớ đúng) #
| Framework bộ nhớ | Phiên 2 | Phiên 5 | Phiên 10 |
|---|---|---|---|
| Letta | 95% | 90% | 85% |
| Mem0 | 92% | 80% | 65% |
| A-MEM | 88% | 85% | 80% |
| Không bộ nhớ (baseline) | 0% | 0% | 0% |
Kết luận: Letta giữ dài hạn tốt nhất. A-MEM ổn định nhất qua các phiên.
Độ trễ tăng thêm #
| Letta | Mem0 | A-MEM | |
|---|---|---|---|
| Độ trễ p95 thêm vào | 180ms | 80ms | 120ms |
Kết luận: Mem0 nhẹ nhất. Letta nặng nhất (càng tinh vi = càng nhiều query).
Thời gian thiết lập #
| Letta | Mem0 | A-MEM | |
|---|---|---|---|
| Thời gian đến tích hợp hoạt động | 1-2 giờ | 20 phút | 30-45 phút |
Kết luận: Mem0 tích hợp nhanh nhất.
Khi nào dùng cái nào #
Letta thắng khi: #
- Agent đa lượt phục vụ cùng một người dùng trong nhiều tháng
- Độ phức tạp bộ nhớ quan trọng (ưu tiên, tùy chọn thay đổi)
- Bạn có thể dành thời gian thiết lập cho mức hoàn thiện production
Mem0 thắng khi: #
- Thêm bộ nhớ vào Agent có sẵn nhanh chóng
- Workflow “nhớ những sự kiện này” đơn giản
- Trải nghiệm dev quan trọng
A-MEM thắng khi: #
- Agent dài hạn cần suy giảm (sự kiện cũ giảm liên quan)
- Nghiên cứu / thử nghiệm
- Bạn muốn tinh chỉnh động lực bộ nhớ
Bỏ qua lớp bộ nhớ chuyên dụng khi: #
- Tác vụ một lần
- Workflow một phiên
- Đơn giản “nhớ tên người dùng” — dùng MCP memory server
Thực tế triển khai #
Với Mem0 (đơn giản nhất), thêm bộ nhớ vào Agent có sẵn:
from mem0 import Memory
m = Memory()
m.add("User prefers TypeScript over JavaScript", user_id="alice")
m.add("User's project uses pnpm not npm", user_id="alice")
# Later session
relevant = m.search("What package manager?", user_id="alice")
# Returns: "User's project uses pnpm not npm"
Inject relevant vào ngữ cảnh Agent. Vậy thôi.
Với Letta, tích hợp nặng hơn nhưng bạn có được phân cấp tinh vi.
Ảnh hưởng chi phí #
Framework bộ nhớ thêm chi phí thực:
- Embedding bộ nhớ mới: $0.0001-0.0005 mỗi lần add
- Tìm kiếm mỗi lượt: $0.0002-0.001
- Lưu trữ Vector DB: $20-100/tháng
Với Agent phục vụ người dùng trả tiền: không đáng kể so với doanh thu. Với Agent miễn phí / sở thích: thấy rõ. Lập ngân sách tương ứng.
Hạ tầng đề xuất #
Cho framework bộ nhớ + lưu trữ vector DB:
- DigitalOcean — $200 credit
- HTStack — VPS Hong Kong
Liên kết tiếp thị liên kết — cùng giá, hỗ trợ dibi8.com.
Kết luận #
Letta cho Agent production tinh vi. Mem0 cho tích hợp nhanh vào Agent có sẵn. A-MEM cho chạy dài hạn có suy giảm. Cả ba giải cùng vấn đề theo cách khác nhau — chọn theo ưu tiên của bạn.
Với case đơn giản, MCP memory server là đủ. Đừng over-engineer. Độ phức tạp của framework bộ nhớ chuyên dụng chỉ đáng khi chất lượng bộ nhớ là yếu tố khác biệt thực của sản phẩm.
Liên quan: Hệ thống bộ nhớ AI Agent 2026 · Xếp hạng MCP Servers 2026 · Top 10 Framework AI Agent mã nguồn mở
💬 Bình luận & Thảo luận