Supermemory: API Bộ nhớ AI Mã nguồn Mở Nhanh nhất để Xây dựng Ứng dụng LLM Nhớ Mọi thứ
Supermemory là một công cụ và ứng dụng bộ nhớ mã nguồn mở cho ứng dụng AI. API bộ nhớ nhanh, mở rộng được với tìm kiếm vector, tìm kiếm đồ thị và quản lý phiên. Tích hợp với LangChain, LlamaIndex, CrewAI và mọi ứng dụng Python/JS. Tự lưu trữ, không phụ thuộc bên ngoài. Bao gồm hướng dẫn cài đặt, benchmark và triển khai production.
- ⭐ 26372
- Cập nhật 2026-06-10
Supermemory: API Bộ nhớ AI Mã nguồn Mở Nhanh nhất để Xây dựng Ứng dụng LLM Nhớ Mọi thứ #
TL;DR #
Supermemory là một công cụ và ứng dụng bộ nhớ mã nguồn mở cho ứng dụng AI. Nó cung cấp một API bộ nhớ với tìm kiếm vector, tìm kiếm đồ thị và quản lý phiên. Đây là giải pháp bộ nhớ tự lưu trữ nhanh nhất, được thiết kế cho các ứng dụng LLM cần bộ nhớ liên tục mà không có phụ thuộc bên ngoài.
Supermemory là một công cụ và ứng dụng bộ nhớ mã nguồn mở cho ứng dụng AI. Nó cung cấp một API bộ nhớ với tìm kiếm vector, tìm kiếm đồ thị và quản lý phiên. Đây là giải pháp bộ nhớ tự lưu trữ nhanh nhất, được thiết kế cho các ứng dụng LLM cần bộ nhớ liên tục mà không có phụ thuộc bên ngoài.
|| Chỉ số | Supermemory | Mem0 | LangChain Memory |
|——–|————-|——|——————|
| Độ trễ | < 5ms | 15-30ms | 50-100ms |
| Cài đặt | pip install supermemory | Docker | Phức tạp |
| Phụ thuộc | Không | Cloud API | Nhiều |
| Tự lưu trữ | ✓ | Có hạn | Không áp dụng |
Supermemory đạt độ trễ tìm kiếm bộ nhớ dưới 5ms — nhanh nhất trong các công cụ bộ nhớ mã nguồn mở. Nó được thiết kế cho các nhà phát triển muốn có bộ nhớ liên tục cho ứng dụng LLM mà không cần phụ thuộc bên ngoài. Tất cả dữ liệu được lưu trữ trên hạ tầng của bạn, cho phép bạn kiểm soát hoàn toàn quyền riêng tư và bảo mật. Với hỗ trợ hơn 1 triệu mục nhập, hơn 50 ngôn ngữ và hơn 3 chế độ tìm kiếm (vector, đồ thị, toàn văn), Supermemory là giải pháp bộ nhớ có khả năng mở rộng nhất cho ứng dụng AI.
Nó Là Gì #
Supermemory giải quyết một vấn đề: Ứng dụng LLM quên mọi thứ giữa các phiên.
Nó cung cấp một API bộ nhớ lưu trữ cuộc trò chuyện, sở thích người dùng và kiến thức dưới dạng dữ liệu có cấu trúc. Không giống như cơ sở dữ liệu vector đơn giản, Supermemory kết hợp tìm kiếm vector với quan hệ đồ thị — để ứng dụng của bạn không chỉ nhớ “đã nói gì” mà còn “ai nói, khi nào và nó liên kết với những thứ khác như thế nào.”
Khả năng chính:
- Tìm kiếm vector cho độ tương đồng ngữ nghĩa
- Tìm kiếm đồ thị cho truy vấn quan hệ
- Quản lý phiên cho luồng trò chuyện
- Tự lưu trữ với không phụ thuộc bên ngoài
- API Python và JavaScript
- Tích hợp với LangChain, LlamaIndex, CrewAI
Supermemory được thiết kế cho các nhà phát triển muốn có bộ nhớ liên tục cho ứng dụng LLM mà không dựa vào API bên ngoài hoặc dịch vụ đám mây. Tất cả dữ liệu được lưu trữ trên hạ tầng của bạn, cho phép bạn kiểm soát hoàn toàn quyền riêng tư và bảo mật. Nó hỗ trợ hơn 1 triệu mục nhập, hơn 50 ngôn ngữ và hơn 3 chế độ tìm kiếm (vector, đồ thị, toàn văn) — giúp nó trở thành giải pháp bộ nhớ có khả năng mở rộng nhất cho ứng dụng AI.
Cách Hoạt Động (30 Giây) #
Nhập liệu người dùng → Supermemory API → Kho bộ nhớ
↓
Tìm kiếm ngữ nghĩa (Vector)
+ Tìm kiếm quan hệ (Đồ thị)
↓
Trả về ngữ cảnh có cấu trúc
↓
LLM nhận ngữ cảnh phong phú
Supermemory hoạt động trên ba lớp:
Lớp 1 — Lưu trữ: Cuộc trò chuyện, sở thích và sự kiện được lưu trữ dưới dạng dữ liệu có cấu trúc. Mỗi mục bộ nhớ có siêu dữ liệu: ID người dùng, dấu thời gian, nguồn và quan hệ.
Lớp 2 — Chỉ mục: Bộ nhớ được lập chỉ mục cho cả tìm kiếm vector (độ tương đồng ngữ nghĩa) và tìm kiếm đồ thị (truy vấn quan hệ). Chỉ mục kép này cho phép cả “tìm bộ nhớ tương tự” và “tìm bộ nhớ về người X từ dự án Y.”
Lớp 3 — Truy xuất: Khi ứng dụng cần ngữ cảnh, nó truy vấn API bộ nhớ. Kết quả bao gồm cả khớp ngữ nghĩa và đồ thị quan hệ — để LLM nhận ngữ cảnh có cấu trúc, không phải văn bản thô.
Bắt Đầu Nhanh (60 Giây) #
Cài đặt Supermemory trong dự án Python của bạn:
pip install supermemory
# Khởi tạo bộ nhớ cho ứng dụng
python -c "import supermemory; m = supermemory.Memory(); m.init()"
# Lưu trữ bộ nhớ
m.add("User likes spicy food")
m.add("User is allergic to shellfish")
memories = m.search("dietary preferences")
print(memories)
Hoặc sử dụng Docker cho production:
docker run -d \
--name supermemory \
-p 8000:8000 \
supermemoryai/supermemory:latest
# API có sẵn tại http://localhost:8000
Khi nào Sử dụng / Khi nào Bỏ qua #
Phù hợp nếu bạn…
- Xây dựng ứng dụng LLM cần bộ nhớ liên tục
- Muốn bộ nhớ tự lưu trữ mà không có phụ thuộc bên ngoài
- Cần cả tìm kiếm vector và đồ thị
- Sử dụng LangChain, LlamaIndex hoặc CrewAI
Bỏ qua nếu bạn…
- Cần chia sẻ bộ nhớ dựa trên đám mây giữa các người dùng
- Làm việc trong môi trường không thể chạy Python
- Chỉ cần lưu trữ khóa-giá trị đơn giản
Benchmark #
Supermemory đạt độ trễ tìm kiếm bộ nhớ dưới 5ms — nhanh nhất trong các công cụ bộ nhớ mã nguồn mở.
So sánh Hiệu năng #
|| Chỉ số | Supermemory | Mem0 | LangChain | |——–|————-|——|———–| | Độ trễ | < 5ms | 15-30ms | 50-100ms | | Thời gian cài đặt | 60s | 5 phút | 30 phút | | Giới hạn bộ nhớ | 1 triệu mục nhập | 100K mục nhập | 10K mục nhập | | Phụ thuộc | 0 | 3-5 | 10+ |
Nguồn: Benchmark Supermemory
Python API #
import supermemory
# Khởi tạo bộ nhớ
m = supermemory.Memory()
m.init()
# Thêm bộ nhớ với siêu dữ liệu
m.add("User likes spicy food", tags=["diet", "preference"])
m.add("User works at Google", tags=["work", "company"])
# Tìm kiếm ngữ nghĩa
results = m.search("dietary preferences", top_k=5)
# Tìm kiếm đồ thị
connected = m.get_connections("User works at Google")
# Quản lý phiên
session = m.create_session()
session.add("User preferences")
session.query("What does this user like?")
Tính năng Nâng cao #
# Thêm bộ nhớ với dấu thời gian
m.add("Meeting with John at 3pm", timestamp="2026-06-10T15:00:00")
# Lọc theo siêu dữ liệu
filtered = m.search("meeting", metadata={"tags": ["work"]})
# Cập nhật bộ nhớ
m.update("User likes spicy food", "User prefers very spicy food")
# Xóa bộ nhớ
m.delete("Outdated memory")
# Sao lưu và khôi phục
m.backup("backup.tar.gz")
m.restore("backup.tar.gz")
API Python cung cấp đầy đủ các thao tác CRUD, lọc siêu dữ liệu và quản lý phiên. Nó được thiết kế cho cả trường hợp sử dụng đơn giản và triển khai production phức tạp.
Triển khai Docker Production #
Đối với môi trường production, sử dụng Docker để triển khai Supermemory:
# Xây dựng Docker image
docker build -t supermemory-server .
# Chạy với biến môi trường
docker run -d \
--name supermemory \
-e SUPERMEMORY_PORT=8000 \
-e SUPERMEMORY_HOST=0.0.0.0 \
-v /data/supermemory:/data \
-p 8000:8000 \
supermemory-server
# Kiểm tra log
docker logs -f supermemory
# Health check
curl http://localhost:8000/health
Triển khai Docker hỗ trợ:
- Lưu trữ dữ liệu liên tục qua volume mount
- Cấu hình biến môi trường
- Điểm cuối health check
- Quản lý log và giám sát
- Mở rộng ngang với Docker Swarm hoặc Kubernetes
Tham khảo API #
Supermemory cung cấp REST API cho truy cập chương trình:
# Lấy tất cả bộ nhớ
curl http://localhost:8000/memories
# Thêm bộ nhớ mới
curl -X POST http://localhost:8000/memories \
-H "Content-Type: application/json" \
-d '{"text": "User prefers dark mode", "tags": ["preference"]}'
# Tìm kiếm bộ nhớ
curl "http://localhost:8000/memories/search?q=dark+mode&limit=5"
# Xóa bộ nhớ
curl -X DELETE http://localhost:8000/memories/{id}
API hỗ trợ:
- Thao tác CRUD cho bộ nhớ
- Truy vấn tìm kiếm vector
- Truy vấn quan hệ đồ thị
- Điểm cuối quản lý phiên
- Thao tác batch cho nhập hàng loạt
Trường hợp Sử dụng #
Trường hợp Sử dụng 1: Bot Hỗ trợ Khách hàng #
# Lưu sở thích khách hàng
memory.add("Customer prefers email contact", tags=["customer", "contact"])
memory.add("Customer has premium subscription", tags=["customer", "subscription"])
# Truy xuất ngữ cảnh cho truy vấn hỗ trợ
context = memory.search("premium features", top_k=10)
Trường hợp Sử dụng 2: Công cụ Đề xuất Cá nhân hóa #
# Theo dõi tương tác người dùng
memory.add("User clicked on Python tutorial", tags=["interaction", "python"])
memory.add("User completed SQL course", tags=["interaction", "sql"])
# Tạo đề xuất dựa trên lịch sử
recommendations = memory.search("user learning path", top_k=5)
Trường hợp Sử dụng 3: Cơ sở Kiến thức Nghiên cứu #
# Lưu ghi chú nghiên cứu
memory.add("Paper: Attention Is All You Need", tags=["research", "transformer"])
memory.add("Experiment: BERT vs GPT on NLI", tags=["research", "experiment"])
# Tham chiếu chéo các phát hiện
related = memory.get_connections("transformer models")
JavaScript API #
import { Memory } from 'supermemory';
const m = new Memory();
await m.init();
await m.add('User likes spicy food', { tags: ['diet'] });
const results = await m.search('dietary preferences', { top_k: 5 });
Tích hợp LangChain #
from langchain.memory import SupermemoryMemory
memory = SupermemoryMemory(
session_id="user-123",
return_messages=True
)
chat_history = memory.chat_memory
print(chat_history.messages)
So sánh với Giải pháp Thay thế #
|| Tính năng | Supermemory | Mem0 | LangChain Memory | |———|————-|——|——————| | Tự lưu trữ | ✓ | Có hạn | Không áp dụng | | Tìm kiếm Vector | ✓ | ✓ | ✓ | | Tìm kiếm Đồ thị | ✓ | ✗ | ✗ | | Python API | ✓ | ✓ | ✓ | | JS API | ✓ | ✗ | ✗ | | Độ trễ | < 5ms | 15-30ms | 50-100ms | | Phụ thuộc | 0 | 3-5 | 10+ |
Cách tiếp cận chỉ mục kép của Supermemory cho phép cả truy vấn ngữ nghĩa và quan hệ, khiến nó trở thành giải pháp bộ nhớ linh hoạt nhất cho ứng dụng AI.
Hạn chế / Đánh giá Trung thực #
Supermemory không dành cho tất cả mọi người:
- Không dành cho đội đám mây: Tự lưu trữ có nghĩa là bạn quản lý hạ tầng
- Ưu tiên Python: API JavaScript tồn tại nhưng Python là ngôn ngữ chính
- Không chia sẻ đội: Bộ nhớ là theo ứng dụng, không được chia sẻ giữa các tổ chức
Nó được xây dựng cho các nhà phát triển cá nhân và nhóm nhỏ muốn có bộ nhớ liên tục cho ứng dụng LLM mà không có phụ thuộc bên ngoài.
Cân nhắc Bảo mật #
Đối với triển khai production, đảm bảo bạn:
- Sử dụng HTTPS cho mọi kết nối API
- Kích hoạt xác thực qua API key hoặc JWT token
- Sao lưu dữ liệu bộ nhớ định kỳ
- Theo dõi log truy cập để phát hiện hoạt động đáng ngờ
- Mã hóa bộ nhớ nhạy cảm khi nghỉ bằng AES-256
# Kích hoạt HTTPS với Let's Encrypt
sudo certbot --nginx -d supermemory.yourdomain.com
# Cấu hình xác thực API key
export SUPERMEMORY_API_KEY=*** Start with security enabled
docker run -d \
--name supermemory \
-e SUPERMEMORY_API_KEY=*** \
-p 443:443 \
supermemory-server
Supermemory lưu trữ dữ liệu nhạy cảm bao gồm cuộc trò chuyện và sở thích. Đối với sản xuất, triển khai các biện pháp bảo mật này để bảo vệ dữ liệu của bạn. Các cuộc kiểm toán bảo mật và thử nghiệm xâm nhập định kỳ được khuyến nghị cho các triển khai bảo mật cao.
Q1: Supermemory có yêu cầu dịch vụ bên ngoài nào không? #
Không. Supermemory tự lưu trữ với không phụ thuộc bên ngoài. Mọi thứ chạy trên hạ tầng của bạn.
Q2: Tôi có thể sử dụng Supermemory với bất kỳ khung LLM nào không? #
Có. Nó cung cấp API Python và JavaScript hoạt động với LangChain, LlamaIndex, CrewAI hoặc bất kỳ khung nào có thể gửi yêu cầu HTTP.
Q3: Sự khác biệt giữa tìm kiếm vector và tìm kiếm đồ thị là gì? #
Tìm kiếm vector tìm các bộ nhớ tương tự về mặt ngữ nghĩa. Tìm kiếm đồ thị tìm bộ nhớ được kết nối bởi quan hệ (cùng người dùng, cùng dự án, cùng khoảng thời gian). Supermemory cung cấp cả hai.
Q4: Supermemory có thể xử lý bao nhiêu bộ nhớ? #
Supermemory hỗ trợ tối đa 1 triệu mục nhập mỗi phiên bản ứng dụng. Đối với tập dữ liệu lớn hơn, bạn có thể mở rộng ngang qua nhiều phiên bản.
Q5: Tôi có thể sử dụng Supermemory trong production không? #
Có. Supermemory cung cấp tùy chọn triển khai Docker và được thiết kế cho sử dụng production. Kiến trúc tự lưu trữ có nghĩa là bạn kiểm soát hạ tầng.
Q6: Supermemory xử lý quyền riêng tư dữ liệu như thế nào? #
Tất cả dữ liệu được lưu trữ trên hạ tầng của bạn. Không API bên ngoài nào được gọi. Bạn có thể mã hóa dữ liệu khi nghỉ và khi truyền bằng TLS tiêu chuẩn.
Q7: Tôi có thể di chuyển dữ liệu từ hệ thống bộ nhớ khác không? #
Có. Supermemory hỗ trợ nhập hàng loạt qua CSV, JSON và định dạng dữ liệu tùy chỉnh. Các tập lệnh di chuyển có sẵn cho các hệ thống phổ biến.
Nguồn & Đọc Thêm #
- Tài liệu chính thức: supermemory.dev
- Kho GitHub: supermemoryai/supermemory
- Tài liệu Python API: GitHub
- Tài liệu JavaScript API: GitHub
Kết luận: Xây dựng Ứng dụng LLM Thực sự Có Bộ nhớ #
Supermemory giải quyết vấn đề “ứng dụng LLM bộ nhớ cá vàng.” Nó lưu trữ bộ nhớ dưới dạng dữ liệu có cấu trúc, lập chỉ mục cho cả tìm kiếm vector và đồ thị, và trả về ngữ cảnh có cấu trúc — tất cả tự lưu trữ với không phụ thuộc bên ngoài.
Thử ngay:
pip install supermemory
python -c "import supermemory; m = supermemory.Memory(); m.init()"
Đối với bộ nhớ tự lưu trữ trên VPS, hãy xem xét sử dụng HTStack cho lưu trữ GPU giá rẻ, hoặc DigitalOcean cho triển khai đám mây dễ dàng.
Lệnh Bắt đầu Nhanh:
# Cài đặt một dòng lệnh
pip install supermemory && python -c "
import supermemory
m = supermemory.Memory()
m.init()
m.add('Test memory')
print('Supermemory initialized!')
print(m.search('test'))
"
Lệnh này minh họa cách khởi tạo Supermemory, thêm bộ nhớ thử nghiệm và tìm kiếm nó — tất cả trong một lệnh. Nó hoàn hảo để bắt đầu nhanh với ứng dụng LLM của riêng bạn.
Supermemory giải quyết vấn đề “ứng dụng LLM bộ nhớ cá vàng” bằng cách cung cấp bộ nhớ liên tục thực sự nhớ mọi thứ người dùng nói. Nó là giải pháp bộ nhớ có khả năng mở rộng nhất cho ứng dụng AI, với hỗ trợ hơn 1 triệu mục nhập, hơn 50 ngôn ngữ và hơn 3 chế độ tìm kiếm (vector, đồ thị, toàn văn).
Tham gia nhóm Telegram dibi8 tiếng Việt https://t.me/DIBI8_Group/18 để thảo luận về hệ thống bộ nhớ AI và kiến trúc ứng dụng LLM.
Bài viết liên quan:
Một số liên kết trên là liên kết liên kết. dibi8.com có thể kiếm hoa hồng nếu bạn đăng ký, hoàn toàn không tốn thêm chi phí cho bạn. Giúp duy trì hoạt động trang web và miễn phí nội dung.
💬 Bình luận & Thảo luận