Supermemory: API Bộ nhớ AI Mã nguồn Mở Nhanh nhất để Xây dựng Ứng dụng LLM Nhớ Mọi thứ

Supermemory là một công cụ và ứng dụng bộ nhớ mã nguồn mở cho ứng dụng AI. API bộ nhớ nhanh, mở rộng được với tìm kiếm vector, tìm kiếm đồ thị và quản lý phiên. Tích hợp với LangChain, LlamaIndex, CrewAI và mọi ứng dụng Python/JS. Tự lưu trữ, không phụ thuộc bên ngoài. Bao gồm hướng dẫn cài đặt, benchmark và triển khai production.

⭐ 26372
Cập nhật 2026-06-10

Supermemory: API Bộ nhớ AI Mã nguồn Mở Nhanh nhất để Xây dựng Ứng dụng LLM Nhớ Mọi thứ #

TL;DR #

Supermemory là một công cụ và ứng dụng bộ nhớ mã nguồn mở cho ứng dụng AI. Nó cung cấp một API bộ nhớ với tìm kiếm vector, tìm kiếm đồ thị và quản lý phiên. Đây là giải pháp bộ nhớ tự lưu trữ nhanh nhất, được thiết kế cho các ứng dụng LLM cần bộ nhớ liên tục mà không có phụ thuộc bên ngoài.

|| Chỉ số | Supermemory | Mem0 | LangChain Memory | |——–|————-|——|——————| | Độ trễ | < 5ms | 15-30ms | 50-100ms | | Cài đặt | pip install supermemory | Docker | Phức tạp | | Phụ thuộc | Không | Cloud API | Nhiều | | Tự lưu trữ | ✓ | Có hạn | Không áp dụng |

Supermemory đạt độ trễ tìm kiếm bộ nhớ dưới 5ms — nhanh nhất trong các công cụ bộ nhớ mã nguồn mở. Nó được thiết kế cho các nhà phát triển muốn có bộ nhớ liên tục cho ứng dụng LLM mà không cần phụ thuộc bên ngoài. Tất cả dữ liệu được lưu trữ trên hạ tầng của bạn, cho phép bạn kiểm soát hoàn toàn quyền riêng tư và bảo mật. Với hỗ trợ hơn 1 triệu mục nhập, hơn 50 ngôn ngữ và hơn 3 chế độ tìm kiếm (vector, đồ thị, toàn văn), Supermemory là giải pháp bộ nhớ có khả năng mở rộng nhất cho ứng dụng AI.

Nó Là Gì #

Supermemory giải quyết một vấn đề: Ứng dụng LLM quên mọi thứ giữa các phiên.

Nó cung cấp một API bộ nhớ lưu trữ cuộc trò chuyện, sở thích người dùng và kiến thức dưới dạng dữ liệu có cấu trúc. Không giống như cơ sở dữ liệu vector đơn giản, Supermemory kết hợp tìm kiếm vector với quan hệ đồ thị — để ứng dụng của bạn không chỉ nhớ “đã nói gì” mà còn “ai nói, khi nào và nó liên kết với những thứ khác như thế nào.”

Khả năng chính:

Tìm kiếm vector cho độ tương đồng ngữ nghĩa
Tìm kiếm đồ thị cho truy vấn quan hệ
Quản lý phiên cho luồng trò chuyện
Tự lưu trữ với không phụ thuộc bên ngoài
API Python và JavaScript
Tích hợp với LangChain, LlamaIndex, CrewAI

Supermemory được thiết kế cho các nhà phát triển muốn có bộ nhớ liên tục cho ứng dụng LLM mà không dựa vào API bên ngoài hoặc dịch vụ đám mây. Tất cả dữ liệu được lưu trữ trên hạ tầng của bạn, cho phép bạn kiểm soát hoàn toàn quyền riêng tư và bảo mật. Nó hỗ trợ hơn 1 triệu mục nhập, hơn 50 ngôn ngữ và hơn 3 chế độ tìm kiếm (vector, đồ thị, toàn văn) — giúp nó trở thành giải pháp bộ nhớ có khả năng mở rộng nhất cho ứng dụng AI.

Cách Hoạt Động (30 Giây) #

Nhập liệu người dùng → Supermemory API → Kho bộ nhớ
                               ↓
                Tìm kiếm ngữ nghĩa (Vector)
                + Tìm kiếm quan hệ (Đồ thị)
                               ↓
                Trả về ngữ cảnh có cấu trúc
                               ↓
                LLM nhận ngữ cảnh phong phú

Supermemory hoạt động trên ba lớp:

Lớp 1 — Lưu trữ: Cuộc trò chuyện, sở thích và sự kiện được lưu trữ dưới dạng dữ liệu có cấu trúc. Mỗi mục bộ nhớ có siêu dữ liệu: ID người dùng, dấu thời gian, nguồn và quan hệ.

Lớp 2 — Chỉ mục: Bộ nhớ được lập chỉ mục cho cả tìm kiếm vector (độ tương đồng ngữ nghĩa) và tìm kiếm đồ thị (truy vấn quan hệ). Chỉ mục kép này cho phép cả “tìm bộ nhớ tương tự” và “tìm bộ nhớ về người X từ dự án Y.”

Lớp 3 — Truy xuất: Khi ứng dụng cần ngữ cảnh, nó truy vấn API bộ nhớ. Kết quả bao gồm cả khớp ngữ nghĩa và đồ thị quan hệ — để LLM nhận ngữ cảnh có cấu trúc, không phải văn bản thô.

Bắt Đầu Nhanh (60 Giây) #

Cài đặt Supermemory trong dự án Python của bạn:

pip install supermemory

# Khởi tạo bộ nhớ cho ứng dụng
python -c "import supermemory; m = supermemory.Memory(); m.init()"

# Lưu trữ bộ nhớ
m.add("User likes spicy food")
m.add("User is allergic to shellfish")

memories = m.search("dietary preferences")
print(memories)

Hoặc sử dụng Docker cho production:

docker run -d \
  --name supermemory \
  -p 8000:8000 \
  supermemoryai/supermemory:latest

# API có sẵn tại http://localhost:8000

Khi nào Sử dụng / Khi nào Bỏ qua #

Phù hợp nếu bạn…

Xây dựng ứng dụng LLM cần bộ nhớ liên tục
Muốn bộ nhớ tự lưu trữ mà không có phụ thuộc bên ngoài
Cần cả tìm kiếm vector và đồ thị
Sử dụng LangChain, LlamaIndex hoặc CrewAI

Bỏ qua nếu bạn…

Cần chia sẻ bộ nhớ dựa trên đám mây giữa các người dùng
Làm việc trong môi trường không thể chạy Python
Chỉ cần lưu trữ khóa-giá trị đơn giản

Benchmark #

Supermemory đạt độ trễ tìm kiếm bộ nhớ dưới 5ms — nhanh nhất trong các công cụ bộ nhớ mã nguồn mở.

So sánh Hiệu năng #

|| Chỉ số | Supermemory | Mem0 | LangChain | |——–|————-|——|———–| | Độ trễ | < 5ms | 15-30ms | 50-100ms | | Thời gian cài đặt | 60s | 5 phút | 30 phút | | Giới hạn bộ nhớ | 1 triệu mục nhập | 100K mục nhập | 10K mục nhập | | Phụ thuộc | 0 | 3-5 | 10+ |

Nguồn: Benchmark Supermemory

Python API #

import supermemory

# Khởi tạo bộ nhớ
m = supermemory.Memory()
m.init()

# Thêm bộ nhớ với siêu dữ liệu
m.add("User likes spicy food", tags=["diet", "preference"])
m.add("User works at Google", tags=["work", "company"])

# Tìm kiếm ngữ nghĩa
results = m.search("dietary preferences", top_k=5)

# Tìm kiếm đồ thị
connected = m.get_connections("User works at Google")

# Quản lý phiên
session = m.create_session()
session.add("User preferences")
session.query("What does this user like?")

Tính năng Nâng cao #

# Thêm bộ nhớ với dấu thời gian
m.add("Meeting with John at 3pm", timestamp="2026-06-10T15:00:00")

# Lọc theo siêu dữ liệu
filtered = m.search("meeting", metadata={"tags": ["work"]})

# Cập nhật bộ nhớ
m.update("User likes spicy food", "User prefers very spicy food")

# Xóa bộ nhớ
m.delete("Outdated memory")

# Sao lưu và khôi phục
m.backup("backup.tar.gz")
m.restore("backup.tar.gz")

API Python cung cấp đầy đủ các thao tác CRUD, lọc siêu dữ liệu và quản lý phiên. Nó được thiết kế cho cả trường hợp sử dụng đơn giản và triển khai production phức tạp.

Triển khai Docker Production #

Đối với môi trường production, sử dụng Docker để triển khai Supermemory:

# Xây dựng Docker image
docker build -t supermemory-server .

# Chạy với biến môi trường
docker run -d \
  --name supermemory \
  -e SUPERMEMORY_PORT=8000 \
  -e SUPERMEMORY_HOST=0.0.0.0 \
  -v /data/supermemory:/data \
  -p 8000:8000 \
  supermemory-server

# Kiểm tra log
docker logs -f supermemory

# Health check
curl http://localhost:8000/health

Triển khai Docker hỗ trợ:

Lưu trữ dữ liệu liên tục qua volume mount
Cấu hình biến môi trường
Điểm cuối health check
Quản lý log và giám sát
Mở rộng ngang với Docker Swarm hoặc Kubernetes

Tham khảo API #

Supermemory cung cấp REST API cho truy cập chương trình:

# Lấy tất cả bộ nhớ
curl http://localhost:8000/memories

# Thêm bộ nhớ mới
curl -X POST http://localhost:8000/memories \
  -H "Content-Type: application/json" \
  -d '{"text": "User prefers dark mode", "tags": ["preference"]}'

# Tìm kiếm bộ nhớ
curl "http://localhost:8000/memories/search?q=dark+mode&limit=5"

# Xóa bộ nhớ
curl -X DELETE http://localhost:8000/memories/{id}

API hỗ trợ:

Thao tác CRUD cho bộ nhớ
Truy vấn tìm kiếm vector
Truy vấn quan hệ đồ thị
Điểm cuối quản lý phiên
Thao tác batch cho nhập hàng loạt

Trường hợp Sử dụng #

Trường hợp Sử dụng 1: Bot Hỗ trợ Khách hàng #

# Lưu sở thích khách hàng
memory.add("Customer prefers email contact", tags=["customer", "contact"])
memory.add("Customer has premium subscription", tags=["customer", "subscription"])

# Truy xuất ngữ cảnh cho truy vấn hỗ trợ
context = memory.search("premium features", top_k=10)

Trường hợp Sử dụng 2: Công cụ Đề xuất Cá nhân hóa #

# Theo dõi tương tác người dùng
memory.add("User clicked on Python tutorial", tags=["interaction", "python"])
memory.add("User completed SQL course", tags=["interaction", "sql"])

# Tạo đề xuất dựa trên lịch sử
recommendations = memory.search("user learning path", top_k=5)

Trường hợp Sử dụng 3: Cơ sở Kiến thức Nghiên cứu #

# Lưu ghi chú nghiên cứu
memory.add("Paper: Attention Is All You Need", tags=["research", "transformer"])
memory.add("Experiment: BERT vs GPT on NLI", tags=["research", "experiment"])

# Tham chiếu chéo các phát hiện
related = memory.get_connections("transformer models")

JavaScript API #

import { Memory } from 'supermemory';

const m = new Memory();
await m.init();

await m.add('User likes spicy food', { tags: ['diet'] });
const results = await m.search('dietary preferences', { top_k: 5 });

Tích hợp LangChain #

from langchain.memory import SupermemoryMemory

memory = SupermemoryMemory(
    session_id="user-123",
    return_messages=True
)

chat_history = memory.chat_memory
print(chat_history.messages)

So sánh với Giải pháp Thay thế #

|| Tính năng | Supermemory | Mem0 | LangChain Memory | |———|————-|——|——————| | Tự lưu trữ | ✓ | Có hạn | Không áp dụng | | Tìm kiếm Vector | ✓ | ✓ | ✓ | | Tìm kiếm Đồ thị | ✓ | ✗ | ✗ | | Python API | ✓ | ✓ | ✓ | | JS API | ✓ | ✗ | ✗ | | Độ trễ | < 5ms | 15-30ms | 50-100ms | | Phụ thuộc | 0 | 3-5 | 10+ |

Cách tiếp cận chỉ mục kép của Supermemory cho phép cả truy vấn ngữ nghĩa và quan hệ, khiến nó trở thành giải pháp bộ nhớ linh hoạt nhất cho ứng dụng AI.

Hạn chế / Đánh giá Trung thực #

Supermemory không dành cho tất cả mọi người:

Không dành cho đội đám mây: Tự lưu trữ có nghĩa là bạn quản lý hạ tầng
Ưu tiên Python: API JavaScript tồn tại nhưng Python là ngôn ngữ chính
Không chia sẻ đội: Bộ nhớ là theo ứng dụng, không được chia sẻ giữa các tổ chức

Nó được xây dựng cho các nhà phát triển cá nhân và nhóm nhỏ muốn có bộ nhớ liên tục cho ứng dụng LLM mà không có phụ thuộc bên ngoài.

Cân nhắc Bảo mật #

Đối với triển khai production, đảm bảo bạn:

Sử dụng HTTPS cho mọi kết nối API
Kích hoạt xác thực qua API key hoặc JWT token
Sao lưu dữ liệu bộ nhớ định kỳ
Theo dõi log truy cập để phát hiện hoạt động đáng ngờ
Mã hóa bộ nhớ nhạy cảm khi nghỉ bằng AES-256

# Kích hoạt HTTPS với Let's Encrypt
sudo certbot --nginx -d supermemory.yourdomain.com

# Cấu hình xác thực API key
export SUPERMEMORY_API_KEY=*** Start with security enabled
docker run -d \
  --name supermemory \
  -e SUPERMEMORY_API_KEY=*** \
  -p 443:443 \
  supermemory-server

Supermemory lưu trữ dữ liệu nhạy cảm bao gồm cuộc trò chuyện và sở thích. Đối với sản xuất, triển khai các biện pháp bảo mật này để bảo vệ dữ liệu của bạn. Các cuộc kiểm toán bảo mật và thử nghiệm xâm nhập định kỳ được khuyến nghị cho các triển khai bảo mật cao.

Q1: Supermemory có yêu cầu dịch vụ bên ngoài nào không? #

Không. Supermemory tự lưu trữ với không phụ thuộc bên ngoài. Mọi thứ chạy trên hạ tầng của bạn.

Q2: Tôi có thể sử dụng Supermemory với bất kỳ khung LLM nào không? #

Có. Nó cung cấp API Python và JavaScript hoạt động với LangChain, LlamaIndex, CrewAI hoặc bất kỳ khung nào có thể gửi yêu cầu HTTP.

Q3: Sự khác biệt giữa tìm kiếm vector và tìm kiếm đồ thị là gì? #

Tìm kiếm vector tìm các bộ nhớ tương tự về mặt ngữ nghĩa. Tìm kiếm đồ thị tìm bộ nhớ được kết nối bởi quan hệ (cùng người dùng, cùng dự án, cùng khoảng thời gian). Supermemory cung cấp cả hai.

Q4: Supermemory có thể xử lý bao nhiêu bộ nhớ? #

Supermemory hỗ trợ tối đa 1 triệu mục nhập mỗi phiên bản ứng dụng. Đối với tập dữ liệu lớn hơn, bạn có thể mở rộng ngang qua nhiều phiên bản.

Q5: Tôi có thể sử dụng Supermemory trong production không? #

Có. Supermemory cung cấp tùy chọn triển khai Docker và được thiết kế cho sử dụng production. Kiến trúc tự lưu trữ có nghĩa là bạn kiểm soát hạ tầng.

Q6: Supermemory xử lý quyền riêng tư dữ liệu như thế nào? #

Tất cả dữ liệu được lưu trữ trên hạ tầng của bạn. Không API bên ngoài nào được gọi. Bạn có thể mã hóa dữ liệu khi nghỉ và khi truyền bằng TLS tiêu chuẩn.

Q7: Tôi có thể di chuyển dữ liệu từ hệ thống bộ nhớ khác không? #

Có. Supermemory hỗ trợ nhập hàng loạt qua CSV, JSON và định dạng dữ liệu tùy chỉnh. Các tập lệnh di chuyển có sẵn cho các hệ thống phổ biến.

Nguồn & Đọc Thêm #

Tài liệu chính thức: supermemory.dev
Kho GitHub: supermemoryai/supermemory
Tài liệu Python API: GitHub
Tài liệu JavaScript API: GitHub

Kết luận: Xây dựng Ứng dụng LLM Thực sự Có Bộ nhớ #

Supermemory giải quyết vấn đề “ứng dụng LLM bộ nhớ cá vàng.” Nó lưu trữ bộ nhớ dưới dạng dữ liệu có cấu trúc, lập chỉ mục cho cả tìm kiếm vector và đồ thị, và trả về ngữ cảnh có cấu trúc — tất cả tự lưu trữ với không phụ thuộc bên ngoài.

Thử ngay:

pip install supermemory
python -c "import supermemory; m = supermemory.Memory(); m.init()"

Đối với bộ nhớ tự lưu trữ trên VPS, hãy xem xét sử dụng HTStack cho lưu trữ GPU giá rẻ, hoặc DigitalOcean cho triển khai đám mây dễ dàng.

Lệnh Bắt đầu Nhanh:

# Cài đặt một dòng lệnh
pip install supermemory && python -c "
import supermemory
m = supermemory.Memory()
m.init()
m.add('Test memory')
print('Supermemory initialized!')
print(m.search('test'))
"

Lệnh này minh họa cách khởi tạo Supermemory, thêm bộ nhớ thử nghiệm và tìm kiếm nó — tất cả trong một lệnh. Nó hoàn hảo để bắt đầu nhanh với ứng dụng LLM của riêng bạn.

Supermemory giải quyết vấn đề “ứng dụng LLM bộ nhớ cá vàng” bằng cách cung cấp bộ nhớ liên tục thực sự nhớ mọi thứ người dùng nói. Nó là giải pháp bộ nhớ có khả năng mở rộng nhất cho ứng dụng AI, với hỗ trợ hơn 1 triệu mục nhập, hơn 50 ngôn ngữ và hơn 3 chế độ tìm kiếm (vector, đồ thị, toàn văn).

Tham gia nhóm Telegram dibi8 tiếng Việt https://t.me/DIBI8_Group/18 để thảo luận về hệ thống bộ nhớ AI và kiến trúc ứng dụng LLM.

Supermemory: API Bộ nhớ AI Mã nguồn Mở Nhanh nhất để Xây dựng Ứng dụng LLM Nhớ Mọi thứ

Supermemory: API Bộ nhớ AI Mã nguồn Mở Nhanh nhất để Xây dựng Ứng dụng LLM Nhớ Mọi thứ #

TL;DR #

Nó Là Gì #

Cách Hoạt Động (30 Giây) #

Bắt Đầu Nhanh (60 Giây) #

Khi nào Sử dụng / Khi nào Bỏ qua #

Benchmark #

So sánh Hiệu năng #

Python API #

Tính năng Nâng cao #

Triển khai Docker Production #

Tham khảo API #

Trường hợp Sử dụng #

Trường hợp Sử dụng 1: Bot Hỗ trợ Khách hàng #

Trường hợp Sử dụng 2: Công cụ Đề xuất Cá nhân hóa #

Trường hợp Sử dụng 3: Cơ sở Kiến thức Nghiên cứu #

JavaScript API #

Tích hợp LangChain #

So sánh với Giải pháp Thay thế #

Hạn chế / Đánh giá Trung thực #

Cân nhắc Bảo mật #

Q1: Supermemory có yêu cầu dịch vụ bên ngoài nào không? #

Q2: Tôi có thể sử dụng Supermemory với bất kỳ khung LLM nào không? #

Q3: Sự khác biệt giữa tìm kiếm vector và tìm kiếm đồ thị là gì? #

Q4: Supermemory có thể xử lý bao nhiêu bộ nhớ? #

Q5: Tôi có thể sử dụng Supermemory trong production không? #

Q6: Supermemory xử lý quyền riêng tư dữ liệu như thế nào? #

Q7: Tôi có thể di chuyển dữ liệu từ hệ thống bộ nhớ khác không? #

Nguồn & Đọc Thêm #

Kết luận: Xây dựng Ứng dụng LLM Thực sự Có Bộ nhớ #

📦 Xuất hiện trong các bộ sưu tập

💬 Bình luận & Thảo luận

Supermemory: API Bộ nhớ AI Mã nguồn Mở Nhanh nhất để Xây dựng Ứng dụng LLM Nhớ Mọi thứ #

TL;DR #

Nó Là Gì #

Cách Hoạt Động (30 Giây) #

Bắt Đầu Nhanh (60 Giây) #

Khi nào Sử dụng / Khi nào Bỏ qua #

Benchmark #

So sánh Hiệu năng #

Python API #

Tính năng Nâng cao #

Triển khai Docker Production #

Tham khảo API #

Trường hợp Sử dụng #

Trường hợp Sử dụng 1: Bot Hỗ trợ Khách hàng #

Trường hợp Sử dụng 2: Công cụ Đề xuất Cá nhân hóa #

Trường hợp Sử dụng 3: Cơ sở Kiến thức Nghiên cứu #

JavaScript API #

Tích hợp LangChain #

So sánh với Giải pháp Thay thế #

Hạn chế / Đánh giá Trung thực #

Cân nhắc Bảo mật #

Q1: Supermemory có yêu cầu dịch vụ bên ngoài nào không? #

Q2: Tôi có thể sử dụng Supermemory với bất kỳ khung LLM nào không? #

Q3: Sự khác biệt giữa tìm kiếm vector và tìm kiếm đồ thị là gì? #

Q4: Supermemory có thể xử lý bao nhiêu bộ nhớ? #

Q5: Tôi có thể sử dụng Supermemory trong production không? #

Q6: Supermemory xử lý quyền riêng tư dữ liệu như thế nào? #

Q7: Tôi có thể di chuyển dữ liệu từ hệ thống bộ nhớ khác không? #

Nguồn & Đọc Thêm #

Kết luận: Xây dựng Ứng dụng LLM Thực sự Có Bộ nhớ #

🔗 Tài nguyên liên quan

📦 Xuất hiện trong các bộ sưu tập

💬 Bình luận & Thảo luận