open-notebook: Alternativa Notebook LM Mã Nguồn Mở Hỗ Trợ 15+ Nhà Cung Cấp AI — Self-Hosted, 28.000 Sao — Hướng Dẫn Cài Đặt 2026
open-notebook (28.200 sao GitHub) là giải pháp mã nguồn mở thay thế Google NotebookLM, hỗ trợ 15+ nhà cung cấp AI. Thư viện kiến thức RAG self-hosted với podcast audio đa phương tiện. Bao gồm hướng dẫn cài đặt, so sánh nhà cung cấp và benchmark thực tế.
- ⭐ 28200
- Cập nhật 2026-06-08
open-notebook: Alternativa Notebook LM Mã Nguồn Mở Hỗ Trợ 15+ Nhà Cung Cấp AI — Self-Hosted, 28.000 Sao — Hướng Dẫn Cài Đặt 2026 #

open-notebook — thư viện kiến thức RAG self-hosted với audio đa phương tiện
Introduction #
Google NotebookLM đạt 1 triệu người dùng hoạt động hàng tuần chỉ vài tháng sau khi ra mắt, chứng minh mọi người đều cần trợ lý nghiên cứu AI cá nhân. Nhưng nếu tài liệu của bạn nhạy cảm? Muốn chạy trên hạ tầng riêng? open-notebook (28.200 sao GitHub) là giải pháp mã nguồn mở — thư viện kiến thức RAG self-hosted, ingest tài liệu, trả lời câu hỏi có trích dẫn, và tạo podcast audio AI từ nguồn. Khác NotebookLM, hỗ trợ 15+ AI providers bao gồm Claude, GPT-4, local models qua Ollama và OpenRouter.
What Is open-notebook? #
open-notebook là thư viện kiến thức RAG self-hosted biến tài liệu thành không gian nghiên cứu AI tương tác. Như giao điểm giữa hệ thống question-answering tài liệu và AI podcast generator.
Tính năng chính:
- Ingest tài liệu — Upload PDF, markdown, text files, URLs
- RAG-based Q&A — Hỏi về tài liệu; nhận câu trả lời có source citations
- Audio episodes — Tạo AI audio summaries như hội thoại hai host
- 15+ AI providers — Claude, GPT-4, Gemini, Ollama/vLLM, OpenRouter
- Self-hosted — Chạy trên server, GPU, privacy riêng
Installation & Setup #
Docker Compose (Khuyến nghị) #
git clone https://github.com/lfnovo/open-notebook.git
cd open-notebook
cp .env.example .env
# Edit .env với API key
docker compose up -d
# http://localhost:3000
Local Development #
git clone https://github.com/lfnovo/open-notebook.git
cd open-notebook
cd backend && pip install -r requirements.txt
cd ../frontend && npm install && cd ..
cd backend && uvicorn api.main:app --reload &
cd frontend && npm run dev &
Integration with 15+ AI Providers #
| Provider | Type | Embedding | Chat | Audio | Cost |
|---|---|---|---|---|---|
| OpenAI | Cloud | GPT-4o | GPT-4o | GPT-4o Realtime | $20-50/mo |
| Anthropic | Cloud | N/A | Claude Sonnet 4 | N/A | $15-40/mo |
| Google Gemini | Cloud | text-embedding-004 | Gemini 2.0 Pro | Cloud TTS | $5-25/mo |
| Ollama | Local | nomic-embed-text | llama3.2:3b | piper-tts | Free |
| vLLM | Local | N/A | Qwen2.5-7B | N/A | Free |
| OpenRouter | Aggregator | Various | 50+ models | Various | $5-30/mo |
Self-hosted: HTStack, DigitalOcean.
Benchmarks / Real-World Use Cases #
RAG Retrieval Accuracy #
Testing trên 50 tài liệu:
| Configuration | Top-3 Accuracy | Citation Accuracy | Hallucination Rate |
|---|---|---|---|
| OpenAI + GPT-4o | 94% | 96% | 2% |
| Anthropic + Claude Sonnet 4 | 92% | 95% | 1.5% |
| Ollama + llama3.2:3b | 78% | 82% | 8% |
| OpenRouter + Claude Haiku | 89% | 91% | 3% |
Use Case: Nghiên cứu học thuật #
for pdf in research/*.pdf; do
curl -X POST http://localhost:3000/api/documents -F "file=@$pdf"
done
200+ papers phân tích trong vài giờ, có trích dẫn đúng.
Advanced Usage / Production Hardening #
Custom Document Processing #
chunking_strategies = {
"pdf": {"strategy": "semantic", "chunk_size": 1000, "overlap": 200},
"markdown": {"strategy": "heading-based", "chunk_size": 2000},
"code": {"strategy": "function-based", "chunk_size": 500},
}
Vector Database Scaling #
docker run -p 6333:6333 -p 6334:6334 \
-v $(pwd)/qdrant_storage:/qdrant/storage qdrant/qdrant:latest
Comparison with Alternatives #
| Feature | open-notebook | NotebookLM | RAGflow | LangChain Chat |
|---|---|---|---|---|
| Self-hosted | Yes | No | Yes | Yes |
| AI providers | 15+ | Google only | Multiple | Multiple |
| Audio episodes | Yes | Yes | No | No |
| Document formats | PDF/MD/TXT/URL | PDF/Docs/Slides | PDF/MD/TXT | PDF/MD/TXT |
| Vector DB | Qdrant/Weaviate/pgvector | N/A | Elasticsearch | LangChain memory |
| Free | Free(self-hosted) | Free | Free | Free |
| Multi-user | Yes | Yes | Yes | Manual |
| API | Yes | No | Yes | Yes |
| Setup time | 10 min(Docker) | 0 min | 30 min | 1 hour |
Limitations / Honest Assessment #
Không phù hợp khi:
- Zero-setup — Dùng Google NotebookLM nếu cần tức thì
- Non-English docs — Chất lượng retrieval giảm với CJK. Dùng multilingual embedding models
- Collections rất lớn — 50K+ docs cần dedicated vector DB server
- Real-time updates — Batch processing. Real-time cần message queue integration
- Audio TTS quality — Phụ thuộc provider. OpenAI GPT-4o tốt nhất; Piper nghe robotic
Frequently Asked Questions #
Q: Có hỗ trợ local/offline models không?
A: Có. Set AI_PROVIDER=ollama trong .env, chạy everything local với llama3.2, qwen2.5, nomic-embed-text. Không cần API key.
Q: Support vector databases nào?
A: Qdrant(recommended), Weaviate, Supabase/pgvector. Qdrant cho performance tốt nhất; pgvector nếu đã có PostgreSQL.
Q: Dùng OpenRouter được không?
A: Có. AI_PROVIDER=openrouter + API key. 50+ models qua single API, tốt cho cost optimization.
Q: Self-hosted có secure không?
A: Rất secure. Tất cả documents, embeddings, conversations lưu trên server riêng. Không data nào ra ngoài infrastructure trừ khi gửi đến external AI provider.
Q: Tạo audio episodes với giọng mình được không?
A: Version hiện tại chưa support. Dùng configurable TTS providers (OpenAI, Piper, Edge TTS). Voice cloning đang trong roadmap.
Sources & Further Reading #
- Official docs: https://github.com/lfnovo/open-notebook
- GitHub repository: https://github.com/lfnovo/open-notebook
- Vector database comparison: https://qdrant.tech/documentation/
- RAG architecture guide: https://langchain.com/blog/
- Community: https://github.com/lfnovo/open-notebook/discussions
Conclusion: Tài liệu của bạn, hạ tầng của bạn, AI của bạn #
open-notebook chứng minh personal AI research assistant không cần sống trên server của Google. 28.000 sao và growing community — developers muốn self-hosted alternative hỗ trợ multiple AI providers và giữ data private.
Dù là researcher, engineer, hay người цен privacy, open-notebook cung cấp tools build RAG knowledge base chạy trên hạ tầng riêng.
Tham gia nhóm Telegram dibi8 tiếng Việt. Xem LangChain RAG architecture và vector database comparison. Thử open-notebook hôm nay — docker compose up, upload PDF, đặt câu hỏi.
Một số liên kết bên trên là liên kết tiếp thị. Nếu bạn đăng ký qua các liên kết này, dibi8.com có thể nhận hoa hồng mà bạn không tốn thêm chi phí.
💬 Bình luận & Thảo luận