Cuộc cách mạng trợ lý lập trình AI đã tạo ra một nghịch lý cho nhà phát triển: chúng ta có quyền truy cập chưa từng có vào các mô hình ngôn ngữ đẳng cấp thế giới thông qua các công cụ như Claude Code, OpenAI Codex, Cursor và GitHub Copilot — nhưng việc quản lý đăng ký, hạn ngạch và giới hạn tốc độ trên nhiều nền tảng ngày càng trở nên đắt đỏ và gây frustrate. Nhiều nhà phát hiện thấy mình đốt hết hạn ngạch hàng tháng của Claude Pro trong vòng hai tuần, chỉ để đối mặt với tường giới hạn tốc độ khi đang cố gắng đáp ứng deadline sprint.
9Router ra đời — giải pháp hoàn toàn loại bỏ nỗi đau này — một proxy thông minh và hệ thống quản lý token mã nguồn mở. Với hơn 6.900 sao GitHub, 1.200+ fork và cộng đồng tăng trưởng nhanh chóng, 9Router đã trở thành giải pháp được ưa chuộng cho những nhà phát triển muốn có khả năng AI tối đa mà không cần trả thêm cho các gói premium không cần thiết. Được xây dựng trên Node.js 20+, Next.js 16 và React 19, nó cung cấp một giao diện thống nhất định tuyến yêu cầu lập trình AI của bạn qua 40+ nhà cung cấp bằng logic fallback thông minh và nén token mạnh mẽ.
9Router là gì và hoạt động như thế nào?
9Router là một dịch vụ trung gian chạy cục bộ (mặc định tại localhost:20128), đóng vai trò lớp trung gian giữa công cụ lập trình AI của bạn và nhà cung cấp mô hình backend. Thay vì gửi yêu cầu API trực tiếp đến Claude, OpenAI hoặc bất kỳ nhà cung cấp đơn lẻ nào, công cụ của bạn sẽ nói chuyện với 9Router — rồi 9Router quyết định thông minh xem yêu cầu nên được định tuyến đến nhà cung cấp backend nào.
Kiến trúc này mang lại ba lợi ích chính:
- Truy cập đa nhà cung cấp từ một nơi: Cấu hình Claude, Gemini, GLM, MiniMax, Kiro, OpenCode, Vertex AI và 40+ nhà cung cấp khác trong một bảng điều khiển duy nhất. CLI tool của bạn gửi yêu cầu đến localhost; 9Router xử lý phần còn lại.
- Fallback tự động: Khi nhà cung cấp chính đạt giới hạn hạn ngạch hoặc gặp sự cố, 9Router chuyển tiếp mượt mà sang lớp tiếp theo — dù đó là nhà cung cấp backup giá rẻ hay tùy chọn hoàn toàn miễn phí. Không gián đoạn workflow.
- Nén token trước khi rời khỏi máy: Tích hợp với RTK
(~40K stars), 9Router tự động nén output từ công cụ (
git diff, kết quả grep, danh sách thư mục, dump log…) trước khi chúng đến LLM. Chỉ riêng điều này đã tiết kiệm 20-40% token đầu vào mỗi yêu cầu.
Các tính năng cốt lõi phân biệt 9Router
🚀 Động cơ nén token RTK
Output từ công cụ thường chiếm 30-50% ngân sách prompt tổng thể của bạn. Khi Claude Code chạy git diff, ls -R hoặc grep trong codebase lớn, nó gửi hàng triệu byte văn bản đến mô hình — phần lớn là noise không liên quan.
Tính năng RTK tích hợp sẵn của 9Router tự động phát hiện các output công cụ này và áp dụng các bộ lọc nén lossless thông minh:
- git-diff: Rút gọn output diff xuống các dòng thay đổi thiết yếu
- git-status: Nén trạng thái thành định dạng tóm tắt
- grep / find: Loại bỏ các match không liên quan, giữ lại dòng giàu ngữ cảnh
- tree / ls: Thu gọn cấu trúc thư mục một cách có ý nghĩa
- dedup-log: Xóa các entry log lặp lại liên tiếp
- smart-truncate: Giữ nguyên đầu/cuối, loại bỏ nội dung redundant ở giữa
Quan trọng hơn, nếu bất kỳ bộ lọc nào lỗi hoặc tạo output tệ hơn bản gốc, RTK tự động quay về bản text chưa sửa. Lỗi không bao giờ phá hỏng yêu cầu của bạn. Việc nén được chạy trước mọi format translation, nên nó hoạt động với mọi định dạng được hỗ trợ (OpenAI, Claude, Gemini, Cursor, Kiro, OpenAI Responses).
1Không dùng RTK: Gửi 47K token đến LLM
2Dùng RTK: Gửi 28K token đến LLM (tiết kiệm 40% · chất lượng answer như nhau)
Trong thực tế, nhiều nhà phát triển báo cáo tiết kiệm được 20-40% token trên mỗi yêu cầu — hiệu quả kéo dài vòng đời của mỗi đăng ký thêm vài ngày甚至 vài tuần.
🪨 Chế độ Caveman (Nén Output)
Bên cạnh tối ưu hóa input, 9Router cũng giảm lượng content mà LLM gửi trả lại. Bằng cách tiêm một system prompt “phong cách caveman” (lấy cảm hứng từ Caveman ~52K stars), 9Router hướng dẫn mô hình phản hồi súc tích — giữ nguyên toàn bộ nội dung kỹ thuật trong khi loại bỏ các filler thoại.
Điều này có thể tiết kiệm tới 65% token output. Đối với các tác vụ refactoring phức tạp hoặc phiên tạo code dài, những tiết kiệm này tích lũy nhanh chóng qua hàng trăm API call.
🎯 Hệ thống Fallback 3 Tầng Thông Minh
Đây có lẽ là tính năng sát thủ của 9Router. Bạn định nghĩa các “combo” — danh sách các model xếp hạng trên nhiều mức giá khác nhau — và 9Router tự động định tuyến yêu cầu tương ứng:
1Combo: "my-coding-stack"
2 1. cc/claude-opus-4-6 → Đăng ký Claude Code Pro của bạn
3 2. glm/glm-4.7 → Backup giá rẻ ($0.6 per 1M token)
4 3. kr/claude-sonnet-4.5 → Fallback khẩn cấp miễn phí qua Kiro AI
Khi hạn ngạch Opus hết (hoặc xảy ra error), 9Router ngay lập tức chuyển sang GLM. Nếu GLM cũng cạn, nó xuống layer miễn phí vô hạn của Kiro. Bạn không bao giờ đâm phải bức tường.
Hệ thống hỗ trợ năm mức giá khác nhau:
| Mức | Nhà cung cấp | Chi phí điển hình | Chu kỳ reset |
|---|---|---|---|
| Đăng ký | Claude Code, Codex, Copilot, Cursor | $10-$200/tháng | 5h rolling + weekly/monthly |
| Giá rẻ | GLM-5.1, MiniMax M2.7, Kimi K2.5 | $0.2-$0.6/M token | Daily/rolling/fixed monthly |
| Miễn phí | Kiro AI, OpenCode Free, Vertex AI | $0 | Vô hạn |
📊 Theo dõi Hạn ngạch Thời gian Thực & Phân tích
Bảng điều khiển web hiển thị mức tiêu thụ token thời gian thực theo nhà cung cấp, đồng hồ đếm ngược reset (5h, daily, weekly, monthly) và theo dõi chi phí ước tính. Mặc dù bảng điều khiển hiển thị “chi phí” như một công cụ so sánh tham chiếu — 9Router bản thân là phần mềm miễn phí và không bao giờ tính phí — phân tích giúp bạn hiểu pattern sử dụng và tối ưu chi tiêu.
Nếu bảng điều khiển hiển thị “$290 total cost” trong khi dùng Kiro free tier, con số $290 đó đại diện cho số tiền bạn would have paid nếu dùng trực tiếp các API đó. Khoản thanh toán thực tế của bạn vẫn là $0. Nó giống như một savings tracker cho biết bạn đang tiết kiệm được bao nhiêu.
🔄 Dịch chuyển Format Giữa Mọi Giao thức Chính
9Router dịch chuyển mượt mà giữa các định dạng OpenAI, Claude, Gemini, Cursor, Kiro, Vertex AI, Antigravity, Ollama và OpenAI Responses. CLI tool của bạn gửi payload chuẩn OpenAI-compatible; 9Router chuyển đổi nó thành định dạng native mà mỗi provider mong đợi. Điều này có nghĩa là bạn có thể dùng bất kỳ tool nào hỗ trợ custom OpenAI endpoint và nối vào bất kỳ provider backend nào.
👥 Hỗ trợ Đa tài khoản
Cần load balancing hoặc redundancy across accounts? 9Router cho phép bạn thêm nhiều account cho mỗi provider, với round-robin tự động hoặc priority-based routing. Khi một account đạt giới hạn hạn ngạch, request tự động chuyển sang account tiếp theo. OAuth token tự động refresh, loại bỏ chu kỳ re-authentication thủ công.
💾 Đồng bộ Cloud
Đồng bộ toàn bộ cấu hình của bạn — providers, combos, aliases, settings — across devices qua encrypted cloud storage. Thiết kế combo hoàn hảo trên local machine, sau đó truy cập chính xác cùng cấu hình trên VPS, Docker deployment hoặc workstation của đồng nghiệp.
Các công cụ lập trình và IDE được hỗ trợ
9Router đóng vai trò adapter universal, hỗ trợ hầu hết mọi công cụ lập trình AI phổ biến:
- Claude Code (
~/.claude/config.jsonvới custom API base URL) - OpenAI Codex CLI (override environment variable)
- Cursor IDE (cài đặt Custom OpenAI endpoint)
- GitHub Copilot
- OpenClaw (nhắn tin WhatsApp, Telegram, Slack)
- Cline
- Continue
- Roo Code
- Antigravity
- Droid
- Kilo Code
- OpenCode
Mọi tool hỗ trợ custom OpenAI-compatible API endpoint đều có thể kết nối với 9Router. Service expose một giao diện standard OpenAI-compatible tại http://localhost:20128/v1.
Bắt đầu: Cài đặt và Thiết lập
Quick Start: Localhost (Khuyến nghị cho đa số người dùng)
1# Clone và cài đặt
2git clone https://github.com/decolua/9router.git
3cd 9router
4npm install
5npm run build
6
7# Cấu hình environment tùy chọn
8export JWT_SECRET="your-secure-secret-change-this"
9export INITIAL_PASSWORD="your-dashboard-password"
10export PORT="20128"
11export NODE_ENV="production"
12
13# Khởi động server
14npm run start
Sau khi khởi động, mở http://localhost:20128 để truy cập bảng điều khiển web. Từ đây, kết nối provider đầu tiên của bạn.
Deploy Docker
Đối với production hoặc multi-device setup, Docker giúp việc deploy dễ dàng:
1docker build -t 9router .
2
3docker run -d \
4 --name 9router \
5 -p 20128:20128 \
6 --env-file ./.env \
7 -v 9router-data:/app/data \
8 -v 9router-usage:/root/.9router \
9 9router
Kết nối Provider Đầu tiên
Hãy thiết lập một combo free-tier hoàn chỉnh — không cần phương thức thanh toán:
- Kết nối Kiro AI trong dashboard (dùng AWS Builder ID, Google hoặc GitHub OAuth — không cần API key)
- Kết nối OpenCode Free (zero auth, passthrough proxy, models auto-fetch)
- Tạo combo tên
free-devvới models:kr/claude-sonnet-4.5(Claude Sonnet 4.5 qua Kiro — free unlimited)kr/glm-5(GLM-5 qua Kiro — free unlimited)vertex/gemini-3.1-pro-preview(Google Cloud — $300 free credits)
Sau đó cấu hình tool yêu thích của bạn trỏ đến http://localhost:20128/v1 với dashboard API key của bạn:
1{
2 "anthropic_api_base": "http://localhost:20128/v1",
3 "anthropic_api_key": "your-9router-api-key"
4}
Cấu hình Cursor IDE
Trong Cursor Settings → Models → Advanced:
1OpenAI API Base URL: http://localhost:20128/v1
2OpenAI API Key: [copy từ 9Router dashboard]
3Model: cc/claude-opus-4-7
Giờ đây mọi model call từ Cursor đều đi qua routing intelligence của 9Router.
Use Cases Thực tế
Scenario A: Tối đa hóa Đăng ký Hiện có
Bạn trả $20/tháng cho Claude Pro. Không có 9Router, khi hạn ngạch hết, việc coding dừng lại cho đến khi reset.
Với combo “maximize-claude” của 9Router:
- Primary:
cc/claude-opus-4-7(sử dụng full subscription) - Backup:
glm/glm-5.1($0.6/M token, reset hàng ngày lúc 10 AM) - Emergency:
kr/claude-sonnet-4.5(Kiro free fallback)
Kết quả: Vì RTK tiết kiệm 20-40% token, subscription $20 của bạn kéo dài hơn; khi hết hạn, bạn có backup mượt mà. Tổng chi phí hiệu dụng của tier giá rẻ chỉ tăng khoảng $5 — rẻ hơn nhiều so với upgrade lên Claude Max ($200/tháng).
Scenario B: Ngân sách 0$ Hoàn Toàn
Bắt đầu với 100% model miễn phí:
gc/gemini-3-flash(180K free queries/tháng từ Google)kr/claude-sonnet-4.5(Kiro free unlimited)oc/<auto>(OpenCode Free, không cần authentication)
Kết hợp với nén RTK, setup nàydeliver phản hồi model chất lượng production với đúng $0 chi phí hàng tháng.
Scenario C: Lập trình 24/7 Không Ngừng Gián
Dành cho teams và freelancer dưới áp lực deadline, xếp năm layers fallback:
- Claude Opus (premium quality)
- GPT-5.5 qua Codex (second subscription)
- GLM-5.1 (giá rẻ daily-reset)
- MiniMax M2.7 (rẻ nhất $0.2/M token, 5h rolling reset)
- Kiro Claude Sonnet 4.5 (free unlimited)
Năm layers đảm bảo zero downtime bất kể quota exhaustion hoặc provider outage.
Min bạch giá: Thực tế sẽ tốn bao nhiêu?
Câu hỏi then chốt khi đánh giá 9Router: 9Router có tính phí bạn? Không. Không bao giờ.
Cách thức vận hành kinh tế thực tế:
- Phần mềm 9Router = MIỄN PHÍ trọn đời (MIT license open-source, self-hosted trên hardware của bạn)
- Chi phí hiển thị trên dashboard = chỉ để show/track (không phải bill thật)
- Bạn trả trực tiếp cho providers (subscription, API keys,whatever bạn configure)
- Free providers vẫn free (Kiro AI, OpenCode Free, Vertex AI credits)
9Router thuần túy là một local proxy router chạy trên máy của bạn. Nó không thể truy cập credit card của bạn, không thể tạo invoice, và không có billing infrastructure. Nó chỉ forward requests và optionally compress tokens.
Hiển thị chi phí trên dashboard đóng vai trò “savings tracker” — cho bạn biết equivalent usage would have cost了多少 nếu dùng paid APIs trực tiếp. Nếu bạn cấu hình tất cả free providers, chi phí hiển thị có thể đọc là “$290” trong khi giao dịch ngân hàng thực tế của bạn là $0. Đó là số tiền bạn đang actively saving.
So sánh 9Router vs Alternatives
9Router so với các giải pháp hiện có thế nào?
| Tính năng | 9Router | Direct Provider Access | Other Proxy Tools |
|---|---|---|---|
| Smart fallback routing | ✅ Auto 3+ layer | ❌ Single provider | Partial |
| Token compression (RTK) | ✅ Built-in | ❌ None | Rarely |
| Multi-format translation | ✅ 8+ protocols | N/A | Limited |
| Multi-account rotation | ✅ Round-robin | ❌ Manual | Manual |
| Free provider support | ✅ Kiro, OpenCode, Vertex | ❌ Not applicable | Usually not |
| Real-time analytics | ✅ Dashboard + logs | ❌ Provider portals | Basic |
| Self-hosted | ✅ Full control | N/A | Variable |
| Cost | Free software + provider costs | Full provider prices | Often paid |
Alternative đáng chú ý nhất là OmniRoute , một TypeScript fork của 9Router thêm 36+ providers, 4-tier auto-fallback, multi-modal APIs (images, embeddings, audio, TTS), circuit breaker patterns, semantic caching, LLM evaluation harnesses và polished dashboard với 368+ unit tests. OmniRoute available qua npm và Docker cho users muốn capabilities vượt ngoài core feature set của 9Router.
Tại sao 9Router Quan trọng Ngay Lúc này
Chúng ta đang sống trong kỷ nguyên vàng của công cụ lập trình AI, nhưng reality kinh tế chưa theo kịp. Mỗi major provider độc lập ràng buộc access behind paywalls, quota limits và rate caps. Quản lý sáu subscriptions khác nhau giữa Claude, OpenAI, Google, Anthropic, DeepSeek và xAI tạo ra cả financial burden lẫn operational complexity.
9Router giải quyết vấn đề này bằng cách treat all these providers as interchangeable commodities routed through a single intelligence layer. Bạn get model tốt nhất cho mỗi task, cheapest path cho routine ones, và guaranteed availability khi quota cạn — đồng thời compress token waste trước khi nó ever rời khỏi máy bạn.
Sự kết hợp của RTK token compression (~20-40% savings), Caveman mode output reduction (~65% savings) và intelligent multi-tier fallback tạo ra compounding effect. Developers report 500+ daily API calls thấy effective model consumption giảm 40-60%, biến một AI stack $200/tháng thành thứ manageable ở $20-30.
Highlights Kiến trúc Kỹ thuật
9Router được xây dựng trên modern JavaScript stack optimized cho reliability:
- Runtime: Node.js 20+ cho async I/O consistent, performant
- Framework: Next.js 16 với React 19 cho web dashboard
- Database: LowDB (JSON file-based) — simple, portable, version-controllable config
- Streaming: Server-Sent Events (SSE) cho real-time progress feedback
- Auth: OAuth 2.0 + PKCE, JWT session cookies, HMAC-signed API keys
- Proxy: Full HTTP passthrough với configurable upstream proxies
Environment variables cho granular control over deployment:
JWT_SECRET: Khuyến nghị thay đổi trong productionREQUIRE_API_KEY: Enforce bearer token auth trên/v1/*routesENABLE_REQUEST_LOGS: Enable debug-level request/response loggingAUTH_COOKIE_SECURE: Force Secure cookie flag behind HTTPS reverse proxyHTTP_PROXY/HTTPS_PROXY: Route upstream requests qua corporate proxies
Service lắng nghe trên port 20128 mặc định và không cần external dependencies hay databases ngoài JSON files stored in ${DATA_DIR}.
Những suy nghĩ cuối cùng
9Router giải quyết một vấn đề genuinely painful mà ngày càng nhiều developers đang cảm nhận. Khi AI tool subscriptions nhân lên, chúng ta không chấp nhận escalating costs và arbitrary rate limits như cái giá không tránh khỏi của AI-assisted development — 9Router đảo ngược剧本: sử dụng bất kỳ provider nào bạn đã có, lấp đầy gaps với alternatives cheap hoặc free, nén mọi thứ có thể, và duy trì continuous coding flow bất kể quota state.
Đối với solo developers on tight budgets, free-first strategy có thể deliver fully functional AI coding assistance với chính xác $0. Đối với teams willing to invest in premium subscriptions, token compression và smart routing maximize ROI bằng cách đảm bảo mỗi dollar spent stretches further.
Miễn phí, open-source và có thể self-host trong vài phút. Xét xu hướng pricing hiện tại của AI tools, việc thêm 9Router vào development infrastructure của bạn không chỉ hữu ích — mà đang trở thành essential.
Repository: github.com/decolua/9router Website: 9router.com
Bài viết Liên quan
- oMLX: Chạy LLM Local trên Mac không cần Config
- Chrome DevTools MCP: Superpowers Trình duyệt cho AI Agents
- GenericAgent: Framework AI Agent Tự Tiến hóa
- Services Tài chính Anthropic: Claude Agents Dựa trên AI
- Easy Vibe Coding: Hướng dẫn Cho Người mới bắt đầu
- Thêm Addy Osmani’s Agent Skills: Production-grade AI Coding Agents
Have questions or ideas? Feel free to leave a comment below. Sign in with GitHub to join the discussion.