Vấn Đề: Claude Code Đắt Đỏ
Claude Code là một trong những trợ lý lập trình AI tốt nhất hiện có. Nó tích hợp trực tiếp vào terminal của bạn, hiểu ngữ cảnh codebase, và có thể thực thi lệnh, chỉnh sửa tệp và gỡ lỗi một cách tự chủ.
Nhưng có một vấn đề: nó yêu cầu khóa API Anthropic, và các cuộc gọi API Claude 3.5 Sonnet / Claude 3 Opus có thể tốn $3-15 mỗi giờ lập trình tích cực. Đối với các nhà phát triển sử dụng trợ lý AI hàng ngày, chi phí này tích lũy nhanh chóng.
Free Claude Code giải quyết vấn đề này bằng cách hoạt động như một proxy thay thế giữa Claude Code CLI và các nhà cung cấp AI miễn phí hoặc chi phí thấp.
Free Claude Code Là Gì?
Free Claude Code là một máy chủ proxy Python mã nguồn mở được tạo bởi Ali Shahryar . Nó chặn các yêu cầu API Anthropic Messages từ Claude Code và chuyển tiếp chúng đến các backend AI thay thế cung cấp tier miễn phí hoặc thực thi cục bộ.
Công nghệ xây dựng dự án:
- Python 3.14 — Python mới nhất với cải tiến hiệu suất
- uv — trình quản lý gói Python nhanh của Astral
- FastAPI + Uvicorn — máy chủ web async hiệu suất cao
- Pydantic — xác thực kiểu nghiêm ngặt
- Loguru — ghi log có cấu trúc
- Ruff — công cụ kiểm tra và định dạng Python nhanh
Các Nhà Cung Cấp AI Được Hỗ Trợ
Free Claude Code hỗ trợ 6 backend khác nhau, cho phép bạn chọn dựa trên chi phí, tốc độ, quyền riêng tư hoặc sở thích mô hình:
| Nhà cung cấp | Chi phí | Phù hợp nhất cho | Độ phức tạp thiết lập |
|---|---|---|---|
| NVIDIA NIM | Có tier miễn phí | Sản xuất, suy luận nhanh | Cần khóa API |
| OpenRouter | Trả theo lượng sử dụng | Truy cập nhiều mô hình | Cần khóa API |
| DeepSeek | Rất rẻ | Nhà phát triển có ngân sách | Cần khóa API |
| LM Studio | Miễn phí (cục bộ) | Quyền riêng tư, sử dụng ngoại tuyến | Ứng dụng GUI cục bộ |
| llama.cpp | Miễn phí (cục bộ) | Kiểm soát tối đa, mô hình tùy chỉnh | Dòng lệnh |
| Ollama | Miễn phí (cục bộ) | Thiết lập cục bộ dễ nhất | Cài đặt đơn giản |
NVIDIA NIM (Khuyến nghị cho Tier Miễn Phí)
NVIDIA cung cấp một tier miễn phí hào phóng thông qua nền tảng NIM (NVIDIA Inference Microservices) của họ. Bạn có thể chạy các mô hình như glm-4-9b hoặc llama-3.1-8b miễn phí với giới hạn tốc độ phù hợp cho phát triển cá nhân.
Thiết lập:
- Lấy khóa API tại build.nvidia.com
- Cấu hình
.env:NVIDIA_NIM_API_KEY="nvapi-your-key" MODEL="nvidia_nim/z-ai/glm4.7" ANTHROPIC_AUTH_TOKEN="freecc"
OpenRouter
OpenRouter cung cấp quyền truy cập thống nhất vào hàng trăm mô hình bao gồm Claude, GPT-4, Gemini và các lựa chọn thay thế mã nguồn mở. Chỉ trả tiền cho những gì bạn sử dụng.
Thiết lập:
OPENROUTER_API_KEY="sk-or-your-key"
MODEL="open_router/anthropic/claude-3.5-sonnet"
DeepSeek
DeepSeek cung cấp mức giá cực kỳ cạnh tranh (thường rẻ hơn Anthropic 10 lần) với hiệu suất lập trình mạnh mẽ.
Thiết lập:
DEEPSEEK_API_KEY="sk-your-key"
MODEL="deepseek/deepseek-chat"
Tùy Chọn Cục Bộ (LM Studio, llama.cpp, Ollama)
Để có quyền riêng tư hoàn toàn và chi phí không đồng, hãy chạy mô hình cục bộ:
Ollama (Dễ nhất):
# Cài đặt Ollama
ollama pull llama3.1
ollama serve
OLLAMA_BASE_URL="http://localhost:11434"
MODEL="ollama/llama3.1"
LM Studio: Tải xuống LM Studio , tải một mô hình, và nó sẽ tự động chạy máy chủ API cục bộ.
LMSTUDIO_BASE_URL="http://localhost:1234/v1"
MODEL="lmstudio/your-loaded-model"
Các Tính Năng Chính
Định Tuyến Theo Mô Hình
Cấu hình các nhà cung cấp khác nhau cho các tier mô hình Claude khác nhau:
# Yêu cầu Opus → OpenRouter (chất lượng tốt nhất)
MODEL_OPUS="open_router/anthropic/claude-3-opus"
# Yêu cầu Sonnet → NVIDIA NIM (tier miễn phí)
MODEL_SONNET="nvidia_nim/z-ai/glm4.7"
# Yêu cầu Haiku → Ollama (cục bộ, tức thì)
MODEL_HAIKU="ollama/llama3.1"
Bộ chọn /model của Claude Code hoạt động tự nhiên thông qua điểm cuối /v1/models của proxy.
Hỗ Trợ Streaming
Truyền token thời gian thực hoạt động giống hệt API Anthropic chính thức. Bạn thấy mã được nhập từng ký tự một.
Sử Dụng Công Cụ
Cuộc gọi hàm của Claude Code (thao tác tệp, thực thi lệnh) hoạt động thông qua proxy. Proxy dịch định dạng công cụ Anthropic sang định dạng gốc của mỗi nhà cung cấp.
Khối Suy Luận/Suy Nghĩ
Đối với các mô hình hỗ trợ suy luận chuỗi suy nghĩ (như DeepSeek-R1), proxy trích xuất và định dạng các khối suy nghĩ một cách chính xác.
Ghi Chú Thoại (Tùy chọn)
Chuyển văn bản ghi chú thoại thành hướng dẫn mã bằng Whisper cục bộ hoặc nhận dạng giọng nói NVIDIA NIM.
Chat Bot (Tùy chọn)
Triển khai bot Discord hoặc Telegram sử dụng cùng một backend proxy cho các phiên lập trình từ xa.
Hướng Dẫn Bắt Đầu Nhanh
Bước 1: Cài Đặt Các Yêu Cầu
# Cài đặt uv (trình quản lý gói Python nhanh)
curl -LsSf https://astral.sh/uv/install.sh | sh
uv self update
# Cài đặt Python 3.14
uv python install 3.14
Bước 2: Sao Chép và Cấu Hình
git clone https://github.com/Alishahryar1/free-claude-code.git
cd free-claude-code
cp .env.example .env
Chỉnh sửa .env với nhà cung cấp đã chọn của bạn (xem ví dụ ở trên).
Bước 3: Khởi Động Proxy
uv run uvicorn server:app --host 0.0.0.0 --port 8082
Hoặc cài đặt như một công cụ:
uv tool install git+https://github.com/Alishahryar1/free-claude-code.git
fcc-init # Tạo cấu hình trong ~/.config/free-claude-code/
free-claude-code
Bước 4: Chạy Claude Code
# Bash/Linux/macOS
ANTHROPIC_AUTH_TOKEN="freecc" ANTHROPIC_BASE_URL="http://localhost:8082" claude
# PowerShell
$env:ANTHROPIC_AUTH_TOKEN="freecc"; $env:ANTHROPIC_BASE_URL="http://localhost:8082"; claude
Quan trọng: Trỏ ANTHROPIC_BASE_URL đến gốc proxy (http://localhost:8082), không phải /v1. Proxy xử lý định tuyến đường dẫn.
So Sánh Hiệu Suất
Tôi đã thử nghiệm Free Claude Code với các nhà cung cấp khác nhau trên một dự án Python quy mô trung bình:
| Nhà cung cấp | Mô hình | Độ trễ | Chất lượng | Chi phí/giờ |
|---|---|---|---|---|
| Anthropic (chính thức) | Claude 3.5 Sonnet | Nhanh | Xuất sắc | ~$5-15 |
| NVIDIA NIM | glm-4-9b | Trung bình | Tốt | Miễn phí* |
| OpenRouter | Claude 3.5 Sonnet | Nhanh | Xuất sắc | ~$3-8 |
| DeepSeek | DeepSeek-V3 | Nhanh | Rất tốt | ~$0.50-2 |
| Ollama (cục bộ) | Llama 3.1 8B | Tức thì | Tốt | $0 |
| LM Studio (cục bộ) | Qwen 2.5 Coder | Tức thì | Tốt | $0 |
*Tier miễn phí có giới hạn tốc độ. Phù hợp cho sử dụng cá nhân.
Kiến Trúc
Claude Code CLI → Anthropic Messages API → Free Claude Code Proxy → Backend Nhà Cung Cấp
↓
Lớp Dịch Thuật
(Định dạng OpenAI ↔ Anthropic)
Proxy duy trì giao thức phía máy khách của Claude Code trong khi dịch sang định dạng API của mỗi nhà cung cấp:
- Tương thích OpenAI (NVIDIA NIM) — dịch sang hoàn thành trò chuyện
- Tương thích Anthropic (OpenRouter, DeepSeek, cục bộ) — chuyển tiếp với điều chỉnh
Cân Nhắc Bảo Mật
- Lưu trữ token cục bộ — Khóa API được lưu trong
~/.config/free-claude-code/.envvới quyền 600 - Token xác thực — Đặt
ANTHROPIC_AUTH_TOKENthành bất kỳ bí mật nào; Claude Code sẽ gửi lại để xác minh - Không ghi log dữ liệu — Proxy không ghi lại mã hoặc cuộc trò chuyện của bạn (kiểm tra chính sách của nhà cung cấp cho phía họ)
- Mã nguồn mở — Tất cả mã đều có thể kiểm toán; không có phần mềm trung gian hộp đen
Hạn Chế
- Khoảng cách khả năng mô hình — Các mô hình miễn phí/cục bộ có thể gặp khó khăn với suy luận đa bước phức tạp so với Claude 3.5 Sonnet
- Cửa sổ ngữ cảnh — Các mô hình cục bộ thường có cửa sổ ngữ cảnh nhỏ hơn (4K-8K so với 200K của Claude)
- Độ tin cậy công cụ — Một số nhà cung cấp xử lý cuộc gọi công cụ khác nhau; kiểm tra kỹ lưỡng với quy trình làm việc của bạn
- Giới hạn tốc độ — Các tier miễn phí có giới hạn; người dùng nặng có thể cần nâng cấp hoặc chuyển đổi nhà cung cấp
Khi Nào Sử Dụng Cái Gì
| Kịch Bản | Nhà Cung Cấp Được Khuyến Nghị |
|---|---|
| Lập trình hàng ngày, ý thức ngân sách | DeepSeek hoặc NVIDIA NIM |
| Chất lượng mã tối đa | OpenRouter → Claude 3.5 Sonnet |
| Quyền riêng tư hoàn toàn | Ollama hoặc LM Studio (cục bộ) |
| Ngoại tuyến/môi trường cách ly | llama.cpp với trọng số đã tải xuống |
| Thử nghiệm/học tập | Tier miễn phí NVIDIA NIM |
Kết Luận
Free Claude Code là một bước đột phá đối với các nhà phát triển muốn có UX tuyệt vời của Claude Code mà không có chi phí API liên tục. Bằng cách định tuyến qua các tier miễn phí và mô hình cục bộ, bạn có thể giảm chi phí trợ lý lập trình AI của mình xuống không trong khi duy trì hầu hết các chức năng.
Dự án được duy trì tích cực, kiểm tra tốt (Pytest + CI), và hỗ trợ nhiều nhà cung cấp hơn bất kỳ công cụ tương tự nào tôi tìm thấy. Nếu bạn đang chi $50-200/tháng cho các cuộc gọi API Claude, proxy này sẽ hoàn vốn ngay lập tức.
GitHub: Alishahryar1/free-claude-code Giấy phép: MIT Python: 3.14 Trạng thái: Phát triển tích cực, do cộng đồng thúc đẩy
Bạn đã thử Free Claude Code chưa? Nhà cung cấp nào phù hợp nhất với quy trình làm việc của bạn? Chia sẻ kinh nghiệm của bạn trong phần bình luận.