Vấn Đề: Claude Code Đắt Đỏ

Claude Code là một trong những trợ lý lập trình AI tốt nhất hiện có. Nó tích hợp trực tiếp vào terminal của bạn, hiểu ngữ cảnh codebase, và có thể thực thi lệnh, chỉnh sửa tệp và gỡ lỗi một cách tự chủ.

Nhưng có một vấn đề: nó yêu cầu khóa API Anthropic, và các cuộc gọi API Claude 3.5 Sonnet / Claude 3 Opus có thể tốn $3-15 mỗi giờ lập trình tích cực. Đối với các nhà phát triển sử dụng trợ lý AI hàng ngày, chi phí này tích lũy nhanh chóng.

Free Claude Code giải quyết vấn đề này bằng cách hoạt động như một proxy thay thế giữa Claude Code CLI và các nhà cung cấp AI miễn phí hoặc chi phí thấp.

Free Claude Code Là Gì?

Free Claude Code là một máy chủ proxy Python mã nguồn mở được tạo bởi Ali Shahryar . Nó chặn các yêu cầu API Anthropic Messages từ Claude Code và chuyển tiếp chúng đến các backend AI thay thế cung cấp tier miễn phí hoặc thực thi cục bộ.

Công nghệ xây dựng dự án:

  • Python 3.14 — Python mới nhất với cải tiến hiệu suất
  • uv — trình quản lý gói Python nhanh của Astral
  • FastAPI + Uvicorn — máy chủ web async hiệu suất cao
  • Pydantic — xác thực kiểu nghiêm ngặt
  • Loguru — ghi log có cấu trúc
  • Ruff — công cụ kiểm tra và định dạng Python nhanh

Các Nhà Cung Cấp AI Được Hỗ Trợ

Free Claude Code hỗ trợ 6 backend khác nhau, cho phép bạn chọn dựa trên chi phí, tốc độ, quyền riêng tư hoặc sở thích mô hình:

Nhà cung cấpChi phíPhù hợp nhất choĐộ phức tạp thiết lập
NVIDIA NIMCó tier miễn phíSản xuất, suy luận nhanhCần khóa API
OpenRouterTrả theo lượng sử dụngTruy cập nhiều mô hìnhCần khóa API
DeepSeekRất rẻNhà phát triển có ngân sáchCần khóa API
LM StudioMiễn phí (cục bộ)Quyền riêng tư, sử dụng ngoại tuyếnỨng dụng GUI cục bộ
llama.cppMiễn phí (cục bộ)Kiểm soát tối đa, mô hình tùy chỉnhDòng lệnh
OllamaMiễn phí (cục bộ)Thiết lập cục bộ dễ nhấtCài đặt đơn giản

NVIDIA NIM (Khuyến nghị cho Tier Miễn Phí)

NVIDIA cung cấp một tier miễn phí hào phóng thông qua nền tảng NIM (NVIDIA Inference Microservices) của họ. Bạn có thể chạy các mô hình như glm-4-9b hoặc llama-3.1-8b miễn phí với giới hạn tốc độ phù hợp cho phát triển cá nhân.

Thiết lập:

  1. Lấy khóa API tại build.nvidia.com
  2. Cấu hình .env:
    NVIDIA_NIM_API_KEY="nvapi-your-key"
    MODEL="nvidia_nim/z-ai/glm4.7"
    ANTHROPIC_AUTH_TOKEN="freecc"
    

OpenRouter

OpenRouter cung cấp quyền truy cập thống nhất vào hàng trăm mô hình bao gồm Claude, GPT-4, Gemini và các lựa chọn thay thế mã nguồn mở. Chỉ trả tiền cho những gì bạn sử dụng.

Thiết lập:

OPENROUTER_API_KEY="sk-or-your-key"
MODEL="open_router/anthropic/claude-3.5-sonnet"

DeepSeek

DeepSeek cung cấp mức giá cực kỳ cạnh tranh (thường rẻ hơn Anthropic 10 lần) với hiệu suất lập trình mạnh mẽ.

Thiết lập:

DEEPSEEK_API_KEY="sk-your-key"
MODEL="deepseek/deepseek-chat"

Tùy Chọn Cục Bộ (LM Studio, llama.cpp, Ollama)

Để có quyền riêng tư hoàn toàn và chi phí không đồng, hãy chạy mô hình cục bộ:

Ollama (Dễ nhất):

# Cài đặt Ollama
ollama pull llama3.1
ollama serve
OLLAMA_BASE_URL="http://localhost:11434"
MODEL="ollama/llama3.1"

LM Studio: Tải xuống LM Studio , tải một mô hình, và nó sẽ tự động chạy máy chủ API cục bộ.

LMSTUDIO_BASE_URL="http://localhost:1234/v1"
MODEL="lmstudio/your-loaded-model"

Các Tính Năng Chính

Định Tuyến Theo Mô Hình

Cấu hình các nhà cung cấp khác nhau cho các tier mô hình Claude khác nhau:

# Yêu cầu Opus → OpenRouter (chất lượng tốt nhất)
MODEL_OPUS="open_router/anthropic/claude-3-opus"

# Yêu cầu Sonnet → NVIDIA NIM (tier miễn phí)
MODEL_SONNET="nvidia_nim/z-ai/glm4.7"

# Yêu cầu Haiku → Ollama (cục bộ, tức thì)
MODEL_HAIKU="ollama/llama3.1"

Bộ chọn /model của Claude Code hoạt động tự nhiên thông qua điểm cuối /v1/models của proxy.

Hỗ Trợ Streaming

Truyền token thời gian thực hoạt động giống hệt API Anthropic chính thức. Bạn thấy mã được nhập từng ký tự một.

Sử Dụng Công Cụ

Cuộc gọi hàm của Claude Code (thao tác tệp, thực thi lệnh) hoạt động thông qua proxy. Proxy dịch định dạng công cụ Anthropic sang định dạng gốc của mỗi nhà cung cấp.

Khối Suy Luận/Suy Nghĩ

Đối với các mô hình hỗ trợ suy luận chuỗi suy nghĩ (như DeepSeek-R1), proxy trích xuất và định dạng các khối suy nghĩ một cách chính xác.

Ghi Chú Thoại (Tùy chọn)

Chuyển văn bản ghi chú thoại thành hướng dẫn mã bằng Whisper cục bộ hoặc nhận dạng giọng nói NVIDIA NIM.

Chat Bot (Tùy chọn)

Triển khai bot Discord hoặc Telegram sử dụng cùng một backend proxy cho các phiên lập trình từ xa.

Hướng Dẫn Bắt Đầu Nhanh

Bước 1: Cài Đặt Các Yêu Cầu

# Cài đặt uv (trình quản lý gói Python nhanh)
curl -LsSf https://astral.sh/uv/install.sh | sh
uv self update

# Cài đặt Python 3.14
uv python install 3.14

Bước 2: Sao Chép và Cấu Hình

git clone https://github.com/Alishahryar1/free-claude-code.git
cd free-claude-code
cp .env.example .env

Chỉnh sửa .env với nhà cung cấp đã chọn của bạn (xem ví dụ ở trên).

Bước 3: Khởi Động Proxy

uv run uvicorn server:app --host 0.0.0.0 --port 8082

Hoặc cài đặt như một công cụ:

uv tool install git+https://github.com/Alishahryar1/free-claude-code.git
fcc-init  # Tạo cấu hình trong ~/.config/free-claude-code/
free-claude-code

Bước 4: Chạy Claude Code

# Bash/Linux/macOS
ANTHROPIC_AUTH_TOKEN="freecc" ANTHROPIC_BASE_URL="http://localhost:8082" claude

# PowerShell
$env:ANTHROPIC_AUTH_TOKEN="freecc"; $env:ANTHROPIC_BASE_URL="http://localhost:8082"; claude

Quan trọng: Trỏ ANTHROPIC_BASE_URL đến gốc proxy (http://localhost:8082), không phải /v1. Proxy xử lý định tuyến đường dẫn.

So Sánh Hiệu Suất

Tôi đã thử nghiệm Free Claude Code với các nhà cung cấp khác nhau trên một dự án Python quy mô trung bình:

Nhà cung cấpMô hìnhĐộ trễChất lượngChi phí/giờ
Anthropic (chính thức)Claude 3.5 SonnetNhanhXuất sắc~$5-15
NVIDIA NIMglm-4-9bTrung bìnhTốtMiễn phí*
OpenRouterClaude 3.5 SonnetNhanhXuất sắc~$3-8
DeepSeekDeepSeek-V3NhanhRất tốt~$0.50-2
Ollama (cục bộ)Llama 3.1 8BTức thìTốt$0
LM Studio (cục bộ)Qwen 2.5 CoderTức thìTốt$0

*Tier miễn phí có giới hạn tốc độ. Phù hợp cho sử dụng cá nhân.

Kiến Trúc

Claude Code CLI → Anthropic Messages API → Free Claude Code Proxy → Backend Nhà Cung Cấp
                                              Lớp Dịch Thuật
                                              (Định dạng OpenAI ↔ Anthropic)

Proxy duy trì giao thức phía máy khách của Claude Code trong khi dịch sang định dạng API của mỗi nhà cung cấp:

  • Tương thích OpenAI (NVIDIA NIM) — dịch sang hoàn thành trò chuyện
  • Tương thích Anthropic (OpenRouter, DeepSeek, cục bộ) — chuyển tiếp với điều chỉnh

Cân Nhắc Bảo Mật

  • Lưu trữ token cục bộ — Khóa API được lưu trong ~/.config/free-claude-code/.env với quyền 600
  • Token xác thực — Đặt ANTHROPIC_AUTH_TOKEN thành bất kỳ bí mật nào; Claude Code sẽ gửi lại để xác minh
  • Không ghi log dữ liệu — Proxy không ghi lại mã hoặc cuộc trò chuyện của bạn (kiểm tra chính sách của nhà cung cấp cho phía họ)
  • Mã nguồn mở — Tất cả mã đều có thể kiểm toán; không có phần mềm trung gian hộp đen

Hạn Chế

  • Khoảng cách khả năng mô hình — Các mô hình miễn phí/cục bộ có thể gặp khó khăn với suy luận đa bước phức tạp so với Claude 3.5 Sonnet
  • Cửa sổ ngữ cảnh — Các mô hình cục bộ thường có cửa sổ ngữ cảnh nhỏ hơn (4K-8K so với 200K của Claude)
  • Độ tin cậy công cụ — Một số nhà cung cấp xử lý cuộc gọi công cụ khác nhau; kiểm tra kỹ lưỡng với quy trình làm việc của bạn
  • Giới hạn tốc độ — Các tier miễn phí có giới hạn; người dùng nặng có thể cần nâng cấp hoặc chuyển đổi nhà cung cấp

Khi Nào Sử Dụng Cái Gì

Kịch BảnNhà Cung Cấp Được Khuyến Nghị
Lập trình hàng ngày, ý thức ngân sáchDeepSeek hoặc NVIDIA NIM
Chất lượng mã tối đaOpenRouter → Claude 3.5 Sonnet
Quyền riêng tư hoàn toànOllama hoặc LM Studio (cục bộ)
Ngoại tuyến/môi trường cách lyllama.cpp với trọng số đã tải xuống
Thử nghiệm/học tậpTier miễn phí NVIDIA NIM

Kết Luận

Free Claude Code là một bước đột phá đối với các nhà phát triển muốn có UX tuyệt vời của Claude Code mà không có chi phí API liên tục. Bằng cách định tuyến qua các tier miễn phí và mô hình cục bộ, bạn có thể giảm chi phí trợ lý lập trình AI của mình xuống không trong khi duy trì hầu hết các chức năng.

Dự án được duy trì tích cực, kiểm tra tốt (Pytest + CI), và hỗ trợ nhiều nhà cung cấp hơn bất kỳ công cụ tương tự nào tôi tìm thấy. Nếu bạn đang chi $50-200/tháng cho các cuộc gọi API Claude, proxy này sẽ hoàn vốn ngay lập tức.

GitHub: Alishahryar1/free-claude-code Giấy phép: MIT Python: 3.14 Trạng thái: Phát triển tích cực, do cộng đồng thúc đẩy


Bạn đã thử Free Claude Code chưa? Nhà cung cấp nào phù hợp nhất với quy trình làm việc của bạn? Chia sẻ kinh nghiệm của bạn trong phần bình luận.