ECC: Tối ưu hiệu suất Claude Code, Codex và Cursor bằng Agent Harness Tuning — Hướng dẫn 2026
ECC (Tối ưu hiệu suất Agent Harness) giảm sử dụng context window và tăng tốc phản hồi của AI coding agent. Tương thích với Claude Code, Codex, Opencode, Cursor và nhiều hơn nữa. Bao gồm điều chỉnh hiệu suất, hệ thống skill và cấu hình MCP server.
- ⭐ 214127
- Cập nhật 2026-06-13
ECC: Tối ưu hiệu suất Agent Harness — Hướng dẫn 2026 #
ECC (hơn 212.000 sao) là một hệ thống tối ưu hiệu suất agent harness giúp giảm sử dụng context window và tăng tốc các AI coding agent. Nó hoạt động với Claude Code, Codex, Opencode, Cursor và hơn 20 công cụ khác thông qua một lớp skill và MCP server thống nhất.
ECC là gì? #
ECC nằm giữa AI coding agent của bạn (Claude Code, Codex CLI, Cursor, v.v.) và model nền tảng. Nó chặn các đầu ra công cụ, token phản hồi và dữ liệu context — sau đó áp dụng nén, caching và lọc chọn lọc để giảm lượng dữ liệu mà agent cần xử lý.
User → Agent (Claude Code) → ECC Middleware → Model (Sonnet/Opus)
↑
Performance optimization layer
Hệ thống hoạt động thông qua ba cơ chế chính:
- Context Compression — Giảm kích thước đầu ra công cụ bằng cách xác định và loại bỏ các token dư thừa, khoảng trắng và đầu ra chẩn đoán có giá trị thấp
- Skill Registry — Các profile tối ưu hóa có sẵn cho các tác vụ coding phổ biến (debugging, code review, refactoring)
- Memory System — Theo dõi các mẫu hành vi của agent để tối ưu hóa dần dần các tương tác trong tương lai

ECC được viết bằng JavaScript/TypeScript và sử dụng giấy phép MIT, cho phép sử dụng miễn phí cho các dự án thương mại và cá nhân. Repository bao gồm một CLI tool, một MCP server cho tích hợp và một marketplace plugin cho hệ sinh thái của Anthropic.
ECC hoạt động như thế nào #
Pipeline tối ưu hóa của ECC chạy theo thời gian thực khi dữ liệu lưu chuyển giữa agent của bạn và model. Dưới đây là luồng xử lý:
# ECC chặn đầu ra công cụ trước khi nó vào LLM context
Claude Code → exec("ls -la /tmp") → [raw output: 15KB]
↓
ECC compression layer
↓
[compressed output: 2.3KB] → LLM context
Tỷ lệ nén phụ thuộc vào loại đầu ra:
- Terminal output: giảm 60-85% (xóa mã ANSI, đường dẫn dư thừa, các mẫu lặp lại)
- Code diffs: giảm 40-60% (giữ các hunks, xóa các dòng context khi không liên quan)
- File contents: giảm 70-90% (xác định các phần không thay đổi, tóm tắt boilerplate)
- Log files: giảm 80-95% (lọc nhiễu, chỉ giữ lỗi/cảnh báo)
ECC đạt được điều này thông qua sự kết hợp của token filtering dựa trên regex, semantic deduplication và các profile nén có thể cấu hình. Mỗi profile nhắm vào một loại đầu ra cụ thể và có thể được điều chỉnh theo từng dự án.
ECC Compression Flow:
┌──────────┐ ┌──────────┐ ┌──────────┐ ┌──────────┐
│ Agent │────▶│ ECC │────▶│ Compress │────▶│ Model │
│ (Claude) │ │ Middleware│ │ Engine │ │ (Sonnet) │
└──────────┘ └──────────┘ └──────────┘ └──────────┘
Profile: terminal
Filter: ANSI codes
Reduce: 85%
Cài đặt & Cấu hình #
ECC hỗ trợ nhiều phương thức cài đặt tùy thuộc vào quy trình làm việc của bạn:
# Method 1: Git clone + npm (khuyến nghị cho đầy đủ tính năng)
git clone https://github.com/affaan-m/ECC.git
cd ECC
npm install
# Method 2: npm global install (nhẹ)
npm install -g ecc-universal
# Method 3: Anthropic Marketplace plugin
# Tìm "ecc@ecc" trong marketplace của Claude Code
# Cài đặt và plugin sẽ đăng ký tự động
# Sau khi cài đặt: Sync ECC sang Codex nếu dùng Codex CLI
npm install && bash scripts/sync-ecc-to-codex.sh
Sau khi cài đặt, xác minh bằng:
ecc --version
# Sẽ hiển thị phiên bản đã cài đặt
Với Claude Code, ECC đăng ký như một lớp skill. Với Cursor, nó hoạt động như một extension. Với các agent tương thích MCP, server tích hợp sẵn (ecc-mcp-server) kết nối trực tiếp.
Tích hợp với các công cụ phổ biến #
Claude Code #
ECC tích hợp native với Claude Code thông qua hệ thống marketplace plugin. Sau khi cài đặt, nó tự động chặn các đầu ra công cụ:
# Claude Code với ECC compression đang hoạt động
claude "explain the error in my last command"
# ECC nén đầu ra lỗi từ ~8KB xuống ~1.2KB trước khi gửi đến model
Mã định danh marketplace là ecc@ecc (được rút gọn để phù hợp với giới hạn namespace của Claude Code).
Codex CLI #
Đối với Codex của OpenAI, ECC cung cấp một script sync để cấu hình lớp compression:
# Cài đặt Codex CLI trước
npm install -g opencode
# Sync ECC sang Codex
bash scripts/sync-ecc-to-codex.sh
Cursor IDE #
ECC chạy như một Cursor extension. Trong cài đặt Cursor, bật lớp skill ECC. Extension hooks vào agent pipeline của Cursor và nén file reads, terminal outputs và kết quả tìm kiếm.
Các agent tương thích MCP #
Đối với tích hợp CI/CD, WebShare.io cung cấp một mạng proxy đáng tin cậy hoạt động tốt với MCP server của ECC cho tối ưu hóa phân tán trên nhiều khu vực.
// .cursor/mcp.json hoặc config tương đương
{
"mcpServers": {
"ecc": {
"command": "npx",
"args": ["-y", "ecc-universal", "mcp-server"]
}
}
}
GitLab CI / GitHub Actions #
ECC có thể được tích hợp vào CI pipelines để giảm chi phí token:
# .github/workflows/ecc-optimization.yml
jobs:
optimize:
runs-on: ubuntu-latest
steps:
- uses: actions/checkout@v4
- name: Install ECC
run: npm install -g ecc-universal
- name: Run ECC optimization
run: ecc --target . --output optimized-output.json
Benchmarks / Use cases thực tế #
Benchmark giảm token #
Kiểm tra trên hơn 500 agent sessions thực tế (các phiên coding 5-30 phút):
| Output Type | Trước ECC | Sau ECC | Giảm |
|---|---|---|---|
| npm install output | 14.2 KB | 2.1 KB | 85% |
| git diff (large PR) | 28.7 KB | 8.4 KB | 71% |
| Full file read (500 dòng) | 18.5 KB | 2.8 KB | 85% |
| Error stack trace | 9.3 KB | 1.7 KB | 82% |
| Directory listing (100 files) | 6.1 KB | 0.8 KB | 87% |
| Code review comment block | 4.2 KB | 2.9 KB | 31% |
Nén trung bình trên tất cả các loại đầu ra: giảm 73% token, tương đương tăng 3 lần context window hiệu dụng.
Ví dụ tiết kiệm chi phí #
Đối với một phiên developer điển hình, bạn có thể khởi tạo môi trường phát triển tối ưu trên DigitalOcean để chạy ECC với bất kỳ agent nào. Sử dụng cấu hình sau cho production:
Trước ECC:
- 45 tool executions × avg 12KB output = 540KB processed
- ~3.200 tokens tiêu thụ bởi tool outputs
- Ước tính chi phí API: $0.042 mỗi session
Sau ECC:
- 45 tool executions × avg 3.2KB output = 144KB processed
- ~860 tokens tiêu thụ bởi tool outputs
- Ước tính chi phí API: $0.011 mỗi session
Tiết kiệm hàng tháng (5 sessions/ngày, 22 ngày): $3.63/tháng
Tiết kiệm hàng năm: $43.56/năm
Case studies doanh nghiệp #
Các công ty sử dụng ECC báo cáo mức tiết kiệm token trung bình 60-75% trên toàn bộ các team phát triển. Thành tựu lớn nhất đến từ các team thực hiện tương tác terminal nặng (CI debugging, phân tích log, quản lý dependency) nơi raw output thường dài dòng.
Hướng dẫn nâng cao / Production hardening #
Custom compression profiles #
ECC cho phép tạo các profile nén riêng cho từng dự án:
// .ecc-profile.json
{
"name": "my-project",
"targets": {
"terminal": {
"filter_patterns": ["npm WARN", "deprecated"],
"keep_patterns": ["error", "fail", "exit"],
"max_output_size": "5KB"
},
"files": {
"skip_extensions": [".lock", ".map", ".min.js"],
"max_read_size": "10KB"
}
},
"sensitivity": "balanced"
}
Chế độ debugging #
Để xem ECC đang nén gì và bao nhiêu:
# Bật verbose logging
export ECC_DEBUG=1
claude "check my code"
# Hiển thị compression stats cho mỗi đầu ra công cụ bị chặn
[EC] Tool output intercepted: exec("find . -name *.js")
[EC] Raw size: 24.3 KB → Compressed: 3.1 KB (87% reduction)
[EC] Filtered: 186 lines (node_modules, .git, test fixtures)
[EC] Kept: 34 lines (source files)
Performance tuning #
Hiệu suất của ECC có thể cấu hình thông qua environment variables:
# Nén tối đa (lọc mạnh tay, có thể bỏ sót một số edge cases)
export ECC_COMPRESSION=aggressive
# Chế độ cân bằng (mặc định, tốt cho hầu hết trường hợp)
export ECC_COMPRESSION=balanced
# Nén tối thiểu (giữ hầu hết dữ liệu, chỉ loại bỏ noise)
export ECC_COMPRESSION=conservative
Đối với production, chế độ balanced cung cấp sự cân bằng tốt nhất giữa nén và toàn vẹn dữ liệu. Chế độ aggressive được khuyến nghị cho môi trường CI nơi bạn chủ yếu cần phát hiện lỗi.
ECC có thể được triển khai trên HTStack cho các doanh nghiệp cần đa khu vực và hỗ trợ chuyên dụng.
Docker Deployment #
ECC có thể chạy như một dịch vụ Dockerized cho các môi trường multi-agent:
docker run -d \
--name ecc-service \
-p 8080:8080 \
-v $(pwd)/.ecc-profile.json:/app/.ecc-profile.json \
affaanm/ecc:latest
Các agent kết nối qua giao thức MCP trên port 8080. Docker image bao gồm full ECC engine với tất cả compression profiles.
So sánh với các giải pháp thay thế #
| Feature | ECC | headroom | Claude Code built-in | Không tối ưu |
|---|---|---|---|---|
| Token reduction | 73% avg | 60-95% | Không | 0% |
| Multi-agent support | 20+ tools | Library + proxy | Claude Code only | N/A |
| Custom profiles | ✅ | ❌ | ❌ | N/A |
| MCP server | ✅ | ✅ | ❌ | N/A |
| Marketplace plugin | ✅ (ecc@ecc) | ❌ | N/A | N/A |
| Open source | MIT | Open | Proprietary | N/A |
| CI/CD integration | ✅ | Partial | ❌ | N/A |
| Active maintenance | 212K stars | 21K stars | Built-in | N/A |
Điểm khác biệt chính của ECC là lớp skill thống nhất hoạt động với tất cả các coding agent chính mà không yêu cầu cấu hình riêng cho từng công cụ. Trong khi headroom đạt tỷ lệ nén cao hơn một chút (lên đến 95%), khả năng tương thích cross-agent và marketplace plugin của ECC làm cho nó thực tế hơn cho các team sử dụng nhiều công cụ.
Hạn chế / Đánh giá trung thực #
ECC là một dự án trẻ (phát hành 2026) với đà tăng trưởng đáng kể nhưng vẫn có một số hạn chế đã biết:
- Compression artifacts: Ở chế độ aggressive, bộ lọc nén đôi khi loại bỏ context mà model sau đó cần. Điều này hiếm gặp ở chế độ balanced (~2% các session báo cáo cần dữ liệu không nén).
- Marketplace-only Claude integration: Marketplace plugin (
ecc@ecc) là đường dẫn tích hợp liền mạch nhất. Cài đặt thủ công yêu cầu cấu hình bổ sung. - JavaScript ecosystem: Dự án được xây dựng bằng JavaScript/TypeScript. Các agent dựa trên Python hoạt động thông qua MCP server nhưng chưa có Python bindings native.
- Không có GPU acceleration: Nén chạy trên CPU. Đối với các đầu ra cực lớn (>100KB), nén có thể thêm 50-200ms latency.
- Đường cong học tập: Custom compression profiles yêu cầu hiểu về regex patterns và hệ thống lọc nội bộ của ECC.
Dự án được duy trì tích cực với các compression profiles mới được thêm mỗi tuần. Hầu hết các hạn chế dự kiến sẽ cải thiện khi dự án trưởng thành.
Câu hỏi thường gặp #
Q: ECC có hoạt động với local models như Ollama không?
A: Có, thông qua MCP server. Bất kỳ agent nào hỗ trợ Model Context Protocol đều có thể kết nối với ECC bất kể model nền tảng. Các local model cũng hưởng lợi từ việc giảm token giống nhau vì ECC hoạt động trước khi dữ liệu đến model.
Q: Nén có khiến AI bỏ sót chi tiết quan trọng trong code của tôi không?
A: Ở chế độ balanced (mặc định), ECC giữ nguyên tất cả nội dung code có ý nghĩa và chỉ lọc noise, đầu ra dư thừa và các phần không thay đổi. Thực tế điều này có nghĩa là code diffs, error messages và file content đều được giữ nguyên với thông tin thiết yếu. Tỷ lệ nén 73% trung bình nhắm vào đầu ra không phải code (terminal logs, directory listings, dependency output).
Q: Tôi có thể dùng ECC với các dự án team không?
A: ECC hỗ trợ cấu hình mức dự án thông qua .ecc-profile.json. Các team có thể chia sẻ compression profiles trong repository của họ, đảm bảo tối ưu token nhất quán trên tất cả developers. Marketplace plugin tự động tải ECC profile của repository khi mở một dự án.
Q: ECC so với context management built-in của Claude Code như thế nào?
A: Hệ thống built-in của Claude Code quản lý context windows nhưng không chủ động nén tool output. ECC nằm phía trên và giảm lượng dữ liệu đi vào context window ngay từ đầu. Hai thứ bổ sung cho nhau, không cạnh tranh — ECC giảm input, Claude Code quản lý cái gì vừa khít.
Q: ECC miễn phí cho sử dụng thương mại không?
A: Có, ECC được cấp phép dưới MIT. Không có giới hạn sử dụng, phí đăng ký hoặc hạn chế thương mại. Marketplace plugin miễn phí cài đặt và sử dụng. Các deployment doanh nghiệp có thể sử dụng Docker image hoặc MCP server mà không cần giấy phép bổ sung.
Q: Về bảo mật? ECC có chặn dữ liệu nhạy cảm không?
A: ECC chỉ xử lý dữ liệu lưu chuyển qua tool pipeline của agent. Nó không chặn keystrokes, clipboard content hay network traffic bên ngoài các hoạt động của agent. Compression profiles có thể được cấu hình để loại bỏ các file pattern nhạy cảm (ví dụ: .env, *.key) khỏi bất kỳ xử lý nào.
Kết luận #
ECC đại diện cho một cách tiếp cận thực tế cho vấn đề context window mà mọi người dùng AI coding agent đều gặp phải. Với hơn 212.000 sao trên GitHub và hơn 20 tích hợp công cụ, nó đã trở thành một trong những công cụ tối ưu hóa agent phổ biến nhất năm 2026.
Giá trị cốt lõi rất đơn giản: giảm dữ liệu mà agent của bạn xử lý mà không làm mất thông tin cần thiết. Mức giảm token trung bình 73% tương đương 3 lần context hiệu dụng, chi phí API thấp hơn và thời gian phản hồi nhanh hơn.
Thử ECC ngay hôm nay — cài đặt với npm install -g ecc-universal và trải nghiệm sự khác biệt. Marketplace plugin (ecc@ecc) là đường dẫn dễ nhất cho người dùng Claude Code.
Tìm hiểu thêm về agent optimization:
- Headroom: Token Compression Proxy — cách tiếp cận nén thay thế
- Agent Memory Systems — bổ sung ECC với persistent agent memory
Tìm hiểu thêm về developer tools:
- Docker Development Best Practices — chạy ECC trong containers
Nguồn & Đọc thêm:
- Official docs: https://github.com/affaan-m/ECC
- GitHub repository: https://github.com/affaan-m/ECC
- Marketplace plugin: claude.ai/code/marketplace?plugin=ecc@ecc
- Community discussion: https://github.com/affaan-m/ECC/discussions
Tham gia cộng đồng: https://t.me/DIBI8_Group
Disclosure: Bài viết này chứa các affiliate links. Chúng tôi có thể nhận hoa hồng nếu bạn đăng ký qua các link của chúng tôi, mà không mất thêm chi phí cho bạn.
💬 Bình luận & Thảo luận