Claude Code 토큰 비용 65% 절감: Caveman 스킬 완벽 가이드

🪨 “왜 많은 토큰 쓰나? 적은 토큰으로도 됨”
— GitHub 57,003 Star, Claude Code 공식 스킬

AI 코딩 에이전트를 매일 쓰는 개발자라면 한 가지 고민이 있습니다. 토큰 비용. Claude Code, Cursor, Windsurf, Cline… 도구는 좋은데 답변이 길어질수록 지갑이 얇아집니다. 오늘 소개할 Caveman은 이 문제를 단숨에 해결하는 Claude Code 스킬입니다. 설치는 1줄, 효과는 평균 65% 토큰 절감. 기술적 정확도는 그대로 유지하면서 말이죠.


Caveman이란?

Caveman은 JuliusBrussee 가 만든 Claude Code 스킬로, AI의 출력 토큰을 구석기인 말투로 압축합니다. 문법을 과감히 생략하고, 관사(article)를 버리고, 핵심만 짚어 말하는 방식입니다. 이게 단순 개그가 아닙니다. 실제 벤치마크에서 평균 65%, 최대 87%의 토큰 절감을 기록했으며, 기술적 정확도는 100% 유지됩니다.

  • GitHub Stars: 57,003
  • 커밋 수: 156+
  • 지원 에이전트: 30+ (Claude Code, Cursor, Windsurf, Cline, Copilot, Gemini CLI, Codex, Continue, Roo, Augment, Aider, Goose, Warp, Replit Agent 등)
  • 공식 사이트: getcaveman.dev

왜 Caveman을 써야 할까?

1. 비용 절감 (평균 65%)

출력 토큰이 줄면 API 비용이 그만큼 줄어듭니다. 벤치마크 결과는 놀랍습니다.

작업일반 (토큰)Caveman (토큰)절감률
React 리렌더 버그 설명1,18015987%
Auth 미들웨어 토큰 만료 수정70412183%
PostgreSQL 커넥션 풀 설정2,34738084%
Git rebase vs merge 설명70229258%
Callback → async/await 리팩토링38730122%
마이크로서비스 vs 모놀리식 설계44631030%
PR 보안 이슈 리뷰67839841%
Docker 멀티스테이지 빌드1,04229072%
PostgreSQL 레이스 컨디션 디버깅1,20023281%
React Error Boundary 구현3,45445687%
평균1,21429465%

범위: 22%~87% 절감. Caveman은 출력 토큰만 줄입니다. 사고/추론 토큰은 건드리지 않습니다.

2. 응답 속도 ~3배 향상

생성할 토큰이 적어지니 응답 속도가 획기적으로 빨라집니다. 긴 기술 문서 설명도 순식간에 끝납니다.

3. 가독성 상승

“장황한 답변의 벽” 대신 핵심만 콕콕 짚어주는 스타일. 오히려 읽기 쉽고, 기억에도 잘 남습니다.

4. 정확도 유지 — 심지어 개선

2026년 3월 논문 “Brevity Constraints Reverse Performance Hierarchies in Language Models” 에 따르면, 대형 모델에게 간결한 응답을 강제하면 정확도가 26%p 향상되고 성능 순위가 완전히 뒤집힌다고 합니다. 장황함이 항상 정답은 아닙니다.

5. 재미

코드 리뷰가 코미디가 됩니다. 매일 쓰는 도구가 지루하지 않다는 건 큰 장점입니다.


설치 방법 (1줄)

Caveman은 30개 이상의 AI 에이전트를 자동 감지하고, 각자의 네이티브 방식으로 설치합니다. 없는 에이전트는 스킵하고, 재실행해도 안전합니다.

macOS / Linux / WSL / Git Bash

1curl -fsSL https://raw.githubusercontent.com/JuliusBrussee/caveman/main/install.sh | bash

Windows (PowerShell)

1irm https://raw.githubusercontent.com/JuliusBrussee/caveman/main/install.ps1 | iex

설치 옵션

플래그설명
--all플러그인 + 후크 + 상태줄 + MCP shrink + 현재 디렉토리 규칙 파일. 풀 패키지.
--minimal플러그인/확장만. 후크, MCP shrink, 규칙 파일 제외.
--dry-run미리보기. 실제로 아무것도 쓰지 않음.
--only <agent>특정 에이전트만 설치 (반복 가능).
--with-hooksClaude Code 단독 후크 + 상태줄 + 통계 배지 연결. 기본 ON.
--with-mcp-shrinkMCP shrink 미들웨어 등록. 기본 ON.

사용법: 3단계 강도

Caveman은 상황에 따라 3단계 강도를 선택할 수 있습니다.

레벨명령어효과
Lite/caveman lite필러 제거, 문법 유지. 프로페셔널하지만 장황함 없음.
Full/caveman full기본 Caveman. 관사 제거, 단편문, 완전한 그런트 스타일.
Ultra/caveman ultra최대 압축. 전보체. 모든 것을 축약.

Before / After 예시

일반:

“In order to resolve the React re-rendering issue, you should consider memoizing the component using React.memo or implementing a custom comparison function with useMemo to prevent unnecessary re-renders when the props haven’t actually changed.”

Caveman Full:

“React re-render bug. Fix: wrap in React.memo. Props same? No render. Done.”

Caveman Ultra:

“Rerender bug. React.memo. Props diff? Skip render.”

같은 기술 정보. 토큰은 1/4~1/8.


Caveman 스킬 모음

스킬기능
/caveman-commit간결한 커밋 메시지. Conventional Commits, 제목 50자 이내.
/caveman-review한 줄 PR 코멘트: L42: 🔴 bug: user null. Add guard.
/caveman-help빠른 참조 카드. 모든 모드, 스킬, 명령어.
/caveman-stats실제 세션 토큰 사용량 + 추정 절감액 + USD. --all로 누적, --since 7d로 기간 필터, --share로 트윗용 한 줄.
/caveman:compress <file>메모리 파일(예: CLAUDE.md)을 Caveman 말투로 재작성. 백업은 <file>.original.md. 세션 시작 시 입력 토큰 ~46% 절감.

Caveman Subagents (Claude Code 전용)

서브에이전트역할
cavecrew-investigator읽기 전용 로케이터. 하이쿠 스타일.
cavecrew-builder1~2개 파일 수술적 편집. 3개 이상 거부.
cavecrew-reviewer한 줄 발견 사항. 하이쿠.

서브에이전트 출력은 메인 컨텍스트에 주입됩니다. 기본 Explore/리뷰어 에이전트보다 ~60% 적은 토큰을 사용해 긴 세션에서 메인 컨텍스트를 오래 유지합니다.

상태줄 절감 배지

기본 ON. /caveman-stats 첫 실행 후 상태줄에 [CAVEMAN] ⛏ 12.4k (누적 절감 토큰)가 표시되고, 실행할 때마다 갱신됩니다. 끄려면 CAVEMAN_STATUSLINE_SAVINGS=0.


caveman-shrink: MCP 미들웨어

Caveman은 MCP 서버를 감싸는 stdio 프록시 caveman-shrink도 제공합니다. tools/list, prompts/list, resources/list 응답의 description 필드를 압축합니다. 코드, URL, 경로, 식별자는 바이트 단위 그대로 유지.

1{
2  "mcpServers": {
3    "fs-shrunk": {
4      "command": "npx",
5      "args": ["caveman-shrink", "npx", "@modelcontextprotocol/server-filesystem", "/path/to/dir"]
6    }
7  }
8}

npm 패키지: caveman-shrink . V1은 툴콜 응답 본문이나 요청 페이로드는 건드리지 않습니다. install.sh가 자동 등록합니다(--minimal로 스킵).


과학적 근거

2026년 3월 발표된 논문 “Brevity Constraints Reverse Performance Hierarchies in Language Models” (arXiv:2604.00025)는 다음을 입증했습니다:

  • 간결한 응답 제약 시 특정 벤치마크에서 정확도 26%p 향상
  • 성능 계층 구조가 완전히 역전됨
  • 장황함 ≠ 정확함

Caveman은 이 원리를 실제 코딩 워크플로우에 적용한 도구입니다.


자주 묻는 질문 (FAQ)

Q: Caveman은 생각/추론 토큰도 줄이나요?
A: 아닙니다. 출력 토큰만 줄입니다. AI의 “머리"는 그대로 두고 “입"만 작게 만듭니다.

Q: 기술 정보가 손실되나요?
A: 벤치마크상 100% 정확도 유지. 코드, URL, 경로, 식별자는 바이트 단위 보존.

Q: 한국어로도 작동하나요?
A: Claude Code 스킬은 언어에 구애받지 않습니다. Caveman의 “말투 규칙"은 한국어 출력에도 동일하게 적용되어 장황한 설명을 압축합니다.

Q: 이미 설치한 에이전트에 덮어쓰기 되나요?
A: 안전하게 재실행 가능. 없는 에이전트는 스킵.

Q: 팀 전체에 적용하려면?
A: --all 플래그로 저장소별 규칙 파일도 함께 배포. .clinerules, .cursorrules 등 자동 생성.


결론

Caveman은 단순한 “밈"이 아닙니다. 57K Star를 받은 실전 도구이며, Claude Code 생태계에서 가장 효과적인 토큰 최적화 솔루션입니다. 1줄 설치로 평균 65% 비용 절감, ~3배 속도 향상, 오히려 개선되는 정확도까지.

AI 코딩 비용이 부담스럽다면, 오늘 바로 Caveman을 설치하세요.

1curl -fsSL https://raw.githubusercontent.com/JuliusBrussee/caveman/main/install.sh | bash

더 알아보기: github.com/JuliusBrussee/caveman | getcaveman.dev


본 게시물은 dibi8.com에서 2026년 5월 10일에 작성되었습니다.