nanochat 2026: Andrej Karpathy의 오픈소스 ChatGPT $100 — 8,000줄 전체 LLM 파이프라인

Andrej Karpathy의 nanochat는 토크나이저, 사전학습, 파인튜닝, 평가, 추론, 채팅 UI를 포함한 전체 LLM 훈련 파이프라인으로, 단일 8×H100 노드에서 $100 미만으로 GPT-2 수준의 챗봇을 처음부터 훈련하도록 설계되었습니다.

  • ⭐ 54700
  • Python
  • PyTorch
  • Rust
  • LLM Training
  • MIT
  • 업데이트 2026-06-09

nanochat 2026: Andrej Karpathy LLM 훈련 파이프라인 — dibi8.com

2025년 10월, Andrej Karpathy는 간단한 전제로 nanochat를 발표했습니다: “$100으로 살 수 있는 최고의 ChatGPT.” 2026년 6월 기준 54,700개의 GitHub 스타를 기록하며 오픈소스 커뮤니티에서 가장 많이 읽히는 LLM 훈련 튜토리얼이 되었습니다.

nanochat의 구성 요소 #

  1. 토크나이저 (Rust) — 데이터에서 처음부터 훈련하는 커스텀 BPE 토크나이저, Rust로 구현
  2. 사전학습 (PyTorch) — FineWeb에서 Transformer 훈련, FlashAttention-2·BF16 혼합 정밀도 지원
  3. 파인튜닝 (SFT) — SmolTalk 대화 데이터, 객관식 QA, 도구 사용 데이터로 파인튜닝
  4. 평가 — CORE 벤치마크 자동 실행 (추론/지식/코딩/명령어 따르기 점수)
  5. 추론 서버 — OpenAI chat completions 호환 HTTP API
  6. 채팅 UI — 훈련된 모델과 대화하는 미니멀 웹 인터페이스

약 8,000줄의 Python + Rust 코드.

$100 훈련 비용 #

설정시간당 비용훈련 시간총 비용
8× H100 (SXM5)~$242시간~$48
8× A100 (80GB)~$164시간~$64
8× H100 (PCIe)~$183시간~$54

Lambda Labs, CoreWeave, vast.ai, RunPod에서 노드를 임대할 수 있습니다.

핵심 훈련 명령어 #

# 토크나이저 훈련
python tokenize_dataset.py --dataset fineweb --vocab-size 32768

# 8-GPU 사전학습
torchrun --nproc_per_node=8 train_pretrain.py \
  --config configs/pretrain_fineweb_120m.yaml

# 지도 파인튜닝
torchrun --nproc_per_node=8 train_sft.py \
  --pretrain-checkpoint checkpoints/pretrain_final.pt \
  --config configs/sft_smoltalk.yaml

# 추론 서버 실행
python serve.py --checkpoint checkpoints/sft_final.pt --port 8000

활용 대상 #

  • nanochat 사용: LLM 원리를 코드로 이해하고 싶은 분; 수정 가능한 기준이 필요한 연구자; 자체 데이터로 도메인 특화 모델을 사전학습하고 싶은 분
  • Ollama 사용: 기존 모델을 로컬에서 실행하기만 원하는 분 → Ollama

2026년 신기능: autoresearch #

2026년 3월 Karpathy가 발표한 autoresearch는 AI 에이전트가 nanochat 훈련 실험을 자동으로 실행하고 결과를 보고하는 시스템입니다.

GPU 컴퓨팅이 필요하신가요? DigitalOcean 신규 사용자는 $200 크레딧을 받습니다 — 여러 번의 완전한 nanochat 훈련 실험을 실행하기에 충분합니다.

GitHub: karpathy/nanochat · 54.7k ⭐ · MIT

💬 댓글 토론