Stable Diffusion WebUI 2026 (AUTOMATIC1111): 163k 별 셀프호스트 이미지 생성 완전 가이드
AUTOMATIC1111 stable-diffusion-webui는 163k 별의 SD/SDXL 이미지 생성용 사실상 표준 셀프호스트 UI. 2026 완전 설치 + 프로덕션 가이드: txt2img / img2img / 인페인팅 / 아웃페인팅 / LoRA / ControlNet, 하드웨어 요구, 대안(Forge, SD.Next).
- ⭐ 163000
- Python
- PyTorch
- Gradio
- CUDA
- AGPL-3.0
- 업데이트 2026-05-21
지난 3년간 “stable diffusion install"을 Google에서 검색하면 첫 결과는 AUTOMATIC1111의 stable-diffusion-webui입니다. 163k GitHub 별 (역사상 가장 많은 별의 AI 프로젝트 중 하나)로 2026년 SD 패밀리 이미지 생성의 기본 셀프호스트 UI — text-to-image, image-to-image, inpainting, outpainting, LoRA, ControlNet, 배치 생성, 모두 4 GB GPU에서 실행되는 Gradio 웹 UI 뒤.
이게 솔로 크리에이터와 dev를 위한 “로컬에서 이미지 생성하고 Midjourney에 $20/월 안 내고 싶다” 답. 더 복잡한 워크플로우 (멀티 모델 파이프라인, 비디오 생성, 오디오)는 ComfyUI 참조 — 둘은 보완적이지 경쟁자 아님.
TL;DR #
- 무엇: SD 패밀리 모델용 Gradio 웹 UI
- GitHub: 163k 별, 7,689+ 커밋, 최신 v1.10.1
- License: AGPL-3.0 (SaaS 배포 시 주의)
- 모델: SD 1.5, SD 2.x, SSD-1B, Alt-Diffusion 네이티브; 확장 통한 SDXL; 포크 통한 SD3 / Flux
- 하드웨어: 4 GB VRAM 최소 (
--lowvram으로 2 GB 작동 보고) - 알아둘 만한 포크: Forge (더 빠름, SDXL/Flux 초점), SD.Next (롤링 릴리스)
1. 왜 A1111이 2026에도 여전히 기본인가 #
Flux(2024년 9월) 출시 후 이미지 생성 생태계가 강하게 분열, SD 3.5가 뒤따름. ComfyUI가 “복잡 파이프라인” 니치 차지. 그러나 A1111이 기본 유지 이유:
- 가장 낮은 학습 곡선 — 텍스트 박스, 생성 버튼, 끝
- 가장 많은 확장 — 500+ 확장이 ControlNet, ADetailer, Regional Prompter, 훈련 등 처리
- 가장 많은 튜토리얼 — 4년치 Reddit/YouTube 콘텐츠가 A1111 모양
- 80% 사용 사례에 충분 — “텍스트에서 좋은 이미지"만 원할 때 ComfyUI 그래프 뷰는 과잉
로컬 이미지 생성 초보: 여기서 시작. 벗어나면 ComfyUI로 마이그레이션.
2. 하드웨어 현실 수치 (2026) #
| GPU | SD 1.5 (512×768) | SDXL (1024×1024) | Flux (1024×1024) |
|---|---|---|---|
| 4 GB (GTX 1650 / 3050) | ~15초/이미지 | ~60초 (--lowvram) | 비실용적 |
| 8 GB (RTX 3060 / 4060) | ~5초 | ~12초 | ~30초 (--medvram) |
| 12 GB (RTX 3060 12GB / 4070) | ~3초 | ~6초 | ~15초 |
| 16-24 GB (RTX 4080 / 4090) | ~1.5초 | ~3초 | ~6초 |
클라우드 사용: Vast.ai 또는 DigitalOcean GPU droplets 의 $0.30-0.50/시간 GPU 인스턴스가 의미 있는 볼륨에서 Midjourney보다 저렴.
3. 빠른 설치 (15분) #
Linux/macOS:
git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui
cd stable-diffusion-webui
./webui.sh # Python 의존성 자동 설치, 기본 모델 다운로드
Windows: 최신 릴리스 zip 다운로드, 압축 해제, webui-user.bat 실행.
첫 실행이 ~4 GB (기본 SD 1.5 모델) + ~2 GB Python 의존성 다운로드. 브라우저로 http://localhost:7860 열기.
4. 80/20 설정 #
“좋은 이미지만 만들어줘” 워크플로우:
- Sampler: DPM++ 2M Karras 또는 Euler a
- Steps: 20-30 (30 이상 = 수익 감소)
- CFG Scale: 7 (낮을수록 창의적, 높을수록 문자 그대로)
- 해상도: SD 1.5는 512×768, SDXL은 1024×1024
- 네거티브 프롬프트 베이스라인:
bad anatomy, blurry, low quality, watermark, text, signature
고품질: Hires fix 활성화 (2× 업스케일 + denoise 0.4-0.5), 생성 시간 2× 비용.
5. 필수 확장 #
500+ 확장 탭에서 top pick:
- ControlNet — pose / depth / canny / scribble 조건화. 가장 유용한 단일 확장
- ADetailer — 얼굴과 손 자동 수정 (SD의 두 실패 모드)
- Regional Prompter — 이미지의 다른 부분에 다른 프롬프트
- Dynamic Prompts — wildcard 구문
{red|blue|green} car - Civitai Helper — Civitai에서 다운로드한 모델 관리
- sd-webui-prompt-history — 과거 생성에서 프롬프트 복구
설치: Extensions tab → Install from URL → GitHub URL 붙여넣기 → Apply 재시작.
6. LoRA / Embedding / ControlNet 워크플로우 #
3가지 커스터마이징 메커니즘:
- LoRA (Low-Rank Adaptation) — 작은 파일 (~150 MB)로 기본 모델을 특정 스타일이나 주제로 적응.
models/Lora/에 넣고 프롬프트에서 참조:<lora:style_name:0.8> - Textual Inversion / Embeddings — 더 작음 (~30 KB), 단일 개념 추가.
embeddings/에 넣고 프롬프트에 트리거 단어 입력 - ControlNet — pose / depth / line art / 등으로 생성 조건화. 모델은
models/ControlNet/로
Civitai가 커뮤니티 LoRA와 체크포인트의 사실상 허브. Civitai Helper 확장이 로컬 파일과 메타데이터 자동 동기화.
7. SDXL / SD3 / Flux 지원 (2026 현실) #
기본으로 A1111 메인라인은 SD 1.x/2.x 함. 새 모델:
- SDXL — v1.6부터 메인라인 작동
- SDXL Turbo / Lightning — 작동, 가속된 SDXL로 구성
- SD 3.5 — Forge 포크 또는 확장 필요, 메인라인 뒤처짐
- Flux — Forge 포크 필요; A1111 메인라인이 v1.10 기준 Flux 지원 안 함
- 위 + Wan + Hunyuan 모두? ComfyUI로 전환
SDXL 일상 사용 2026 셋업: A1111 메인라인 작동. Flux 우선 창의 파이프라인: Forge 포크. 모두 지원: ComfyUI.
8. 프로덕션 셀프호스트 패턴 #
“개인 이미지 API” 배포:
GPU droplet
(RTX 6000 Ada $0.50/시간 또는 Vast.ai)
│
▼
--api 플래그 활성화된 A1111
│
▼
내부 FastAPI 래퍼 (auth + rate limit + queue)
│
▼
당신 앱 / 에이전트가 /sdapi/v1/txt2img 호출
비용 예: 하루 8시간 사용 × $0.50/시간 × 30일 = 무제한 생성 $120/월, vs Midjourney $30/월 200 fast 시간. 중간 사용에서 손익분기.
9. A1111 vs Forge vs SD.Next vs ComfyUI #
| 선택 | 언제 |
|---|---|
| A1111 메인라인 | 기본, SD 1.x/SDXL 초점, 가장 큰 확장 생태계 |
| Forge | A1111과 같은 UI지만 30-75% 더 빠름, SDXL/Flux 준비, 더 작은 VRAM 풋프린트 |
| SD.Next | 롤링 릴리스, A1111+Forge 지원하는 거의 모든 것 지원하지만 단일 포크 |
| ComfyUI | 복잡 워크플로우, 비디오 생성, 오디오, 최신 모델 day-1, 노드 기반 제어 |
정직한 2026 추천: A1111 메인라인 먼저 시도. Flux나 속도 필요하면 Forge로 전환. 선형 UI 멘탈 모델 벗어나면 ComfyUI 학습.
TL;DR #
AUTOMATIC1111 SD WebUI = 2026년 솔로 크리에이터용 기본 셀프호스트 이미지 생성. 163k 별, 최소 4 GB VRAM, 박스 밖에서 SD 1.x/SDXL 실행. 커뮤니티 모델용 Civitai와 페어, 고급 제어용 ControlNet/LoRA/ADetailer.
GPU 인스턴스 띄우고, 3절 설치 실행, 15분 후 의미 있는 볼륨에서 Midjourney와 손익분기 맞는 로컬 이미지 생성.
dibi8의 멀티모달 콘텐츠 스택 일부 — 노드 기반 워크플로우용 ComfyUI와 다가오는 멀티모달 콘텐츠 파이프라인 컬렉션 참조.
💬 댓글 토론