지난 3년간 “stable diffusion install"을 Google에서 검색하면 첫 결과는 AUTOMATIC1111의 stable-diffusion-webui입니다. 163k GitHub 별 (역사상 가장 많은 별의 AI 프로젝트 중 하나)로 2026년 SD 패밀리 이미지 생성의 기본 셀프호스트 UI — text-to-image, image-to-image, inpainting, outpainting, LoRA, ControlNet, 배치 생성, 모두 4 GB GPU에서 실행되는 Gradio 웹 UI 뒤.

이게 솔로 크리에이터와 dev를 위한 “로컬에서 이미지 생성하고 Midjourney에 $20/월 안 내고 싶다” 답. 더 복잡한 워크플로우 (멀티 모델 파이프라인, 비디오 생성, 오디오)는 ComfyUI 참조 — 둘은 보완적이지 경쟁자 아님.

TL;DR #

무엇: SD 패밀리 모델용 Gradio 웹 UI
GitHub: 163k 별, 7,689+ 커밋, 최신 v1.10.1
License: AGPL-3.0 (SaaS 배포 시 주의)
모델: SD 1.5, SD 2.x, SSD-1B, Alt-Diffusion 네이티브; 확장 통한 SDXL; 포크 통한 SD3 / Flux
하드웨어: 4 GB VRAM 최소 (--lowvram으로 2 GB 작동 보고)
알아둘 만한 포크: Forge (더 빠름, SDXL/Flux 초점), SD.Next (롤링 릴리스)

1. 왜 A1111이 2026에도 여전히 기본인가 #

Flux(2024년 9월) 출시 후 이미지 생성 생태계가 강하게 분열, SD 3.5가 뒤따름. ComfyUI가 “복잡 파이프라인” 니치 차지. 그러나 A1111이 기본 유지 이유:

가장 낮은 학습 곡선 — 텍스트 박스, 생성 버튼, 끝
가장 많은 확장 — 500+ 확장이 ControlNet, ADetailer, Regional Prompter, 훈련 등 처리
가장 많은 튜토리얼 — 4년치 Reddit/YouTube 콘텐츠가 A1111 모양
80% 사용 사례에 충분 — “텍스트에서 좋은 이미지"만 원할 때 ComfyUI 그래프 뷰는 과잉

로컬 이미지 생성 초보: 여기서 시작. 벗어나면 ComfyUI로 마이그레이션.

2. 하드웨어 현실 수치 (2026) #

| GPU | SD 1.5 (512×768) | SDXL (1024×1024) | Flux (1024×1024) | |—

|—

| | 4 GB (GTX 1650 / 3050) | ~15초/이미지 | ~60초 (--lowvram) | 비실용적 | | 8 GB (RTX 3060 / 4060) | ~5초 | ~12초 | ~30초 (--medvram) | | 12 GB (RTX 3060 12GB / 4070) | ~3초 | ~6초 | ~15초 | | 16-24 GB (RTX 4080 / 4090) | ~1.5초 | ~3초 | ~6초 |

클라우드 사용: Vast.ai 또는 DigitalOcean GPU droplets 의 $0.30-0.50/시간 GPU 인스턴스가 의미 있는 볼륨에서 Midjourney보다 저렴.

3. 빠른 설치 (15분) #

Linux/macOS:

a
s
h
git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui
cd stable-diffusion-webui
./webui.sh  # Python 의존성 자동 설치, 기본 모델 다운로드

Windows: 최신 릴리스 zip 다운로드, 압축 해제, webui-user.bat 실행.

첫 실행이 ~4 GB (기본 SD 1.5 모델) + ~2 GB Python 의존성 다운로드. 브라우저로 http://localhost: 7860 열기.

4. 80/20 설정 #

“좋은 이미지만 만들어줘” 워크플로우:

Sampler: DPM++ 2M Karras 또는 Euler a
Steps: 20-30 (30 이상 = 수익 감소)
CFG Scale: 7 (낮을수록 창의적, 높을수록 문자 그대로)
해상도: SD 1.5는 512×768, SDXL은 1024×1024
네거티브 프롬프트 베이스라인: bad anatomy, blurry, low quality, watermark, text, signature

고품질: Hires fix 활성화 (2× 업스케일 + denoise 0.4-0.5), 생성 시간 2× 비용.

5. 필수 확장 #

500+ 확장 탭에서 top pick:

ControlNet — pose / depth / canny / scribble 조건화. 가장 유용한 단일 확장
ADetailer — 얼굴과 손 자동 수정 (SD의 두 실패 모드)
Regional Prompter — 이미지의 다른 부분에 다른 프롬프트
Dynamic Prompts — wildcard 구문 {red|blue|green} car
Civitai Helper — Civitai에서 다운로드한 모델 관리
sd-webui-prompt-history — 과거 생성에서 프롬프트 복구

설치: Extensions tab → Install from URL → GitHub URL 붙여넣기 → Apply 재시작.

6. LoRA / Embedding / ControlNet 워크플로우 #

3가지 커스터마이징 메커니즘:

LoRA (Low-Rank Adaptation) — 작은 파일 (~150 MB)로 기본 모델을 특정 스타일이나 주제로 적응. models/Lora/에 넣고 프롬프트에서 참조: <lora: style_name: 0.8>
Textual Inversion / Embeddings — 더 작음 (~30 KB), 단일 개념 추가. embeddings/에 넣고 프롬프트에 트리거 단어 입력
ControlNet — pose / depth / line art / 등으로 생성 조건화. 모델은 models/ControlNet/로

Civitai가 커뮤니티 LoRA와 체크포인트의 사실상 허브. Civitai Helper 확장이 로컬 파일과 메타데이터 자동 동기화.

7. SDXL / SD3 / Flux 지원 (2026 현실) #

기본으로 A1111 메인라인은 SD 1.x/2.x 함. 새 모델:

SDXL — v1.6부터 메인라인 작동
SDXL Turbo / Lightning — 작동, 가속된 SDXL로 구성
SD 3.5 — Forge 포크 또는 확장 필요, 메인라인 뒤처짐
Flux — Forge 포크 필요; A1111 메인라인이 v1.10 기준 Flux 지원 안 함
위 + Wan + Hunyuan 모두? ComfyUI로 전환

SDXL 일상 사용 2026 셋업: A1111 메인라인 작동. Flux 우선 창의 파이프라인: Forge 포크. 모두 지원: ComfyUI.

8. 프로덕션 셀프호스트 패턴 #

“개인 이미지 API” 배포:

o
n
GPU droplet
 (RTX 6000 Ada $0.50/시간 또는 Vast.ai)
            │
            ▼
   --api 플래그 활성화된 A1111
            │
            ▼
   내부 FastAPI 래퍼 (auth + rate limit + queue)
            │
            ▼
   당신 앱 / 에이전트가 /sdapi/v1/txt2img 호출

비용 예: 하루 8시간 사용 × $0.50/시간 × 30일 = 무제한 생성 $120/월, vs Midjourney $30/월 200 fast 시간. 중간 사용에서 손익분기.

9. A1111 vs Forge vs SD.Next vs ComfyUI #

| 선택 | 언제 | |—

|—

정직한 2026 추천: A1111 메인라인 먼저 시도. Flux나 속도 필요하면 Forge로 전환. 선형 UI 멘탈 모델 벗어나면 ComfyUI 학습.

TL;DR #

AUTOMATIC1111 SD WebUI = 2026년 솔로 크리에이터용 기본 셀프호스트 이미지 생성. 163k 별, 최소 4 GB VRAM, 박스 밖에서 SD 1.x/SDXL 실행. 커뮤니티 모델용 Civitai와 페어, 고급 제어용 ControlNet/LoRA/ADetailer.

GPU 인스턴스 띄우고, 3절 설치 실행, 15분 후 의미 있는 볼륨에서 Midjourney와 손익분기 맞는 로컬 이미지 생성.

dibi8의 멀티모달 콘텐츠 스택 일부 — 노드 기반 워크플로우용 ComfyUI와 다가오는 멀티모달 콘텐츠 파이프라인 컬렉션 참조.

Stable Diffusion WebUI 2026 (AUTOMATIC1111)

TL;DR #

1. 왜 A1111이 2026에도 여전히 기본인가 #

2. 하드웨어 현실 수치 (2026) #

3. 빠른 설치 (15분) #

4. 80/20 설정 #

5. 필수 확장 #

6. LoRA / Embedding / ControlNet 워크플로우 #

7. SDXL / SD3 / Flux 지원 (2026 현실) #

8. 프로덕션 셀프호스트 패턴 #

9. A1111 vs Forge vs SD.Next vs ComfyUI #

TL;DR #

추천 도구 #

📦 다음 컬렉션에 포함됨

💬 댓글 토론

TL;DR #

1. 왜 A1111이 2026에도 여전히 기본인가 #

2. 하드웨어 현실 수치 (2026) #

3. 빠른 설치 (15분) #

4. 80/20 설정 #

5. 필수 확장 #

6. LoRA / Embedding / ControlNet 워크플로우 #

7. SDXL / SD3 / Flux 지원 (2026 현실) #

8. 프로덕션 셀프호스트 패턴 #

9. A1111 vs Forge vs SD.Next vs ComfyUI #

TL;DR #

추천 도구 #

🔗 관련 리소스

📦 다음 컬렉션에 포함됨

💬 댓글 토론