Stable Diffusion WebUI 2026 (AUTOMATIC1111): Hướng Dẫn Đầy Đủ Sinh Ảnh Self-Host 163k Sao

AUTOMATIC1111 stable-diffusion-webui là UI self-host tiêu chuẩn de-facto 163k sao cho sinh ảnh SD/SDXL. Hướng dẫn cài đặt + production 2026 đầy đủ: txt2img / img2img / inpainting / outpainting / LoRA / ControlNet, yêu cầu phần cứng, lựa chọn thay thế (Forge, SD.Next).

  • ⭐ 163000
  • Python
  • PyTorch
  • Gradio
  • CUDA
  • AGPL-3.0
  • Cập nhật 2026-05-21

Nếu bạn từng Google “stable diffusion install” kết quả đầu tiên là AUTOMATIC1111’s stable-diffusion-webui trong 3 năm liên tiếp. Ở 163k GitHub sao (một trong các project AI nhiều sao nhất trong lịch sử), nó là UI self-host mặc định cho sinh ảnh họ SD năm 2026 — text-to-image, image-to-image, inpainting, outpainting, LoRA, ControlNet, sinh batch, tất cả phía sau UI web Gradio bạn có thể chạy trên GPU 4 GB.

Đây là câu trả lời “Tôi muốn sinh ảnh local mà không trả $20/tháng cho Midjourney” cho creator solo và dev. Cho workflow phức tạp hơn (pipeline đa mô hình, sinh video, audio), xem ComfyUI — hai cái bổ sung nhau, không cạnh tranh.

TL;DR #

  • Là gì: UI web Gradio cho mô hình họ SD
  • GitHub: 163k sao, 7,689+ commit, mới nhất v1.10.1
  • License: AGPL-3.0 (chú ý cho triển khai SaaS)
  • Mô hình: SD 1.5, SD 2.x, SSD-1B, Alt-Diffusion native; SDXL qua extension; SD3 / Flux qua fork
  • Phần cứng: 4 GB VRAM tối thiểu (báo cáo 2 GB hoạt động với --lowvram)
  • Fork đáng biết: Forge (nhanh hơn, focus SDXL/Flux), SD.Next (rolling release)

1. Vì Sao A1111 Vẫn Là Mặc Định Năm 2026 #

Hệ sinh thái sinh ảnh phân mảnh mạnh sau khi Flux ra (tháng 9/2024) và SD 3.5 theo sau. ComfyUI chiếm niche “pipeline phức tạp”. Nhưng A1111 vẫn là mặc định vì:

  1. Đường cong học thấp nhất — text box, nút sinh, xong
  2. Nhiều extension nhất — 500+ extension xử lý ControlNet, ADetailer, Regional Prompter, training, mọi thứ
  3. Nhiều tutorial nhất — 4 năm nội dung Reddit/YouTube đều theo hình dáng A1111
  4. Đủ cho 80% trường hợp sử dụng — khi bạn chỉ muốn “ảnh tốt từ text”, view graph của ComfyUI quá mức

Nếu mới làm sinh ảnh local: bắt đầu ở đây. Chuyển sang ComfyUI khi vượt qua.

2. Số Liệu Phần Cứng Thực Tế (2026) #

GPUSD 1.5 (512×768)SDXL (1024×1024)Flux (1024×1024)
4 GB (GTX 1650 / 3050)~15s/ảnh~60s (--lowvram)Không thực tế
8 GB (RTX 3060 / 4060)~5s~12s~30s (--medvram)
12 GB (RTX 3060 12GB / 4070)~3s~6s~15s
16-24 GB (RTX 4080 / 4090)~1.5s~3s~6s

Sử dụng cloud: instance GPU $0.30-0.50/giờ trên Vast.ai hoặc DigitalOcean GPU droplets rẻ hơn Midjourney ở bất kỳ volume có ý nghĩa.

3. Cài Nhanh (15 phút) #

Linux/macOS:

git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui
cd stable-diffusion-webui
./webui.sh  # tự cài Python deps, tải mô hình mặc định

Windows: Tải zip release mới nhất, giải nén, chạy webui-user.bat.

Lần chạy đầu tải xuống ~4 GB (mô hình SD 1.5 mặc định) + ~2 GB Python deps. Mở trình duyệt tại http://localhost:7860.

4. Cài Đặt 80/20 #

Cho workflow “chỉ tạo ảnh đẹp cho tôi”:

  • Sampler: DPM++ 2M Karras hoặc Euler a
  • Steps: 20-30 (trên 30 = lợi nhuận giảm)
  • CFG Scale: 7 (thấp hơn = sáng tạo hơn, cao hơn = literal hơn)
  • Độ phân giải: 512×768 cho SD 1.5, 1024×1024 cho SDXL
  • Negative prompt baseline: bad anatomy, blurry, low quality, watermark, text, signature

Cho chất lượng cao: bật Hires fix (2× upscale + denoise 0.4-0.5) với chi phí 2× thời gian sinh.

5. Extension Thiết Yếu #

Top pick từ 500+ tab Extensions:

  • ControlNet — điều kiện hóa pose / depth / canny / scribble. Extension hữu ích đơn lẻ nhất
  • ADetailer — tự sửa khuôn mặt và tay (hai mode thất bại của SD)
  • Regional Prompter — prompt khác nhau cho phần khác nhau của ảnh
  • Dynamic Prompts — cú pháp wildcard {red|blue|green} car
  • Civitai Helper — quản lý mô hình tải từ Civitai
  • sd-webui-prompt-history — khôi phục prompt từ sinh quá khứ

Cài qua Extensions tab → Install from URL → dán URL GitHub → Apply và restart.

6. LoRA / Embedding / ControlNet Workflow #

Ba cơ chế tùy chỉnh:

  • LoRA (Low-Rank Adaptation) — file nhỏ (~150 MB) điều chỉnh mô hình cơ sở về style hoặc đối tượng cụ thể. Đặt vào models/Lora/, tham chiếu trong prompt: <lora:style_name:0.8>
  • Textual Inversion / Embeddings — nhỏ hơn (~30 KB), bổ sung khái niệm đơn. Đặt vào embeddings/, chỉ gõ từ trigger trong prompt
  • ControlNet — điều kiện sinh trên pose / depth / line art / v.v. Mô hình vào models/ControlNet/

Civitai là hub de-facto cho LoRA và checkpoint cộng đồng. Extension Civitai Helper tự đồng bộ file local với metadata.

7. Hỗ Trợ SDXL / SD3 / Flux (Thực Tế 2026) #

Box ngoài, mainline A1111 làm SD 1.x/2.x. Cho mô hình mới hơn:

  • SDXL — hoạt động mainline từ v1.6
  • SDXL Turbo / Lightning — hoạt động, cấu hình như SDXL tăng tốc
  • SD 3.5 — cần fork Forge hoặc extension, mainline tụt hậu
  • Flux — cần fork Forge; mainline A1111 không hỗ trợ Flux tính đến v1.10
  • Muốn tất cả trên + Wan + Hunyuan? Chuyển ComfyUI

Setup 2026 dùng SDXL hàng ngày: mainline A1111 hoạt động. Pipeline sáng tạo Flux-first: fork Forge. Hỗ trợ mọi thứ: ComfyUI.

8. Pattern Self-Host Production #

Triển khai “API ảnh cá nhân”:

   GPU droplet
 (RTX 6000 Ada $0.50/giờ hoặc thuê trên Vast.ai)
            │
            ▼
   A1111 với cờ --api bật
            │
            ▼
   Wrapper FastAPI nội bộ (auth + rate limit + queue)
            │
            ▼
   App / agent của bạn gọi /sdapi/v1/txt2img

Ví dụ chi phí: 8 giờ/ngày × $0.50/giờ × 30 ngày = $120/tháng cho sinh không giới hạn, vs Midjourney $30/tháng cho 200 fast giờ. Hòa vốn ở sử dụng vừa phải.

9. A1111 vs Forge vs SD.Next vs ComfyUI #

ChọnKhi nào
A1111 mainlineMặc định, focus SD 1.x/SDXL, hệ sinh thái extension lớn nhất
ForgeCùng UI A1111 nhưng nhanh hơn 30-75%, SDXL/Flux sẵn sàng, footprint VRAM nhỏ hơn
SD.NextRolling release, hỗ trợ gần như mọi thứ A1111+Forge hỗ trợ nhưng fork đơn
ComfyUIWorkflow phức tạp, sinh video, audio, mô hình mới nhất ngày 1, điều khiển dựa node

Khuyến nghị thành thật 2026: thử mainline A1111 trước. Nếu cần Flux hoặc tốc độ, chuyển sang Forge. Nếu vượt mô hình tinh thần UI tuyến tính, học ComfyUI.

TL;DR #

AUTOMATIC1111 SD WebUI = sinh ảnh self-host mặc định cho creator solo năm 2026. 163k sao, tối thiểu 4 GB VRAM, chạy SD 1.x/SDXL box ngoài. Pair với Civitai cho mô hình cộng đồng, ControlNet/LoRA/ADetailer cho điều khiển nâng cao.

Bật instance GPU, chạy cài đặt mục 3, và 15 phút sau bạn có sinh ảnh local hòa vốn với Midjourney ở bất kỳ volume có ý nghĩa.


Một phần của stack nội dung đa phương thức dibi8 — xem ComfyUI cho workflow dựa node và bộ sưu tập Multi-Modal Content Pipeline sắp tới.

📦 Xuất hiện trong các bộ sưu tập

💬 Bình luận & Thảo luận