Nếu bạn từng Google “stable diffusion install” kết quả đầu tiên là AUTOMATIC1111’s stable-diffusion-webui trong 3 năm liên tiếp. Ở 163k GitHub sao (một trong các project AI nhiều sao nhất trong lịch sử), nó là UI self-host mặc định cho sinh ảnh họ SD năm 2026 — text-to-image, image-to-image, inpainting, outpainting, LoRA, ControlNet, sinh batch, tất cả phía sau UI web Gradio bạn có thể chạy trên GPU 4 GB.

Đây là câu trả lời “Tôi muốn sinh ảnh local mà không trả $20/tháng cho Midjourney” cho creator solo và dev. Cho workflow phức tạp hơn (pipeline đa mô hình, sinh video, audio), xem ComfyUI — hai cái bổ sung nhau, không cạnh tranh.

TL;DR #

Là gì: UI web Gradio cho mô hình họ SD
GitHub: 163k sao, 7,689+ commit, mới nhất v1.10.1
License: AGPL-3.0 (chú ý cho triển khai SaaS)
Mô hình: SD 1.5, SD 2.x, SSD-1B, Alt-Diffusion native; SDXL qua extension; SD3 / Flux qua fork
Phần cứng: 4 GB VRAM tối thiểu (báo cáo 2 GB hoạt động với --lowvram)
Fork đáng biết: Forge (nhanh hơn, focus SDXL/Flux), SD.Next (rolling release)

1. Vì Sao A1111 Vẫn Là Mặc Định Năm 2026 #

Hệ sinh thái sinh ảnh phân mảnh mạnh sau khi Flux ra (tháng 9/2024) và SD 3.5 theo sau. ComfyUI chiếm niche “pipeline phức tạp”. Nhưng A1111 vẫn là mặc định vì:

Đường cong học thấp nhất — text box, nút sinh, xong
Nhiều extension nhất — 500+ extension xử lý ControlNet, ADetailer, Regional Prompter, training, mọi thứ
Nhiều tutorial nhất — 4 năm nội dung Reddit/YouTube đều theo hình dáng A1111
Đủ cho 80% trường hợp sử dụng — khi bạn chỉ muốn “ảnh tốt từ text”, view graph của ComfyUI quá mức

Nếu mới làm sinh ảnh local: bắt đầu ở đây. Chuyển sang ComfyUI khi vượt qua.

2. Số Liệu Phần Cứng Thực Tế (2026) #

| GPU | SD 1.5 (512×768) | SDXL (1024×1024) | Flux (1024×1024) | |—

|—

| | 4 GB (GTX 1650 / 3050) | ~15s/ảnh | ~60s (--lowvram) | Không thực tế | | 8 GB (RTX 3060 / 4060) | ~5s | ~12s | ~30s (--medvram) | | 12 GB (RTX 3060 12GB / 4070) | ~3s | ~6s | ~15s | | 16-24 GB (RTX 4080 / 4090) | ~1.5s | ~3s | ~6s |

Sử dụng cloud: instance GPU $0.30-0.50/giờ trên Vast.ai hoặc DigitalOcean GPU droplets rẻ hơn Midjourney ở bất kỳ volume có ý nghĩa.

3. Cài Nhanh (15 phút) #

Linux/macOS:

a
s
h
git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui
cd stable-diffusion-webui
./webui.sh  # tự cài Python deps, tải mô hình mặc định

Windows: Tải zip release mới nhất, giải nén, chạy webui-user.bat.

Lần chạy đầu tải xuống ~4 GB (mô hình SD 1.5 mặc định) + ~2 GB Python deps. Mở trình duyệt tại http://localhost: 7860.

4. Cài Đặt 80/20 #

Cho workflow “chỉ tạo ảnh đẹp cho tôi”:

Sampler: DPM++ 2M Karras hoặc Euler a
Steps: 20-30 (trên 30 = lợi nhuận giảm)
CFG Scale: 7 (thấp hơn = sáng tạo hơn, cao hơn = literal hơn)
Độ phân giải: 512×768 cho SD 1.5, 1024×1024 cho SDXL
Negative prompt baseline: bad anatomy, blurry, low quality, watermark, text, signature

Cho chất lượng cao: bật Hires fix (2× upscale + denoise 0.4-0.5) với chi phí 2× thời gian sinh.

5. Extension Thiết Yếu #

Top pick từ 500+ tab Extensions:

ControlNet — điều kiện hóa pose / depth / canny / scribble. Extension hữu ích đơn lẻ nhất
ADetailer — tự sửa khuôn mặt và tay (hai mode thất bại của SD)
Regional Prompter — prompt khác nhau cho phần khác nhau của ảnh
Dynamic Prompts — cú pháp wildcard {red|blue|green} car
Civitai Helper — quản lý mô hình tải từ Civitai
sd-webui-prompt-history — khôi phục prompt từ sinh quá khứ

Cài qua Extensions tab → Install from URL → dán URL GitHub → Apply và restart.

6. LoRA / Embedding / ControlNet Workflow #

Ba cơ chế tùy chỉnh:

LoRA (Low-Rank Adaptation) — file nhỏ (~150 MB) điều chỉnh mô hình cơ sở về style hoặc đối tượng cụ thể. Đặt vào models/Lora/, tham chiếu trong prompt: <lora: style_name: 0.8>
Textual Inversion / Embeddings — nhỏ hơn (~30 KB), bổ sung khái niệm đơn. Đặt vào embeddings/, chỉ gõ từ trigger trong prompt
ControlNet — điều kiện sinh trên pose / depth / line art / v.v. Mô hình vào models/ControlNet/

Civitai là hub de-facto cho LoRA và checkpoint cộng đồng. Extension Civitai Helper tự đồng bộ file local với metadata.

7. Hỗ Trợ SDXL / SD3 / Flux (Thực Tế 2026) #

Box ngoài, mainline A1111 làm SD 1.x/2.x. Cho mô hình mới hơn:

SDXL — hoạt động mainline từ v1.6
SDXL Turbo / Lightning — hoạt động, cấu hình như SDXL tăng tốc
SD 3.5 — cần fork Forge hoặc extension, mainline tụt hậu
Flux — cần fork Forge; mainline A1111 không hỗ trợ Flux tính đến v1.10
Muốn tất cả trên + Wan + Hunyuan? Chuyển ComfyUI

Setup 2026 dùng SDXL hàng date: mainline A1111 hoạt động. Pipeline sáng tạo Flux-first: fork Forge. Hỗ trợ mọi thứ: ComfyUI.

8. Pattern Self-Host Production #

Triển khai “API ảnh cá nhân”:

o
n
GPU droplet
 (RTX 6000 Ada $0.50/giờ hoặc thuê trên Vast.ai)
            │
            ▼
   A1111 với cờ --api bật
            │
            ▼
   Wrapper FastAPI nội bộ (auth + rate limit + queue)
            │
            ▼
   App / agent của bạn gọi /sdapi/v1/txt2img

Ví dụ chi phí: 8 giờ/ngày × $0.50/giờ × 30 ngày = $120/tháng cho sinh không giới hạn, vs Midjourney $30/tháng cho 200 fast giờ. Hòa vốn ở sử dụng vừa phải.

9. A1111 vs Forge vs SD.Next vs ComfyUI #

| Chọn | Khi nào | |—

|—

| | A1111 mainline | Mặc định, focus SD 1.x/SDXL, hệ sinh thái extension lớn nhất | | Forge | Cùng UI A1111 nhưng nhanh hơn 30-75%, SDXL/Flux sẵn sàng, footprint VRAM nhỏ hơn | | SD.Next | Rolling release, hỗ trợ gần như mọi thứ A1111+Forge hỗ trợ nhưng fork đơn | | ComfyUI | Workflow phức tạp, sinh video, audio, mô hình mới nhất ngày 1, điều khiển dựa node |

Khuyến nghị thành thật 2026: thử mainline A1111 trước. Nếu cần Flux hoặc tốc độ, chuyển sang Forge. Nếu vượt mô hình tinh thần UI tuyến tính, học ComfyUI.

TL;DR #

AUTOMATIC1111 SD WebUI = sinh ảnh self-host mặc định cho creator solo năm 2026. 163k sao, tối thiểu 4 GB VRAM, chạy SD 1.x/SDXL box ngoài. Pair với Civitai cho mô hình cộng đồng, ControlNet/LoRA/ADetailer cho điều khiển nâng cao.

Bật instance GPU, chạy cài đặt mục 3, và 15 phút sau bạn có sinh ảnh local hòa vốn với Midjourney ở bất kỳ volume có ý nghĩa.

Một phần của stack nội dung đa phương thức dibi8 — xem ComfyUI cho workflow dựa node và bộ sưu tập Multi-Modal Content Pipeline sắp tới.

Công Cụ Đề Xuất #

Chạy ComfyUI / Stable Diffusion ở scale cần GPU khủng. Cloud rental thường rẻ hơn mua.

HuwangYun GPU Server — 虎网云 cung cấp RTX 4090 / A100 ở mainland China với low-latency access — rẻ hơn US cloud GPU cho người dùng China chạy image generation workload.

Affiliate link — không tốn thêm chi phí và giúp dibi8.com vận hành.

Stable Diffusion WebUI 2026 (AUTOMATIC1111)

TL;DR #

1. Vì Sao A1111 Vẫn Là Mặc Định Năm 2026 #

2. Số Liệu Phần Cứng Thực Tế (2026) #

3. Cài Nhanh (15 phút) #

4. Cài Đặt 80/20 #

5. Extension Thiết Yếu #

6. LoRA / Embedding / ControlNet Workflow #

7. Hỗ Trợ SDXL / SD3 / Flux (Thực Tế 2026) #

8. Pattern Self-Host Production #

9. A1111 vs Forge vs SD.Next vs ComfyUI #

TL;DR #

Công Cụ Đề Xuất #

📦 Xuất hiện trong các bộ sưu tập

💬 Bình luận & Thảo luận

TL;DR #

1. Vì Sao A1111 Vẫn Là Mặc Định Năm 2026 #

2. Số Liệu Phần Cứng Thực Tế (2026) #

3. Cài Nhanh (15 phút) #

4. Cài Đặt 80/20 #

5. Extension Thiết Yếu #

6. LoRA / Embedding / ControlNet Workflow #

7. Hỗ Trợ SDXL / SD3 / Flux (Thực Tế 2026) #

8. Pattern Self-Host Production #

9. A1111 vs Forge vs SD.Next vs ComfyUI #

TL;DR #

Công Cụ Đề Xuất #

🔗 Tài nguyên liên quan

📦 Xuất hiện trong các bộ sưu tập

💬 Bình luận & Thảo luận