Dify: Xây dựng AI Agent cấp sản xuất bằng giao diện trực quan trong 5 phút — Hướng dẫn cài đặt 141K+ Stars 2026

Dify là nền tảng phát triển ứng dụng LLM mã nguồn mở với trình xây dựng workflow trực quan, pipeline RAG, và điều phối agent. Tương thích với OpenAI, Anthropic, Ollama, Qdrant, và Weaviate. Bao gồm triển khai Docker, tích hợp API, hardening sản xuất, và so sánh với Flowise, n8n, LangChain.

  • ⭐ 141955
  • Apache-2.0
  • Cập nhật 2026-05-19

{{< resource-info >}}

Hầu hết các đội ngũ phát triển chatbot AI theo cách khó khăn. Họ kết nối các route Flask với API OpenAI, viết template prompt thủ công trong file JSON, và xây dựng pipeline RAG từ đầu với các mô hình embedding, vector store, và logic chunking. Ba tháng sau, prototype không thể bảo trì được, quản lý sản phẩm không thể cập nhật prompt mà không cần lập trình viên, và đồng bộ knowledge base là một cron job thất bại âm thầm.

Dify giải quyết điều này. Đây là một nền tảng mã nguồn mở đóng gói thiết kế workflow trực quan, RAG cấp sản xuất, hỗ trợ đa mô hình, và xuất bản API vào một stack có thể triển khai duy nhất. Với 141,955 GitHub Stars, 1,298 ngườ đóng góp, và các bản phát hành mỗi 2-4 tuần, Dify đã trở thành lựa chọn mặc định cho các đội ngũ muốn phát hành ứng dụng AI mà không cần viết mã boilerplate điều phối. Hướng dẫn này sẽ đưa bạn qua quá trình thiết lập Dify sẵn sàng sản xuất trong vòng 5 phút, sau đó chỉ cách tích hợp và mở rộng quy mô.

Dify là gì? #

Dify là nền tảng phát triển workflow agentic sẵn sàng sản xuất. Hãy nghĩ về nó như lớp ứng dụng còn thiếu giữa API LLM thô và sản phẩm AI cho ngườ dùng cuối. Dify cung cấp một canvas trực quan nơi bạn có thể kéo thả và kết nối các node — cuộc gọi LLM, truy xuất kiến thức, yêu cầu HTTP, thực thi mã, nhánh điều kiện — thành các ứng dụng AI hoàn chỉnh.

Nền tảng được xây dựng trên kiến trúc Beehive (lục giác) với các thành phần mô-đun: dịch vụ API Python Flask, hàng đợi worker Celery, frontend Next.js, plugin daemon cho nhà cung cấp mô hình, và sandbox bảo mật để thực thi mã. Nó hỗ trợ 30+ vector database (Weaviate, Qdrant, pgvector, Milvus), 20+ nhà cung cấp LLM (OpenAI, Anthropic, Azure OpenAI, AWS Bedrock, Ollama, Groq), và đi kèm với tìm kiếm lai, xếp hạng lại, khả năng quan sát tích hợp, và tạo API RESTful ngay từ đầu.

Các loại ứng dụng chính bạn có thể xây dựng:

  • Chatbot — AI hội thoại với bộ nhớ, knowledge base, và gọi công cụ
  • Text Generator — Ứng dụng completion một lần cho tóm tắt, dịch thuật, coding
  • Agent — AI tự chủ với ReAct, Function Calling, và Chain-of-Thought
  • Workflow — Pipeline trực quan đa bước với logic điều kiện và thực thi song song

Dify hoạt động như thế nào #

Kiến trúc của Dify tách biệt các mối quan tâm thành các dịch vụ riêng biệt giao tiếp thông qua API được định nghĩa rõ ràng. Hiểu điều này giúp bạn gỡ lỗi, mở rộng, và cứng hóa triển khai.

Tổng quan kiến trúc #

Sơ đồ kiến trúc Dify

Dịch vụCổngCông nghệMục đích
Web Frontend3000Next.jsTrình xây dựng trực quan, dashboard, UI quản lý
API Service5001Python FlaskEndpoint REST API, logic nghiệp vụ
WorkerCeleryXử lý tác vụ bất đồng bộ, lập chỉ mục tài liệu
Worker BeatCeleryBộ điều phối tác vụ theo lịch
Plugin Daemon5002PythonRuntime plugin nhà cung cấp mô hình
Sandbox5003PythonMôi trường thực thi mã an toàn
SSRF ProxyNginxCách ly bảo mật yêu cầu outbound

Lớp dữ liệu #

Thành phầnMặc địnhThay thế
Metadata DBPostgreSQL 15AWS RDS, Cloud SQL
Cache/QueueRedis 7AWS ElastiCache, Redis Cloud
Vector StoreWeaviate 1.27Qdrant, Milvus, pgvector
File StorageLocal volumeS3, MinIO, GCS

Engine thực thi workflow #

Engine workflow của Dify sử dụng mô hình thực thi DAG (Đồ thị không chu trình có hướng) với hỗ trợ xử lý song song. Mỗi node trong workflow có thể chạy tuần tự hoặc trong luồng song song, với hệ thống variable pool cho phép chia sẻ dữ liệu xuyên suốt các node trong khi duy trì sự cách ly. Engine thực thi giới hạn 500 bước mỗi workflowtimeout 1,200 giây để ngăn chặn các tiến trình mất kiểm soát.

Cài đặt và thiết lập #

Yêu cầu tiên quyết #

Trước khi bắt đầu, đảm bảo máy của bạn đáp ứng các yêu cầu sau:

Tài nguyênTối thiểuKhuyến nghị
CPU2 nhân4+ nhân
RAM4 GiB8 GiB
Disk20 GB50 GB SSD
Docker19.03+Mới nhất
Docker Compose2.24.0+Mới nhất

Bước 1 — Clone Dify #

Clone bản phát hành mới nhất từ GitHub:

git clone --branch "$(curl -s https://api.github.com/repos/langgenius/dify/releases/latest | jq -r .tag_name)" https://github.com/langgenius/dify.git

Lệnh này checkout tag ổn định mới nhất (v1.14.2 tại thờ điểm viết).

Bước 2 — Cấu hình môi trường #

cd dify/docker
cp .env.example .env

Chỉnh sửa .env để đặt secret key bảo mật:

# Tạo secret mật mã học an toàn
SECRET=$(openssl rand -hex 32)
sed -i "s/SECRET_KEY=.*/SECRET_KEY=${SECRET}/" .env

Các biến quan trọng cần xem xét trong .env:

# Cài đặt cốt lõi
CONSOLE_API_URL=http://localhost:5001
CONSOLE_WEB_URL=http://localhost:3000
SERVICE_API_URL=http://localhost:5001
APP_API_URL=http://localhost:5001
APP_WEB_URL=http://localhost:3000

# Cơ sở dữ liệu
DB_USERNAME=postgres
DB_PASSWORD=difyai123456
DB_HOST=db
DB_PORT=5432
DB_DATABASE=dify

# Redis
REDIS_HOST=redis
REDIS_PORT=6379
REDIS_DB=0

# Vector store (Weaviate mặc định)
VECTOR_STORE=weaviate
WEAVIATE_ENDPOINT=http://weaviate:8080
WEAVIATE_API_KEY=WVF5YThaHlkYwhGUSmCRgsX3tD5ngdN8pkih

Bước 3 — Khởi động Dify #

docker compose up -d

Lệnh này khởi động 11 container: 5 dịch vụ cốt lõi và 6 phụ thuộc. Xác minh mọi thứ đang chạy:

docker compose ps

Bạn sẽ thấy tất cả container ở trạng thái Up (healthy). Khởi động đầu tiên mất 60-90 giây khi dịch vụ API chạy migration cơ sở dữ liệu.

Bước 4 — Khởi tạo tài khoản quản trị #

Mở trình duyệt và điều hướng đến:

http://localhost/install

Hoàn thành trình hướng dẫn thiết lập với email và mật khẩu của bạn. Sau khi thiết lập, đăng nhập tại:

http://localhost

Bước 5 — Thêm nhà cung cấp mô hình đầu tiên #

Điều hướng đến Cài đặt → Nhà cung cấp mô hình và thêm API key cho ít nhất một nhà cung cấp. Với OpenAI:

  1. Chọn “OpenAI” từ danh sách nhà cung cấp
  2. Dán API key của bạn (sk-...)
  3. Nhấn “Lưu”

Để phát triển cục bộ với Ollama:

  1. Đảm bảo Ollama đang chạy cục bộ (ollama serve)
  2. Chọn “Ollama” từ danh sách nhà cung cấp
  3. Đặt Base URL thành http://host.docker.internal:11434
  4. Chọn một mô hình đã tải (ví dụ: llama3.1:8b)
# Tải mô hình nhẹ để kiểm thử
ollama pull llama3.1:8b

Phiên bản Dify của bạn giờ đã sẵn sàng xây dựng ứng dụng AI.

Tích hợp với các công cụ phổ biến #

OpenAI / Anthropic Claude #

Thêm các nhà cung cấp LLM chính chỉ là thay đổi cấu hình, không phải triển khai. Sau khi thêm API key trong Cài đặt → Nhà cung cấp mô hình, tạo ứng dụng chat đầu tiên:

  1. Vào Studio → Tạo ứng dụng → Chatbot
  2. Đặt tên “Trợ lý hỗ trợ”
  3. Viết system prompt trong trình chỉnh sửa prompt
  4. Chọn mô hình (GPT-4o, Claude Sonnet, v.v.) từ dropdown
  5. Nhấn Xuất bản

Truy cập ứng dụng qua API:

curl -X POST 'http://localhost/v1/chat-messages' \
  -H 'Authorization: Bearer YOUR_APP_API_KEY' \
  -H 'Content-Type: application/json' \
  -d '{
    "inputs": {},
    "query": "Làm thế nào để đặt lại mật khẩu?",
    "response_mode": "streaming",
    "conversation_id": "",
    "user": "user-123"
  }'

Ollama (LLM cục bộ) #

Cho môi trường cách ly hoặc nhạy cảm về chi phí, tích hợp Ollama cho phép bạn chạy các mô hình cục bộ:

# Khởi động Ollama
ollama serve

# Tải mô hình
ollama pull llama3.1:8b
ollama pull qwen2.5:14b

Trong Dify, vào Cài đặt → Nhà cung cấp mô hình → Ollama và cấu hình:

TrườngGiá trị
Tên mô hìnhllama3.1:8b
Base URLhttp://host.docker.internal:11434

Sử dụng mô hình cục bộ cho phát triển và chuyển sang mô hình cloud cho sản xuất mà không thay đổi logic ứng dụng.

Qdrant Vector Store #

Thay thế Weaviate bằng Qdrant để hiệu suất tốt hơn khi mở rộng:

cd dify/docker
cp envs/vectorstores/qdrant.env.example envs/vectorstores/qdrant.env

Chỉnh sửa envs/vectorstores/qdrant.env:

VECTOR_STORE=qdrant
QDRANT_URL=http://qdrant:6333
QDRANT_API_KEY=your-api-key
QDRANT_CLIENT_TIMEOUT=20

Thêm Qdrant vào docker-compose.override.yaml:

services:
  qdrant:
    image: qdrant/qdrant:latest
    ports:
      - "6333:6333"
    volumes:
      - qdrant_data:/qdrant/storage
    environment:
      - QDRANT__SERVICE__API_KEY=your-api-key

volumes:
  qdrant_data:

Khởi động lại Dify:

docker compose down
docker compose up -d

Weaviate #

Weaviate là vector store mặc định và hoạt động ngay từ đầu. Cho sản xuất, sử dụng cluster Weaviate bên ngoài:

# Trong .env
VECTOR_STORE=weaviate
WEAVIATE_ENDPOINT=https://your-cluster.weaviate.network
WEAVIATE_API_KEY=your-api-key

Tích hợp Claude Code #

Xuất ứng dụng Dify dưới dạng MCP (Model Context Protocol) server và kết nối với Claude Code:

  1. Trong ứng dụng Dify, vào Truy cập API → MCP Server
  2. Bật xuất bản MCP
  3. Sao chép URL MCP server
  4. Trong Claude Code, chạy:
claude config add mcp.dify http://localhost:5001/your-mcp-endpoint

Các workflow Dify của bạn giờ có thể được gọi trực tiếp từ cuộc hội thoại Claude Code.

Benchmark / Trường hợp sử dụng thực tế #

Đặc tính hiệu suất #

Dựa trên benchmark cộng đồng và dữ liệu kiểm thử tải:

Chỉ số1 CPU / 2 GB RAM4 CPU / 8 GB RAM8 CPU / 16 GB RAM
QPS (không gọi model)3 req/s8 req/s11 req/s
QPS (với GPT-4o)2 req/s5 req/s6 req/s
Độ trễ P95 (workflow)2.1s1.2s0.8s
Ngườ dùng đồng thờ~20~100~500

Lưu ý: Thông lượng thực tế phụ thuộc nhiều vào độ trễ nhà cung cấp LLM và độ phức tạp workflow.

Hiệu suất lập chỉ mục tài liệu #

Thao tác100 tài liệu1.000 tài liệu10.000 tài liệu
Tải lên + Chunk30s4 phút35 phút
Embedding (OpenAI)45s6 phút50 phút
Tổng thờ gian lập chỉ mục75s10 phút85 phút

So sánh chi phí (Tự host hàng tháng) #

Quy môChi phí VPSChi phí LLMTổng
Dev / 1 ngườ dùng$20$5-10$25-30
Nhóm nhỏ / 50 ngườ dùng$40$50-100$90-140
Doanh nghiệp / 500 ngườ dùng$200$500-1.000$700-1.200

Các mô hình triển khai thực tế #

Chatbot hỗ trợ khách hàng — Công ty SaaS 40 ngườ triển khai chatbot Dify được đào tạo trên 800 trang tài liệu sản phẩm. Tỷ lệ giải quyết tăng từ 45% lên 78%, và khối lượng ticket hỗ trợ giảm 35% trong tháng đầu tiên.

Trợ lý kiến thức nội bộ — Đội ngũ fintech xây dựng trợ lý RAG trên 50.000 tài liệu nội bộ. Nhân viên nhận được câu trả lờ có nguồn trung bình trong 2,3 giây, thay thế tìm kiếm wiki thủ công mất 5-10 phút.

Agent xác nhận lead — Startup B2B xây dựng workflow chấm điểm lead đến bằng GPT-4o, truy vấn cơ sở dữ liệu PostgreSQL để lấy dữ liệu chuyển đổi lịch sử, và định tuyến lead nóng đến bộ phận bán hàng qua Slack. Thờ gian phản hồi: dưới 10 giây mỗi lead.

Sử dụng nâng cao / Cứng hóa sản xuất #

Cách ly môi trường #

Cho sản xuất, không bao giờ sử dụng các giá trị .env mặc định. Tạo cấu hình theo môi trường:

# Môi trường sản xuất
cp .env .env.production

Thay đổi quan trọng cho sản xuất:

# Bảo mật
SECRET_KEY=$(openssl rand -hex 48)
CONSOLE_API_URL=https://dify.yourcompany.com
CONSOLE_WEB_URL=https://dify.yourcompany.com
SERVICE_API_URL=https://dify.yourcompany.com

# Cơ sở dữ liệu (bên ngoài)
DB_HOST=your-rds-endpoint.amazonaws.com
DB_USERNAME=dify_prod
DB_PASSWORD=<strong-password>

# Redis (bên ngoài)
REDIS_HOST=your-elasticache-endpoint
REDIS_PASSWORD=<strong-password>
REDIS_USE_SSL=true

# Lưu trữ file (S3)
STORAGE_TYPE=s3
S3_USE_AWS_MANAGED_IAM=false
S3_ENDPOINT=https://s3.amazonaws.com
S3_BUCKET_NAME=dify-prod-uploads
S3_ACCESS_KEY=AKIA...
S3_SECRET_KEY=...
S3_REGION=us-east-1

Reverse proxy với SSL #

Sử dụng Nginx hoặc Traefik cho TLS termination:

server {
    listen 443 ssl http2;
    server_name dify.yourcompany.com;

    ssl_certificate /path/to/cert.pem;
    ssl_certificate_key /path/to/key.pem;

    location / {
        proxy_pass http://localhost:3000;
        proxy_set_header Host $host;
        proxy_set_header X-Real-IP $remote_addr;
        proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for;
        proxy_set_header X-Forwarded-Proto $scheme;
    }

    location /v1/ {
        proxy_pass http://localhost:5001;
        proxy_set_header Host $host;
        proxy_read_timeout 300s;
    }
}

Giám sát và khả năng quan sát #

Dify expose các chỉ số qua dịch vụ API. Cho giám sát sản xuất, thiết lập:

# docker-compose.monitoring.yaml
services:
  prometheus:
    image: prom/prometheus:latest
    volumes:
      - ./prometheus.yml:/etc/prometheus/prometheus.yml
    ports:
      - "9090:9090"

  grafana:
    image: grafana/grafana:latest
    ports:
      - "3001:3000"
    volumes:
      - grafana_data:/var/lib/grafana

  node-exporter:
    image: prom/node-exporter:latest
    ports:
      - "9100:9100"

volumes:
  grafana_data:

Các chỉ số quan trọng cần theo dõi:

Chỉ sốNgưỡng cảnh báoNgưỡng nguy hiểm
Thờ gian phản hồi API (P95)> 2s> 5s
Độ sâu hàng đợi Worker> 100> 500
Tỷ lệ lỗi> 1%> 5%
Sử dụng đĩa> 70%> 85%
Sử dụng bộ nhớ> 75%> 90%

Chiến lược sao lưu #

#!/bin/bash
# backup-dify.sh — Chạy hàng ngày qua cron

DATE=$(date +%Y%m%d_%H%M%S)
BACKUP_DIR=/backups/dify

# Sao lưu PostgreSQL
docker exec dify-db pg_dump -U postgres dify > $BACKUP_DIR/dify_db_$DATE.sql

# Sao lưu Redis
docker exec dify-redis redis-cli BGSAVE

# Sao lưu lưu trữ file (nếu dùng local volume)
tar czf $BACKUP_DIR/dify_uploads_$DATE.tar.gz /var/lib/docker/volumes/dify_uploads/

# Tải lên S3 (tùy chọn)
aws s3 sync $BACKUP_DIR/ s3://your-backup-bucket/dify/ --delete

Mở rộng Worker #

Cho xử lý tài liệu khối lượng lớn, mở rộng Celery workers theo chiều ngang:

# docker-compose.override.yaml
services:
  worker:
    deploy:
      replicas: 3
    environment:
      - CELERY_WORKER_CONCURRENCY=8

  worker-beat:
    deploy:
      replicas: 1  # Giữ đúng 1 beat instance

So sánh với các lựa chọn thay thế #

Tính năngDifyFlowisen8nLangChain
GitHub Stars141.95551.000182.000110.000
Giấy phépApache-2.0MITFair-codeMIT
Trường hợp sử dụng chínhNền tảng AI appPrototype LLMTự động hóa workflowFramework code-first
Trình xây dựng trực quanCó (canvas)Có (node graph)Có (luồng tuyến tính)Không (chỉ code)
Đường cong học tậpRất thấpTrung bìnhTrung bìnhCao
RAG tích hợpXuất sắc (dataset-native)Tốt (LangChain)Cơ bản (qua node)Tự xây dựng
Hỗ trợ Vector DB30+10+5+20+
Nhà cung cấp LLM20+15+10+50+
Multi-AgentTrung bìnhMạnh (v2.0)Cơ bảnMạnh (LangGraph)
Ngườ dùng phi kỹ thuậtTốt nhấtKhông lý tưởngKhông lý tưởngKhông
SaaS Connectors~80~100400+Tự xây dựng
Tự hostDocker, K8s, HelmDocker, K8sDocker, K8sN/A (thư viện)
Tạo APITự độngThủ côngWebhook-basedThủ công
Công cụ đánh giáMạnh (dataset)Tối thiểuKhôngLangSmith (bên ngoài)
RAM tối thiểu (tự host)4 GB1 GB300 MBN/A
Giá cloud (nhập môn)$59/tháng$35/tháng$24/thángMiễn phí (thư viện)

Khi nào chọn gì #

  • Chọn Dify khi xây dựng ứng dụng AI hướng khách hàng, cần RAG mạnh, muốn thành viên phi kỹ thuật quản lý prompt và knowledge base, hoặc cần tạo API tự động. Dify là con đường nhanh nhất từ ý tưởng đến sản phẩm AI được triển khai.
  • Chọn Flowise khi bạn là lập trình viên thích các abstraction LangChain và muốn lớp prototype trực quan. Flowise có đường dẫn “eject” sạch nhất — xuất flow dưới dạng JSON và chuyển sang code Python LangChain.
  • Chọn n8n khi agent AI của bạn là một bước trong workflow tự động hóa lớn hơn. 400+ SaaS connectors của n8n và khả năng lập lịch, retry, xử lý lỗi đã được kiểm chứng là vô song cho các tích hợp nặng về vận hành.
  • Chọn LangChain khi cần kiểm soát toàn bộ ở cấp code, tích hợp CI/CD, độ trễ sub-second, hoặc điều phối multi-agent phức tạp mà công cụ low-code không thể biểu đạt.

Hạn chế / Đánh giá trung thực #

Dify không phải công cụ phù hợp cho mọi dự án AI. Đây là những gì nó không giỏi:

1. Khối lượng công việc độ trễ sub-second Độ trễ P95 của Dify cho workflow đơn giản là khoảng 1,2 giây, chủ yếu do truy vấn cơ sở dữ liệu giữa các node. Nếu cần phản hồi dưới 500ms (ví dụ: công cụ gợi ý real-time), hãy sử dụng framework code-first như LangGraph hoặc triển khai dịch vụ FastAPI chuyên dụng.

2. Cấu trúc dữ liệu phức tạp Canvas workflow có hỗ trợ nông cho các object lồng nhau sâu. Khi cần schema input/output phức tạp với mảng lồng nhau và trường điều kiện, Dify bắt buộc phải có giải pháp thay thế mà trong code không cần.

3. Tự động hóa workflow nặng Các workflow Dify tập trung vào AI. Nếu tự động hóa chủ yếu di chuyển dữ liệu giữa Salesforce, HubSpot, Slack và cơ sở dữ liệu với AI tối thiểu, n8n là lựa chọn phù hợp hơn. Thư viện connector phi-AI của Dify bị hạn chế so với 400+ tích hợp của n8n.

4. Hệ thống multi-agent quy mô lớn Mặc dù Dify hỗ trợ node agent, điều phối multi-agent phức tạp với shared state và dynamic planning được xử lý tốt hơn bởi LangGraph hoặc CrewAI. Khả năng agent của Dify đủ cho hầu hết trường hợp sử dụng nhưng không phải điều phối multi-agent nghiên cứu.

5. Xử lý tài liệu bị giới hạn bộ nhớ Lập chỉ mục dataset là đồng bộ và có thể mất vài phút cho upload lớn. Xử lý tài liệu với knowledge base rất lớn (100K+ tài liệu) cho thấy áp lực bộ nhớ đòi hỏi mở rộng worker cẩn thận.

Câu hỏi thường gặp #

Hỏi: Làm thế nào cài đặt Dify trên cloud VPS? Quá trình giống hệt cài đặt cục bộ. Cấu hình VPS với tối thiểu 4 GB RAM (DigitalOcean, Hetzner, hoặc AWS Lightsail đều phù hợp), cài Docker và Docker Compose, clone repo, và chạy docker compose up -d. Cho triển khai một cú click, sử dụng Hostinger để có giá tốt nhất cho VPS chạy Docker.

Hỏi: Dify có thể chạy hoàn toàn offline không? Có. Cấu hình Ollama làm nhà cung cấp mô hình và chạy các mô hình cục bộ như Llama 3.1, Qwen 2.5, hoặc Mistral. Tất cả dịch vụ Dify chạy bên trong Docker không cần phụ thuộc bên ngoài. Hạn chế duy nhất là không thể sử dụng API LLM cloud mà không có internet.

Hỏi: Làm thế nào nâng cấp Dify lên phiên bản mới?

cd dify/docker
docker compose down
git fetch --tags
git checkout $(curl -s https://api.github.com/repos/langgenius/dify/releases/latest | jq -r .tag_name)
docker compose pull
docker compose up -d

Luôn kiểm tra release notes cho các thay đổi phá vỡ và biến môi trường mới trước khi nâng cấp.

Hỏi: Sự khác biệt giữa Chatbot và Agent app type trong Dify là gì? Chatbot app theo template prompt cố định với truy xuất kiến thức tùy chọn. Agent app sử dụng ReAct hoặc Function Calling để tự chủ quyết định gọi công cụ nào và theo thứ tự nào. Dùng Chatbot cho Q&A đơn giản và Agent cho tác vụ phức tạp cần sử dụng công cụ và lý luận.

Hỏi: Tôi có thể dùng embedding model riêng thay vì OpenAI không? Có. Dify hỗ trợ nhiều nhà cung cấp embedding bao gồm Ollama (cục bộ), Cohere, Jina, và Hugging Face. Vào Cài đặt → Nhà cung cấp mô hình và thêm embedding model ưa thích. Bạn thậm chí có thể dùng model khác nhau cho embedding và generation.

Hỏi: Dify xử lý quyền riêng tư và bảo mật dữ liệu như thế nào? Dify là self-hosted — dữ liệu của bạn không bao giờ rờ khỏi hạ tầng trừ khi bạn chọn sử dụng API LLM cloud. Tất cả lưu trữ file, vector embedding, và lịch sử hội thoại nằm trong PostgreSQL và vector database của bạn. SSRF proxy cách ly yêu cầu outbound, và sandbox chạy code không đáng tin trong môi trường hạn chế.

Hỏi: Có giới hạn số knowledge base hoặc app có thể tạo không? Phiên bản mã nguồn mở không có giới hạn cứng. Giới hạn thực tế phụ thuộc vào hạ tầng: không gian đĩa cho tài liệu, dung lượng vector database cho embedding, và thông lượng worker API cho truy vấn. Hầu hết các đội ngũ chạy 50+ app và 20+ knowledge base trên một instance 8 GB RAM mà không gặp vấn đề.

Hỏi: Tôi có thể đóng góp cho Dify hoặc xây dựng plugin tùy chỉnh không? Có. Dify có hệ sinh thái plugin năng động. Bạn có thể xây dựng plugin nhà cung cấp model, plugin công cụ, hoặc plugin chiến lược agent bằng Python. Plugin daemon hỗ trợ hot-reload trong quá trình phát triển, giúp vòng lặp lặp đi lặp lại nhanh chóng. Xem tài liệu phát triển plugin để biết chi tiết.

Kết luận #

Dify lấp đầy khoảng trống mà các framework thuần túy và trình xây dựng chatbot đơn giản bỏ sót. Nó cung cấp trình xây dựng workflow trực quan với RAG cấp sản xuất, API tự động tạo, và hỗ trợ đa mô hình trong một stack triển khai duy nhất. Cho các đội ngũ phát hành ứng dụng AI — không chỉ prototype — sự kết hợp này tiết kiệm hàng tuần công việc tích hợp.

Trong 5 phút, bạn đã clone Dify, khởi động 11 container, tạo tài khoản admin, và kết nối nhà cung cấp LLM đầu tiên. Từ đó, bạn có thể xây dựng chatbot, agent, text generator, và workflow phức tạp — tất cả với canvas trực quan mà thành viên phi kỹ thuật có thể sử dụng.

Các hành động tuần này:

  1. Triển khai Dify trên hạ tầng của bạn bằng thiết lập Docker Compose ở trên
  2. Tạo knowledge base với tài liệu sản phẩm của bạn
  3. Xây dựng chatbot app và kiểm thử với REST API
  4. Chia sẻ kinh nghiệm triển khai trong cộng đồng lập trình viên dibi8 trên Telegram

Cần VPS giá rẻ để chạy Dify? Hostinger cung cấp VPS bắt đầu từ $3.99/tháng với Docker sẵn sàng — hoàn hảo cho việc tự host Dify và các ứng dụng AI khác.

Bài viết này chứa liên kết affiliate. Nếu bạn mua hàng qua các liên kết này, chúng tôi có thể nhận được hoa hồng mà không phát sinh chi phí thêm cho bạn. Điều này giúp chúng tôi duy trì các hướng dẫn công cụ mã nguồn mở như thế này.

Hosting Và Hạ Tầng Được Đề Xuất #

Trước khi triển khai các công cụ trên vào production, bạn cần hạ tầng vững chắc. Hai lựa chọn dibi8 đang dùng:

  • DigitalOcean — Credit miễn phí $200 trong 60 ngày, 14+ khu vực toàn cầu. Lựa chọn mặc định cho dev chạy AI tools open source.
  • HTStack — VPS Hong Kong, độ trễ thấp khi truy cập từ Trung Quốc. Cùng IDC đang host dibi8.com.

Liên kết tiếp thị — không tăng chi phí của bạn, giúp dibi8.com hoạt động.

Nguồn và tài liệu tham khảo #

  1. Tài liệu chính thức Dify — https://docs.dify.ai/
  2. Kho GitHub Dify — https://github.com/langgenius/dify
  3. Hướng dẫn triển khai Docker Compose Dify — https://docs.dify.ai/en/self-host/quick-start/docker-compose
  4. Tài liệu tham khảo API Dify — https://docs.dify.ai/en/use-dify/publish/developing-with-apis
  5. Phát triển plugin Dify — https://docs.dify.ai/en/plugins
  6. Bài viết blog kiến trúc Dify — https://dify.ai/blog/dify-rolls-out-new-architecture
  7. Ghi chú phát hành Dify v1.14.2 — https://github.com/langgenius/dify/releases/tag/1.14.2
  8. Kho GitHub Flowise — https://github.com/FlowiseAI/Flowise
  9. Kho GitHub n8n — https://github.com/n8n-io/n8n
  10. Tài liệu LangChain — https://python.langchain.com/
  11. So sánh: Dify vs Flowise vs n8n — https://rapidclaw.dev/blog/low-code-ai-agent-platforms-compared-2026
  12. Thiết lập LLM cục bộ Ollama — https://ollama.com/download

💬 Bình luận & Thảo luận