lang: zh slug: ragflow title: ‘RAGFlow:部署具有 80K+ 星的生产就绪型 RAG 引擎’ description: ‘RAGFlow 是一款开源检索增强生成 (RAG) 引擎,具有深入的文档理解和内置代理功能。 与 Ollama、OpenAI、Qdrant、Elasticsearch 和 Redis 兼容。 涵盖 Docker 部署、文档摄取、检索调整和生产强化。’ tags: [“container”, “devops”, “docker”, “knowledge-base”, “llm”, “open-source”, “rag”, “retrieval”] date: 2026-05-19 00:00:00+08:00 lastmod: 2026-05-19 00:00:00+08:00 tech_stack: [] application_domain: Llm Frameworks source_version: ’' licensing_model: Open Source license_type: Apache-2.0 file_size: ’' file_md5: ’' download_url: ’' backup_url: ’' github_repo: ‘https://github.com/infiniflow/ragflow' last_maintained: ‘2026-05-19’ draft: false categories: [’llm-frameworks’] aliases:- /帖子/ragflow/ 常见问题解答:
- q:“什么是 RAGFlow?它与其他 RAG 框架有何不同?” a:“RAGFlow 是一个开源检索增强生成引擎(80,000 多个 GitHub 明星,Apache-2.0),它将深入的文档理解与 LLM 支持的代理相结合。 与依赖于简单文本分割的通用 RAG 库不同,其 DeepDoc 引擎对 PDF、电子表格、幻灯片和扫描文档执行布局分析,以在摄取过程中保留表格、图像和标题。
- q:“运行 RAGFlow 的最低硬件要求是什么?” a: ‘最低要求是 4 个 CPU 核心 (x86_64)、16 GB RAM 和 50 GB SSD,使用 Docker 24.0.0+ 和 Docker Compose v2.26.1+。 对于为 50+ 用户提供服务的生产环境,请使用 8+ vCPU、32+ GB RAM 和 200+ GB NVMe; 如果使用 OCR 解析大型扫描 PDF,请添加具有 8+ GB VRAM 的 GPU。
- 问:“出于隐私考虑,RAGFlow 可以完全与本地法学硕士一起运行吗?” ‘是的。 RAGFlow 与 Ollama、vLLM、Xinference 和 LocalAI 集成,以实现完全本地推理。 在 service_conf.yaml.template 中配置提供程序的基本 URL,并通过 Ollama 拉取像 nomic-embed-text 这样的模型进行嵌入,并将其设置在模型提供程序下的 Web UI 中。 自托管时,文档保留在您的基础设施上,不会发送到外部服务,除非您配置云法学硕士。
- q: ‘RAGFlow 支持哪些文档格式?’ a:‘RAGFlow 支持 Word(DOC、DOCX)、PowerPoint(PPT、PPTX)、Excel(XLS、XLSX)、PDF、TXT、Markdown、图像(PNG、JPG、BMP、TIFF)、扫描副本、HTML 和 CSV。 它还可以从 Confluence、Notion、Google Drive、Discord 和 S3 导入数据。
- q: ‘RAGFlow 需要什么后端服务,它是轻量级的吗?’
a: ‘RAGFlow 不是单一二进制工具。 它需要多个后端服务:用于矢量和全文索引的 Elasticsearch 或 Infinity、用于对象存储的 MinIO、用于元数据的 MySQL 以及用于缓存和任务队列的 Redis。 因此,它至少需要 16 GB RAM; 对于简单的副业项目,像 LightRAG 这样的轻型替代品可能更合适。
featureImage: /images/articles/bcaea791-ragflow-deploy-production-ready-rag.png
特征图片:/images/articles/llm-frameworks-ragflow-deploy-293618.jpg—
——{{< 资源信息 >}}
PageIndex:29K⭐Vectorless RAG 系统 •
JuiceFS (14K⭐):分布式 POSIX 文件系统
## 介绍大多数 RAG 管道在生产中都会失败,因为它们将 PDF 和 PowerPoint 视为纯文本。 表格被破坏,图像标题消失,扫描的文档变得无法读取。 结果是一个检索系统将垃圾上下文返回给你的法学硕士——随之而来的是幻觉答案。 RAGFlow 是一个拥有超过 80,000 个 GitHub star 的开源 RAG 引擎,正是为了解决这个问题而构建的。 其 DeepDoc 引擎可理解文档布局,其内置代理框架可让您构建自主知识工作者,而不仅仅是聊天机器人。 在本指南中,您将在生产服务器上部署 RAGFlow、配置文档摄取、调整检索质量并将其与现有的 LLM 堆栈集成。## 什么是 RAGFlow?RAGFlow 是一种开源检索增强生成引擎,它将深入的文档理解与 LLM 支持的代理相结合,从复杂的企业文档中提供真实的、引用的答案。 与依赖简单文本分割的通用 RAG 库不同,RAGFlow 分析文档结构(表格、图像、标题和扫描页面)以在摄取过程中保留语义。 它作为一个基于 Docker 的平台提供,具有 Web UI、REST API 和代理构建器,使其适合构建管道的开发人员和管理知识库的非技术用户。## RAGFlow 的工作原理 RAGFlow 的架构遵循具有六个核心阶段的模块化管道设计:### 1. 文档摄取 (DeepDoc)文档通过 DeepDoc 解析引擎进入 RAGFlow。 DeepDoc 对 PDF、Word 文件、Excel 工作表、PowerPoint 幻灯片、图像和扫描副本执行布局分析。 它使用基于视觉的文档布局模型来识别表格、图形、标题、段落和文本块。 该阶段还支持外部解析器,例如 MinerU 和 Dobling 等专用格式。### 2.知识提取和分块解析后,RAGFlow 应用基于模板的分块策略。 您可以根据您的文档类型从多种分块模式中进行选择 - 简单、手动、问答、表格、纸张、书籍、法律、演示、图片和一种。 每个块都保留其结构上下文,RAGFlow 可以选择提取关键字并生成相关问题以提高检索召回率。### 3. 索引(混合搜索后端)块被索引到 Elasticsearch(默认)或 Infinity 以进行混合搜索。 支持全文搜索和密集向量搜索。 该系统使用可配置的嵌入模型计算嵌入,并将向量与倒排索引一起存储以进行关键字检索。### 4. 检索和重新排序当查询到达时,RAGFlow 执行多通道检索:关键字搜索、向量相似度搜索和知识图遍历(如果启用了 GraphRAG)。 在将结果传递到 LLM 上下文窗口之前,使用跨编码器重新排序器对结果进行融合和重新排序。### 5. 引用生成RAGFlow 构建一个提示,其中包括带有可追踪引用的检索块。 LLM 生成基于检索到的上下文的答案,RAGFlow 在响应旁边显示源块,以便用户可以验证每个声明。### 6. 代理执行(可选)除了简单的问答之外,RAGFlow 的代理框架还支持具有内存、工具调用、MCP(模型上下文协议)集成以及沙盒环境中的代码执行的多步骤工作流程。 代理可以浏览网络、查询数据库并链接多个检索操作。### 基础设施堆栈| Service | Purpose | Default Backend | |———|———|—————-| | Vector + Full-Text Store | Document indexing and search | Elasticsearch or Infinity | | Object Storage | File storage for uploaded documents | MinIO | | Metadata Database | User data, dataset configs, chat history | MySQL | | Cache & Queue | Task queuing and session caching | Redis | | Document Parser | Layout analysis and OCR | DeepDoc (built-in) | | Frontend | Web UI for dataset management | React + TypeScript | | Backend API | Core orchestration logic | Python + Go |## 安装和设置### 硬件要求| Resource | Minimum | Recommended for Production | |———-|———|—————————| | CPU | 4 cores (x86_64) | 8+ cores | | RAM | 16 GB | 32+ GB | | Disk | 50 GB SSD | 200+ GB NVMe | | Docker | 24.0.0+ | Latest stable | | Docker Compose | v2.26.1+ | Latest stable |> 注意: RAGFlow 正式支持 x86_64 平台。 ARM64 经过社区测试,但需要构建您自己的 Docker 映像。### 预部署:系统调优在启动 RAGFlow 之前,请确保已针对 Elasticsearch 调整内核参数:```` bas h
sysctl vm.max_map_count
Set to at least 262144 (required by Elasticsearch) #
sudo sysctl -w vm.max_map_count=262144
重启后仍然存在 #
回显“vm.max_map_count=262144”| sudo tee -a /etc/sysctl.conf
### 第 1 步:克隆存储库
bas
h
git 克隆 https://github.com/infiniflow/ragflow.git
cd 拉格流/docker
git checkout -f v0.25.4
### 步骤2:配置环境变量
bas
h
编辑环境文件 #
cp .env .env.backup 纳米环境
se
```ba
s
h
的关键变量
git 克隆 https://github.com/infiniflow/ragflow.git
cd 拉格流/docker
git checkout -f v0.25.4
```
ecure
_mysql_密码
MINIO_PASSWORD=your_secure_minio_password
REDIS_PASSWORD=your_secure_redis_password# 选择你的文档引擎:elastics```
bas
h
# 编辑环境文件
cp .env .env.backup
纳米环境
``th Docker Compose````
bas
h
# 仅 CPU 部署
docker compose -f docker-compose.yml u```
bas
h
# docker/.env
RAGFLOW_IMAGE=infiniflow/ragflow:v0.25.4
SVR_HTTP_PORT=80
MYSQL_PASSWORD=your_secure_mysql_password
MINIO_PASSWORD=your_secure_minio_password
REDIS_PASSWORD=your_secure_redis_password
# Choose your document engine: elasticsearch or infinity
DOC_ENGINE=弹性搜索
``____ __
# / __ \ / | / ____// ____// /____ _ __
# / /_/ // /| | // __ / /_ / // __ \| | /| //
# / _, _// ___ |/ /_/ // __/ / // /_/ /| |/ |/ /
# /_/ |_|/_/ |_|\____//_/ /_/ \____/ |__/|__/
# * 在所有地址 (0.0.0.0) 上运行
````### 第 4 步:配置您的 LLM 提供商编辑 `service_conf.yaml.temp```
bas
h
# 仅 CPU 部署
docker compose -f docker-compose.yml up -d
# GPU 加速文档解析 (NVIDIA)
# sed -i '1i DEVICE=gpu' .env
# docker compose -f docker-compose.yml up -d
``型号:gpt-4.1-mini
````支持的
LLM 提供商包括 OpenAI、Anthropic、DeepSeek、Gemini、Azure OpenAI、Bedrock 以及通过 Ollama 或 vLLM 的本地模型。 配置更改后重新启动容器:````
bas
h
d```
bas
h
# 观察日志直到看到成功消息
docker 日志 -f ragflow-server
# 预期输出:
# ____ ___ ______ __ __
# / __ \ / | / ____// ____// /____ _ __
# / /_/ // /| | // __ / /_ / // __ \| | /| //
# / _, _// ___ |/ /_/ // __/ / // /_/ /| |/ |/ /
# /_/ |_|/_/ |_|\____//_/ /_/ \____/ |__/|__/
# * 在所有地址 (0.0.0.0) 上运行
````流行工具### Ollama(本地法学硕士)对于气隙或隐私敏感的部署,请将 RAGFlow 连接到 Ollama:````
yam
l
# docker/service_conf.yaml.template
用户默认_llm:
工厂:奥拉马
api_key:“”
基本地址:http://host.docker.internal:11434
默认型号:llama3.2
````使用模型之前先在
Ollama 中拉取模型:````
bas
h
llama 拉 llama3.2
ollama 拉 nomic-embed-text
````在
RAGFlow Web UI 中的**设置 > 模型提供程序**下配置嵌入模型。### Ope```
yam
l
# docker/service_conf.yaml.template
用户默认_llm:
工厂:OpenAI
api_key: sk-your-openai-api-key
基本网址:https://api.openai.com/v1
默认型号:gpt-4.1-mini
```文件替换以避免硬编码秘密:````
bas
h
# 在.env中
OPENAI_API_KEY=询问您的密钥
````### Elasticsearch 到 Infinity 的迁移Infinity 是 RAGFlow 的融合上下文引擎,针对大规模部署进行了优化。 切换:````
bas
h
# 1. 停止所有容器并清除卷
docker compose -f docker-compose.yml down -v# 2.更新.env
sed -i 's/DOC```
bas
h
docker compose -f docker-compose.yml down
docker compose -f docker-compose.yml up -d
```
ym
l
向上 -d
````> **警告:** 这会擦除现有数据。 迁移前备份数据集。### Redis 作为外部缓存对于生产部署,请使用外部 Redis 集群:````
yam
l
# docker-c```
电子邮件:admin@ragflow.io
密码:(首次登录时设置)
命令:redis-server --requirepass ${REDIS_PASSWORD}
卷:
- redis_data:/数据
部署:
资源:
限制:
内存:2G
````### Qdrant 作为替代向量存储虽然 RAGFlow 本身使用 Elasticsearch 或 Infinity,但您可以通过 Python ``yaml 集成 Qdrant
# docker/service_conf.yaml.template
用户默认_llm:
工厂:奥拉马
api_key:“”
基本地址:http://host.docker.internal:11434
默认型号:llama3.2
```
y
="你的密钥",base_url="http://localhost:9380")
qdrant = QdrantClient(url="http://localhost:6333")# 将 RAGFlow 块与 Qdrant 向量相结合的自定义混合检索
chunks = ragflow.retrieve(dataset_i```
bas
h
llama 拉 llama3.2
ollama 拉 nomic-embed-text
```
rch
(collection="financial_reports", 矢量=query_embedding, limit=5)
````## 基准/实际用例### 检索质量基准AI M```
yam
l
的 2026 年基准
用户默认_llm:
工厂:OpenAI
api_key:${OPENAI_API_KEY}
基本网址:https://api.openai.com/v1
默认型号:gpt-4.1-mini
````| 骆驼索引 | 干草堆 | 浪链RAG |
|--------|---------|------------|---------|---------------|
| 答案准确度 | 97% | 94% | 95% | 91% |
| 平均。 检索延迟 | 420 毫秒 | 380 毫秒 | 450 毫秒 | 510 毫秒 |
bas h
在.env中 #
OPENAI_API_KEY=询问您的密钥
1,570 | 2,400 | | 框架开销| 8 毫秒 | 6 毫秒 | 5.9 毫秒 | 10 毫秒 | | 引文基础分数 | 96% | 88% | 90% | 82% |由于 Deepbash,RAGFlow 在准确性和引文基础方面处于领先地位
1. 停止所有容器并清除卷 #
docker compose -f docker-compose.yml down -v
2.更新.env #
sed -i ’s/DOC_ENGINE=elasticsearch/DOC_ENGINE=infinity/’ .env
3. 重新启动 #
docker compose -f docker-compose.yml up -d
| 带表格的 PDF | 保留完整结构 | 平面文本| 平面文本|
| 扫描的 PDF (OCR) | 原生支持 | 需要扩展 | 需要扩展 |
| PowerPoint 幻灯片 | 滑动感知分块 | 每张幻灯片 | 每张幻灯片 |
| Excel 电子表格 | 细胞水平提取| CSV 转换 | CSV 转换 |
| 多语言文档 | 跨语言查询 |```
yam
l
# docker-compose.yml(摘录)
服务:
雷迪斯:
图片:redis:7-alpine
命令:redis-server --requirepass ${REDIS_PASSWORD}
卷:
- redis_data:/数据
部署:
资源:
限制:
内存:2G
``80(数字海洋)|
| 部门(100 个用户)| 100 | 100 100,000 | 8 个 vCPU、32 GB RAM | ~200 美元(DigitalOcean)|
| 企业(1000+ 用户)| 1000+ | 100 万+ | 16 个 vCPU、64 GB RAM + GPU | ~$800+(云)|> Looking for a reliable cloud host for RAGFlow? Deploy on DigitalOcean
with one-click Docker setup, or use HTStack
for managed ```
pytho
n
from qdrant_client import QdrantClient
from ragflow_sdk import RAGFlow
# Connect to both systems
ragflow = RAGFlow(api_key="your-key", base_url="http://localhost:9380")
qdrant = QdrantClient(url="http://localhost:6333")
# Custom hybrid retrieval combining RAGFlow chunks with Qdrant vectors
chunks = ragflow.retrieve(dataset_id="ds_123", query="annual revenue 2025")
vectors = qdrant.search(collection="financial_reports", vector=query_embedding, limit=5)
``` proxy_set_header Host $host;
proxy_set_header X-Real-IP $remote_addr;
proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for;
proxy_set_header X-Forwarded-Proto $scheme;
proxy_read_timeout 300s;
}
}
```### 启用 GraphRAG 进行多跳推理GraphRAG从文档中提取知识图谱,实现跨文档推理:````蟒蛇
# 通过 RAGFlow Web UI 或 API
POST /api/datasets/{dataset_id}/chunks/graph
{
“方法”:“轻”,
"entity_types": ["人员"、"组织"、"产品"、"事件"],
“最大工人数”:4
}
GraphRA G 对于实体之间的关系跨越多个页面的法律文件、研究论文和财务报告特别有效。### 配置沙箱(代码执行)RAGFlow 的代理可以在沙盒环境中执行 Python 和 JavaScript 代码。 这需要 gVisor:```` bas h
安装gVisor(沙箱所需) #
sudo apt-get install -y runsc# 在 docker-compose.yml 中启用 服务: 碎屑流: 环境:
- ENABLE_SANDBOX = true 设备:
- /dev/kvm
### 使用 Prometheus 进行监控yam l
添加到 docker-compose.yml #
服务: 普罗米修斯: 图片:舞会/普罗米修斯:最新 卷:
- ./prometheus.yml:/etc/prometheus/prometheus.yml
- 普罗米修斯数据:/普罗米修斯 端口:
- “9090:9090”格拉法纳: 图片:grafana/grafana:最新 端口:
- “3000:3000” 卷:
- grafana_data:/var/lib/grafana
要监控的关键指标:yam l
普罗米修斯.yml #
scrap_configs:
- 工作名称:‘ragflow’ 静态配置:
- 目标:[‘ragflow-server:9380’]
指标路径:/指标
### 备份策略bas h #!/bin/bash
/opt/ragflow/backup.shBACKUP_DIR="/backups/ragflow/$(日期 +%Y%m%d)" #
mkdir -p $BACKUP_DIR# 备份MySQL
docker exec ragflow-mysql mysqldump -u root -p$MYSQL_PASSWORD ragflow > $BACKUP_DIR/mysql.sql# 备份Elasticsearch索引
docker exec ragflow-escurl -sX POST“localhost:9200/snapshot/backup”
-H ‘内容类型:application/json’
-d’{“indices”: “ragflow*”}’# 备份 MinIO 对象
docker exec ragflow-minio mc 镜像 /data $BACKUP_DIR/minio# 同步到远程存储
rclone 同步 $BACKUP_DIR s3:my-backup-bucket/ragflow/
|--------|---------|------------|---------|------------
---|
| **GitHub 之星** | 82,565 | 82,565 49,500 | 25,300 | 25,300 105,000 | 105,000
| **许可证** | 阿帕奇-2.0 | 麻省理工学院 | 阿帕奇-2.0 | 麻省理工学院 |
| **深度文档解析** | 德````
ngin
x
# /etc/nginx/sites-available/ragflow
服务器{
监听 443 ssl http2;
服务器名称 ragflow.yourcompany.com;
ssl_certificate /etc/letsencrypt/live/ragflow.yourcompany.com/fullchain.pem;
ssl_certificate_key /etc/letsencrypt/live/ragflow.yourcompany.com/privkey.pem;
地点/{
proxy_pass http://localhost:80;
proxy_set_header 主机 $host;
proxy_set_header X-真实IP $remote_addr;
proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for;
proxy_set_header X-Forwarded-Proto $scheme;
proxy_read_timeout 300s;
}
}
```在包装上
| Python 包 | Python 包 |
| **MCP 协议支持** | 是的 | 没有 | 没有 | 没有 |
| **REST API** | 完整的API | 需要建设 | 需要建设 | 需要建设 |
| **企业单点登录** | 是的 | 仅云 | 仅云 | 仅云 |### 何时选择什么- **RAGFlow**:您需要一个完整的自托管 RAG 平台,具有深入的文档理解、可视化 UI 和内置代理。 最适合处理需要全面数据控制的复杂文档(PDF、扫描件、电子表格)的企业。
- **LlamaIndex**:您正在构建具有特定索引需求的自定义 Python 应用程序,并且更喜欢库而不是平台。 最适合需要最大灵活性并且不介意构建自己的 python 的开发人员
# 通过 RAGFlow Web UI 或 API
POST /api/datasets/{dataset_id}/chunks/graph
{
“方法”:“轻”,
"entity_types": ["人员"、"组织"、"产品"、"事件"],
“最大工人数”:4
}
``ng。
- **LangChain RAG**:您想要最大的集成生态系统,并且不介意自己组装组件。 最适合快速原型设计和需要快速迭代的初创公司。## 局限性/诚实评估**不是一个轻量级工具。** RAGFlow 需要至少 16 GB RAM 和多个后端服务(Elasticsearch、MySQL、Redis、MinIO)。 这不是单一二进制部署。 如果您需要为业余项目进行简单的 RAG 设置,请考虑更轻的替代方案,例如 LightRA```
bas
h
# 安装gVisor(沙箱所需)
sudo apt-get install -y runsc
# 在 docker-compose.yml 中启用
服务:
碎屑流:
环境:
- ENABLE_SANDBOX = true
设备:
- /dev/kvm
````部署时间。**高级功能的学习曲线。** 可视化 UI 涵盖 80% 的用例,但启用 GraphRAG、配置自定义嵌入管道或构建代理需要仔细阅读文档。**没有```
yam
l
# 添加到 docker-compose.yml
服务:
普罗米修斯:
图片:舞会/普罗米修斯:最新
卷:
- ./prometheus.yml:/etc/prometheus/prometheus.yml
- 普罗米修斯数据:/普罗米修斯
端口:
- “9090:9090”
格拉法纳:
图片:grafana/grafana:最新
端口:
- “3000:3000”
卷:
- grafana_data:/var/lib/grafana
```其他在运行时下载嵌入模型或连接到外部嵌入服务。## 常见问题### 生产 RAGFlow 部署需要什么硬件?对于为 50 多个用户提供服务的生产部署,请使用至少具有 8 个 vCPU 核心、32 GB RAM 和 200 GB NVMe SSD 的服务器。 如果您要使用 OCR 解析大型扫描 PDF,请添加至少 8 GB 的 GPU``yaml
# 普罗米修斯.yml
scrap_configs:
- 工作名称:'ragflow'
静态配置:
- 目标:['ragflow-server:9380']
指标路径:/指标
`` 仅限法学硕士?是的。 RAGFlow 与 Ollama、vLLM、Xinference 和 LocalAI 集成。 使用本地 bash 的基本 URL 在“service_conf.yaml.template”中配置 LLM 提供程序
#!/bin/bash
# /opt/ragflow/backup.sh
BACKUP_DIR="/backups/ragflow/$(日期 +%Y%m%d)"
mkdir -p $BACKUP_DIR
# 备份MySQL
docker exec ragflow-mysql mysqldump -u root -p$MYSQL_PASSWORD ragflow > $BACKUP_DIR/mysql.sql
# 备份Elasticsearch索引
docker exec ragflow-escurl -sX POST“localhost:9200/_snapshot/backup”\
-H '内容类型:application/json' \
-d'{"indices": "ragflow_*"}'
# 备份 MinIO 对象
docker exec ragflow-minio mc 镜像 /data $BACKUP_DIR/minio
# 同步到远程存储
rclone 同步 $BACKUP_DIR s3:my-backup-bucket/ragflow/
```使用
RAGFlow 吗?自托管时,所有数据都保留在您的基础设施上。 文档存储在 MinIO 中,矢量存储在 Elasticsearch/Infinity 中,元数据存储在 MySQL 中——所有这些都在您的网络中。 除非您配置云 LLM 提供商,否则 RAGFlow 不会将文档发送到外部服务。 为了最大程度地保护隐私,请使用本地法学硕士和嵌入模型。### 如何将 RAGFlow 升级到新版本?首先,备份 MySQL 数据库和 Elasticsearch 索引。 然后拉取新的 Docker 映像,更新“.env”中的“RAGFLOW_IMAGE”变量,然后重新启动容器。 请务必检查发行说明以了解版本之间的重大更改。````
bas
h
cd 拉格流/docker
git fetch --标签
git checkout -f v0.25.4
# 使用新的图像标签更新 .env
docker compose -f docker-compose.yml down
docker compose -f docker-compose.yml 拉取
docker compose -f docker-compose.yml up -d
````### 我可以将 RAGFlow 集成到我现有的应用程序中吗?是的。 RAGFlow 公开完整的 REST API 并提供 Python 和 JavaScript SDK。 您可以以编程方式创建数据集、上传文档、启动聊天会话以及检索答案。 API 文档位于 RAGFlow 实例上的“/api/docs”。### RAGFlow 支持哪些文档格式?RAGFlow 支持 Word(DOC、DOCX)、PowerPoint(PPT、PPTX)、Excel(XLS、XLSX)、PDF、TXT、Markdown、图像(PNG、JPG、BMP、TIFF)、扫描副本、HTML 和 CSV。 它还支持从 Confluence、Notion、Google Drive、Discord 和 S3 导入数据。### RAGFlow 支持多租户吗?RAGFlow 在单个实例中支持多个用户和数据集,并具有基于角色的访问控制。 对于真正的多租户(具有单独数据的隔离租户),您当前需要运行单独的 RAGFlow 实例或在应用程序层实施租户过滤。### 自托管注意事项在您自己的 VPS 上运行这个吗? 尝试 DigitalOcean with $200 free Credit
— 足以进行 2 个月的适度自托管,以无风险地测试设置。 最适合中低流量; 当你不再需要它时,就可以扩展为专用。## 结论RAGFlow 是唯一一个在单个可部署系统中结合了深入的文档理解、可用于生产的 Web UI 和内置代理功能的开源 RAG 平台。 凭借 82,565 个 GitHub star 和活跃的开发周期,它已经证明了其对于需要的不仅仅是基本文本拆分 RAG 管道的团队的价值。 基于 Docker 的部署只需不到 30 分钟,并且混合搜索架构可提供比纯框架替代方案更好的检索质量。**您的后续步骤:**1. 克隆存储库并使用 Docker Compose 在服务器上部署 RAGFlow
2. 上传带有表格的复杂 PDF 并在 Web UI 中验证解析质量
3. 配置您首选的 LLM 提供商(OpenAI、DeepSeek 或 Ollama)
4. 设置 HTTPS 和自动备份以供生产使用
5. 加入社区以获得支持和功能更新加入我们的 [Telegram 开发者社区](https://t.me/dibi8opensource),了解部署技巧和生产 RAG 讨论。 分享您的 RAGFlow 设置 - 我们在每周新闻通讯中介绍最佳配置。*本文中的一些链接是附属链接。 如果您通过这些链接购买托管服务,我们可能会赚取佣金。 这不会影响我们的编辑建议。*
## 推荐的托管和基础设施在将上述任何工具部署到生产环境之前,您需要坚实的基础设施。 dibi8实际使用和推荐的两个选项:- **{< aff "digitalocean" "footer-cta-legacy" "DigitalOcean" >}}** — 200 美元免费赠金,为期 60 天,覆盖全球 14 个以上区域。 运行开源人工智能工具的独立开发者的默认选项。
- **{< aff "htstack" "footer-cta-legacy" "HTStack" >}}** — 从中国大陆低延迟访问的香港 VPS。 这与托管 dibi8.com 的 IDC 是同一个 IDC——在生产中经过了实际考验。*附属链接 - 它们不会花费您额外的费用,并且有助于保持 dibi8.com 的运行。*## 资料来源和进一步阅读- [RAGFlow GitHub 存储库](https://github.com/infiniflow/ragflow)
- [RAGFlow 官方文档](https://ragflow.io/docs/dev/)
- [RAGFlow 快速入门指南](https://ragflow.io/docs/dev/)
- [RAGFlow Docker 部署自述文件](https://github.com/infiniflow/ragflow/blob/main/docker/README.md)
- [DeepDoc文档理解](https://github.com/infiniflow/ragflow/tree/main/deepdoc)
- [RAGFlow REST API 参考](https://ragflow.io/docs/dev/category/references)
- [RAGFlow 与其他 RAG 框架基准测试](https://aimultiple.com/rag-frameworks)
- [LlamaIndex GitHub 存储库](https://github.com/run-llama/llama_index)
- [Haystack GitHub 存储库](https://github.com/deepset-ai/haystack)
- [2026 年最佳开源 RAG 框架比较](https://www.firecrawl.dev/blog/best-open-source-rag-frameworks)
- [RAGFlow 架构解释](https://milvus.io/ai-quick-reference/what-is-ragflow-and-how-does-it-work)
- [RAGFlow在VPS上的生产部署](https://zhujibaike.com/2497.html)
bas h cd 拉格流/docker git fetch –标签 git checkout -f v0.25.4
使用新的图像标签更新 .env #
docker compose -f docker-compose.yml down docker compose -f docker-compose.yml 拉取 docker compose -f docker-compose.yml up -d
💬 留言讨论