What is Arize Phoenix used for?

Arize Phoenix is an open-source LLM observability and evaluation framework maintained by Arize AI that traces every span of a RAG pipeline, from embedding retrieval and prompt construction to model inference and token usage. It surfaces these traces in an interactive UI for debugging and optimizing LLM applications.

Is Arize Phoenix free and open source?

Yes. Phoenix is licensed under Apache-2.0 and is free to self-host. When self-hosted via pip or Docker, there is no vendor contract and no usage fee, unlike the proprietary commercial Arize platform that adds model monitoring, drift detection, SSO, and RBAC.

How do I install and run Arize Phoenix locally?

Install it with pip via `pip install "arize-phoenix[evals,llama-index,langchain]"`, then launch the server by running `python -c "import phoenix as px; px.launch_app()"`. Phoenix starts an embedded server at http://localhost:6006 and opens the UI in your browser automatically.

How much latency overhead does Phoenix add to production traffic?

Benchmarks show roughly 2.4 to 2.5 percent latency overhead for typical RAG pipelines. The impact is minimal because tracing is asynchronous, with spans batched and exported on a background thread; for ultra-low-latency use cases you can sample only a fraction of requests.

Can I use Arize Phoenix without LangChain or LlamaIndex?

Yes. Phoenix uses OpenTelemetry as its data model, so any framework or custom code emitting OTLP traces can be ingested. You write manual spans with the OpenTelemetry SDK and export them to http://localhost:6006/v1/traces.

Arize AI 凤凰：开源 LLM 可观测性工具，追踪您 RAG 流水线的 100%

Arize AI Phoenix：开源 LLM 可观测性工具，追踪 100% 的 RAG 管道 — 2026 年指南 — dibi8.com

## 简介：你无法修复看不到的东西 2026 年 1 月，一家金融科技初创公司每天提供 12,000 个查询 的生产 RAG 管道悄然开始产生幻觉。根本原因是什么？ 3 周前交换的检索器块大小配置错误。没有人注意到，因为没有人跟踪整个管道——只记录了最终的 LLM 输出。在人工审计发现这一事件之前，他们因客户流失而损失了 47,000 美元。这不是一个极端情况。根据 2026 年的行业调查，73% 的生产 LLM 申请缺乏跨检索 → 提示 → 生成生命周期的端到端跟踪。团队监控基础设施（CPU、RAM）和最终响应，但关键的中间部分——上下文检索、提示组装、令牌燃烧——仍然是一个黑匣子。 Arize Phoenix 正是解决了这个问题。它是一个开源 LLM 可观察性平台，可跟踪 RAG 管道的每个范围，从嵌入查找到提示渲染再到令牌消耗。凭借 6,500 多个 GitHub star、Apache-2.0 许可以及与 LangChain、LlamaIndex 和 OpenTelemetry 的深度集成，Phoenix 为您提供了自信地发布 LLM 应用程序所需的可见性。本指南将在 15 分钟内引导您从零到生产级可观测性。您将安装 Phoenix、检测 RAG 管道、跟踪令牌使用情况、设置评估以及使用 Docker 部署自托管。让我们来建造吧。 ## Arize Phoenix 是什么？ Arize Phoenix 是一个 LLM 应用程序的开源可观测性和评估框架，由 Arize AI 维护。它收集 LLM 调用整个生命周期的跟踪、跨度和评估（嵌入检索、提示构建、模型推理和响应生成），然后将它们显示在交互式 UI 中以进行调试和优化。 Phoenix 最初是作为 Arize 商业 ML 可观测平台的配套产品推出的，于 2023 年成为一个独立的开源项目。截至 2026 年 5 月，它支持OpenTelemetry 原生跟踪、LangChain 和 LlamaIndex 的自动检测、内置评估模板（幻觉检测、相关性评分）以及通过 Docker 或 pip 进行自托管部署。 Phoenix 不仅仅是一个日志查看器。它是一个结构调试工具，可让您准确检查检索了哪些块、如何将它们组装成提示、消耗了哪些令牌以及延迟峰值源自何处。 ## Phoenix 的工作原理：架构和核心概念 Phoenix 使用与 OpenTelemetry 一致的 基于跨度的跟踪模型。 LLM 管道中的每个操作都成为具有属性、事件和父子关系的跨度。该架构分为三层： ### 仪表层 Phoenix 为 Python 框架提供自动检测包。当您调用 LangChain 代理或 LlamaIndex 查询引擎时，Phoenix 会拦截该调用并为每个子操作创建跨度：矢量搜索、文档加载、提示格式化、LLM 调用和后处理。您不需要为标准集成编写手动日志记录代码。 ### 收集器和存储 Span 被发送到 Phoenix 收集器 - Python SDK 中的嵌入式收集器或独立的 Phoenix 服务器。收集器对跟踪进行标准化，计算派生指标（令牌计数、延迟百分位数）并存储它们以供查询。在自托管模式下，Phoenix 使用 PostgreSQL 进行持久化并支持可配置的保留。 ### 可视化用户界面 Phoenix UI 将跟踪呈现为交互式火焰图。您可以深入到任何跨度以检查其属性：检索的文档块、提示文本、模型参数、令牌使用情况和延迟细分。 UI 还支持比较分析 - 并排加载两条轨迹以查看参数更改如何影响管道。 ### 关键数据模型 | 概念| 描述 | |

Arize AI 凤凰：开源 LLM 可观测性工具，追踪您 RAG 流水线的 100% — 2026 指南

📦 出现在以下合集中

💬 留言讨论

🔗 相关资源推荐

📦 出现在以下合集中

💬 留言讨论