Ai-Search

PageIndex: Eliminate Vector Databases and Achieve 98.7% Accuracy on Financial Documents with Reasoning-Based RAG

PageIndex: Eliminate Vector Databases and Achieve 98.7% Accuracy on Financial Documents with Reasoning-Based RAG GitHub Stars: 29.1k+ | Forks: 2.4k+ | Language: Python | License: Apache-2.0 (implied from open-source repo) Traditional Retrieval-Augmented Generation (RAG) has a dirty secret: similarity is not relevance. When you embed a 200-page financial report into a vector database and retrieve chunks by cosine similarity, you are gambling that semantic proximity equals informational importance. It usually does not. Enter PageIndex—a vectorless, reasoning-based RAG system that throws out the vector database entirely and replaces it with a hierarchical tree index navigated by LLM reasoning. ...

PageIndex: Loại Bỏ Cơ Sở Dữ Liệu Vector, Đạt Độ Chính Xác 98.7% Trên Tài Liệu Tài Chính Với RAG Dựa Trên Suy Luận

PageIndex: Loại Bỏ Cơ Sở Dữ Liệu Vector, Đạt Độ Chính Xác 98.7% Trên Tài Liệu Tài Chính Với RAG Dựa Trên Suy Luận GitHub Stars: 29.1k+ | Forks: 2.4k+ | Ngôn ngữ: Python | Giấy phép: Apache-2.0 RAG truyền thống có một bí mật đen tối: tương tự không phải là liên quan. Khi bạn nhúng một báo cáo tài chính 200 trang vào cơ sở dữ liệu vector và truy xuất các khối bằng độ tương tự cosin, bạn đang đánh cược rằng sự gần gũi ngữ nghĩa bằng tầm quan trọng thông tin. Thường thì không phải vậy. Hãy làm quen với PageIndex—một hệ thống RAG không vector, dựa trên suy luận, loại bỏ hoàn toàn cơ sở dữ liệu vector và thay thế bằng chỉ mục cây phân cấp được điều hướng bởi suy luận LLM. ...

PageIndex: 벡터 데이터베이스를 제거하고 추론 기반 RAG로 금융 문서 98.7% 정확도 달성

PageIndex: 벡터 데이터베이스를 제거하고 추론 기반 RAG로 금융 문서 98.7% 정확도 달성 GitHub Stars: 29.1k+ | Forks: 2.4k+ | 언어: Python | 라이선스: Apache-2.0 전통적인 검색 증강 생성(RAG)에는 숨겨진 비밀이 있습니다: 유사성은 관련성이 아닙니다. 200페이지 금융 보고서를 벡터 데이터베이스에 임베딩하고 코사인 유사도로 청크를 검색할 때, 의미적 근접성이 정보적 중요도와 같다고 도박하고 있는 것입니다. 보통 그렇지 않습니다. PageIndex를 소개합니다—벡터 데이터베이스를 완전히 버리고 계층적 트리 인덱스를 LLM 추론으로 탐색하는 벡터리스, 추론 기반 RAG 시스템입니다. ...

PageIndex：消灭向量数据库，用推理型RAG实现金融文档98.7%准确率

PageIndex：消灭向量数据库，用推理型RAG实现金融文档98.7%准确率 GitHub Stars: 29.1k+ | Forks: 2.4k+ | 语言: Python | 许可证: Apache-2.0 传统检索增强生成（RAG）有一个不为人知的秘密：相似性不等于相关性。当你把一份 200 页的金融报告嵌入向量数据库并通过余弦相似度检索块时，你实际上在赌语义接近等于信息重要性。事实往往并非如此。进入 PageIndex——一款无向量、基于推理的 RAG 系统，它完全抛弃了向量数据库，转而使用由 LLM 推理导航的层次树索引。在这篇深度评测中，我们将拆解 PageIndex 的工作原理、它为何能在 FinanceBench 基准测试上达到最先进的 98.7% 准确率，以及如何将其部署到你自己的文档密集型应用中。向量 RAG 的问题基于向量的 RAG 流水线通常：将文档切分成任意固定大小的块。将每个块嵌入高维向量。检索与查询嵌入"最接近"的向量。这种方法在复杂专业文档上失败，因为：块边界破坏上下文：跨越两个块的表格失去意义。相似性 ≠ 相关性：关于"Q3 净收入"的查询可能检索到听起来相似的"Q2 总收入"段落，而非实际答案。无可解释性：你无法追踪为什么检索到某个块。昂贵的基础设施：向量数据库（Pinecone、Weaviate、Milvus）增加延迟、成本和运营复杂性。 PageIndex 是什么？ PageIndex 由 VectifyAI 开发，是一种代理型、上下文内树索引，使 LLM 能够对长文档执行基于推理的、类人检索。它不使用向量，而是构建文档的语义目录树结构，并使用树搜索导航到最相关的部分。核心哲学相关性需要推理。 PageIndex 模拟人类专家如何导航复杂文档：他们查看目录，推理哪些部分相关，深入挖掘，并迭代直到找到答案。PageIndex 使用 LLM 驱动的代理自动化这一过程。 PageIndex 如何工作步骤 1：树结构生成 PageIndex 将 PDF（或 Markdown）文档转换为层次 JSON 树： ...