PageIndex: Loại Bỏ Cơ Sở Dữ Liệu Vector, Đạt Độ Chính Xác 98.7% Trên Tài Liệu Tài Chính Với RAG Dựa Trên Suy Luận
PageIndex: Loại Bỏ Cơ Sở Dữ Liệu Vector, Đạt Độ Chính Xác 98.7% Trên Tài Liệu Tài Chính Với RAG Dựa Trên Suy Luận GitHub Stars: 29.1k+ | Forks: 2.4k+ | Ngôn ngữ: Python | Giấy phép: Apache-2.0 RAG truyền thống có một bí mật đen tối: tương tự không phải là liên quan. Khi bạn nhúng một báo cáo tài chính 200 trang vào cơ sở dữ liệu vector và truy xuất các khối bằng độ tương tự cosin, bạn đang đánh cược rằng sự gần gũi ngữ nghĩa bằng tầm quan trọng thông tin. Thường thì không phải vậy. Hãy làm quen với PageIndex—một hệ thống RAG không vector, dựa trên suy luận, loại bỏ hoàn toàn cơ sở dữ liệu vector và thay thế bằng chỉ mục cây phân cấp được điều hướng bởi suy luận LLM. ...