热门
最新
红包
立Flag
投票
同城
我的
发布
使用 RAPTOR + Claude3 从头开始构建长上下文 RAG(视频)
长上下文 LLMs + 嵌入的兴起将改变 RAG 设计。索引完整文档是可行的,而不是拆分文档+索引文档块。
但是,灵活回答单个文档中的较低级别问题或跨多个文档的较高级别问题存在挑战。
RAPTOR( @parthsarthi03 等人)是通过构建文档摘要树来解决此问题的一种方法:对文档进行聚类,并对聚类进行汇总以捕获相似文档中的更高级别信息。
这是递归重复的,产生具有不同抽象级别的摘要树(文档是叶子,相关文档的中间摘要位于中间,文档的高级摘要位于根)。
我们使用 @AnthropicAI 中的 Claude3 模型构建摘要树,在 LangChain 文档的 33 个网页(每个网页 2k - 12k 代币)上进行了测试。
RAG 的页面和摘要树与 Claude3 一起索引,从而能够对较低级别的问题或较高级别的概念(在跨相关页面的摘要中捕获)进行 QA。
这个想法可以扩展到大型文档集合或任意大小的文档。下面是演示代码/从头开始构建此代码的视频:
视频:
https://youtu.be/jbGchdTL7d0
代码:
https://github.com/langchain-ai/langchain/blob/master/cookbook/RAPTOR.ipynb
Paper:
https://arxiv.org/html/2401.18059v1
人工智能时代
CSDN App 扫码分享
评论
点赞
打赏
- 复制链接
- 举报
