4.使用RAG而不是将所有内容发送给LLM你还可以使用检索增-CSDN blink-领先的开发者技术社区

热门

最新

红包

立Flag

投票

同城

我的

发布

2 年前

truedevhelicone

4. 使用RAG而不是将所有内容发送给LLM
你还可以使用检索增强生成（RAG）代替直接将所有数据发送给LLM。RAG通过首先搜索预先索引的数据库来查找相关片段，然后将这些片段与原始查询一起提供给LLM，从而结合了信息检索和语言生成。

RAG有助于减少发送给LLM的数据量，减少API调用和处理的tokens，从而降低成本。

CSDN App 扫码分享

分享

1

23

复制链接
举报

下一条：

降低你的LLM成本同时保持可靠输出是可能的，方法如下 🧵: https://www.helicone.ai/blog/slash-llm-cost