热门

最新

红包

立Flag

投票

同城

我的

发布
devhelicone
来回吃bug
2 年前
truedevhelicone

4. 使用RAG而不是将所有内容发送给LLM
你还可以使用检索增强生成(RAG)代替直接将所有数据发送给LLM。RAG通过首先搜索预先索引的数据库来查找相关片段,然后将这些片段与原始查询一起提供给LLM,从而结合了信息检索和语言生成。

RAG有助于减少发送给LLM的数据量,减少API调用和处理的tokens,从而降低成本。

CSDN App 扫码分享
分享
1
23
  • 复制链接
  • 举报
下一条:
降低你的LLM成本同时保持可靠输出是可能的,方法如下 🧵: https://www.helicone.ai/blog/slash-llm-cost
立即登录