4. 使用RAG而不是将所有内容发送给LLM你还可以使用检索增强生成(RAG)代替直接将所有数据发送给LLM。RAG通过首先搜索预先索引的数据库来查找相关片段,然后将这些片段与原始查询一起提供给LLM,从而结合了信息检索和语言生成。RAG有助于减少发送给LLM的数据量,减少API调用和处理的tokens,从而降低成本。