以LLM(大型语言模型)作为其核心控制器构建代理是一个很酷的概念。几个概念验证演示,如AutoGPT、GPT-Engineer和BabyAGI,都是鼓舞人心的例子。LLM的潜力不仅限于生成写作、故事、论文和程序等优秀的副本,它可以被构建为一个强大的通用问题解决器。代理系统概述在以LLM驱动的自主代理系统中,LLM作为代理的大脑,辅以几个关键组件:规划子目标和分解:代理将大型任务分解为较小,可管理的子目标,从而有效地处理复杂的任务。反思和改进:代理可以对过去的行动进行自我批评和自我反思,从错误中学习并改进未来的步骤,从而提高最终结果的质量记忆我将所有的上下文学习(参考Prompt Engineering)都看成是利用模型的短期记忆来学习。长期记忆:长期记忆为代理提供了长期存储和召回(无限)信息的能力,它们通常通过利用外部的向量存储和快速检索来存储和召回(无限)信息。使用工具代理通过学会调用外部API来获取模型权重(通常在预训练后很难修改)中缺少的额外信息,包括当前信息,代码执行能力,访问专有信息源等。