目前最流行的也是最理想的AI Agent框架是由OpenAI提出的“LLM+记忆+规划+工具使用”四件套。对于一款AI Agent来说,LLM、记忆和规划担当了任务的分析、拆解与规划,工具使用则关系着执行任务的能力。任务规划得再好,没有执行能力也无法完成任务。从目前市面上大多AI Agent以及用户反馈来看,AI智能体想要真正在B端实现量级业务场景的落地及更好地商用,需要综合考量其本身的安全性、技术发展周期是否成熟以及To B端的场景是否密切贴合,更需要考虑接口成本、隐私、管理、授权等诸多因素。从具体需求来看,比如金融领域大B客户对于查询和拆解指标、项目数据查看分析、推送报表/报告等需求,看起来简单却不是简单的GPTs或者知识内容类Agent能够实现的。其中的业务流程涉及到了深入企业管理系统的复杂流程自动化构建,更涉及到了数据库读取、API管理及UI自动化连接等。目前仅是基于API接口读取数据及调用工具插件的Agent,难以实现这样的流程应用,而基于LLM并同时兼顾API与UI自动化的RPA Agent是不错的解决方案。在广大企业关注的数据安全方面,相较于API模式,RPA模式的优势在于对系统的无侵入。通过结合ISSUT(智能屏幕语义理解)等技术,RPA能够对人类操作系统的行为进行模仿,并通过识别屏幕上的软件进行操作,全流程不会对系统和数据造成任何损害。