自主评估与精炼数字代理通过仅使用基于VLM的评估器，提高了W-CSDN blink-领先的开发者技术社区

GoEX：朝着自主大型语言模型应用运行时的视角与设计介绍了一种大型语言模型（LLM）的运行时，具有直观的撤销和损害隔离抽象功能，使得在实践中更安全地部署LLM代理成为可能。repo:

https://github.com/ShishirPatil/gorilla/abs:

https://arxiv.org/abs/2404.06921