热门

最新

红包

立Flag

投票

同城

我的

发布
techsavvyarankomatsuzaki
KKyujin_
2 年前
truetechsavvyarankomatsuzaki

自主评估与精炼数字代理

通过仅使用基于VLM的评估器,提高了WebArena的GPT4 SotA代理性能30%以上,以及iOS中的CogAgent性能75%以上,无需任何额外监督

仓库:
https://github.com/Berkeley-NLP/Agent-Eval-Refine
摘要:https://arxiv.org/abs/2404.06474

CSDN App 扫码分享
分享
2
141
  • 复制链接
  • 举报
下一条:
GoEX:朝着自主大型语言模型应用运行时的视角与设计介绍了一种大型语言模型(LLM)的运行时,具有直观的撤销和损害隔离抽象功能,使得在实践中更安全地部署LLM代理成为可能。repo: https://github.com/ShishirPatil/gorilla/abs: https://arxiv.org/abs/2404.06921
立即登录