The RealHumanEval:评估大型语言模型协助程序员的能力通过自动完成或聊天支持,展示了一个用于衡量大型语言模型协助程序员能力的网络界面。仓库: https://github.com/clinicalml/realhumaneval摘要: https://arxiv.org/abs/2404.02806