TheRealHumanEval：评估大型语言模型协助程序员-CSDN blink-领先的开发者技术社区

热门

最新

红包

立Flag

投票

同城

我的

发布

2 年前

truetechsavvyarankomatsuzaki

The RealHumanEval：评估大型语言模型协助程序员的能力

通过自动完成或聊天支持，展示了一个用于衡量大型语言模型协助程序员能力的网络界面。

仓库: https://github.com/clinicalml/realhumaneval
摘要: https://arxiv.org/abs/2404.02806

CSDN App 扫码分享

分享

1

121

复制链接
举报

下一条：

线性注意力序列并行性在1亿参数模型上，使用128个A100 80G GPUs将序列长度扩展到4096K，这比现有的SP方法的序列长度长8倍，同时速度显著更快。代码仓库：https://github.com/OpenNLPLab/LASP论文摘要：https://arxiv.org/abs/2404.02882