哇塞，RepoQA啊。这是一个用来评估大型语言模型对代码库理-CSDN blink-领先的开发者技术社区

热门

最新

红包

立Flag

投票

同城

我的

发布

1 年前

trueweixin_41975548

哇塞，RepoQA啊。这是一个用来评估大型语言模型对代码库理解程度的基准测试。它的内容包括：首先抛出一段代码，然后要求找到并解释用户指定的函数内容，并请求进行复制粘贴。如果大型语言模型能够正确地复制粘贴正确的函数，那么就算是正确的。看了一下排行榜，Claude3的Opus、Sonnet、Haiku占据了前三名。紧随其后的是GPT-4Turbo、Gemini1.5和Mixtral-8x7B。→RT

CSDN App 扫码分享

分享

评论

11

复制链接
举报

下一条：

链接：https://qq2890091630.blog.csdn.net/我是学习前端的小z小号，回三后会给评论点赞，会截图私信告知，如有遗漏私我补，感谢大佬支持o(￣┰￣*)ゞ