热门

最新

红包

立Flag

投票

同城

我的

发布
weixin_41975548
umiyuki_ai
1 年前
trueweixin_41975548

哇塞,RepoQA啊。这是一个用来评估大型语言模型对代码库理解程度的基准测试。它的内容包括:首先抛出一段代码,然后要求找到并解释用户指定的函数内容,并请求进行复制粘贴。如果大型语言模型能够正确地复制粘贴正确的函数,那么就算是正确的。看了一下排行榜,Claude3的Opus、Sonnet、Haiku占据了前三名。紧随其后的是GPT-4Turbo、Gemini1.5和Mixtral-8x7B。→RT

CSDN App 扫码分享
分享
评论
11
  • 复制链接
  • 举报
下一条:
链接:https://qq2890091630.blog.csdn.net/我是学习前端的小z小号,回三后会给评论点赞,会截图私信告知,如有遗漏私我补,感谢大佬支持o( ̄┰ ̄*)ゞ
立即登录