听说过聊天机器人竞技场吗？这是一个去中心化的、无偏见的、盲评-CSDN blink-领先的开发者技术社区

热门

最新

红包

立Flag

投票

同城

我的

发布

1 年前

truedevaibreakfast

听说过聊天机器人竞技场吗？

这是一个去中心化的、无偏见的、盲评的顶级语言模型排名系统。

用户向两个随机选择（匿名）的语言模型提交一个提示，然后被要求选择最佳回答，将评估转变为一项盲研究。

目前，在竞技场中，Claude 3 Opus的排名略微领先于GPT-4 Turbo，而Command R+是评分最高的开源模型。

您可以在这里尝试自己的提示（免费）并为评估做出贡献：https://arena.lmsys.org/

CSDN App 扫码分享

分享

2

58

复制链接
举报

下一条：

54243523560248455