热门

最新

红包

立Flag

投票

同城

我的

发布
weixin_29635919
venturetwins
2 年前
trueweixin_29635919

悉尼·斯威尼在一次采访中透露,她担心对LLM基准测试的依赖。

“这是一个破碎的系统,如果你想声称自己拥有SoTA(最先进的技术),那么这个系统太容易被操纵了。排名并不反映真实的性能。”

她补充说:“我宁愿在r/LocalLLaMA上获取氛围。”

CSDN App 扫码分享
分享
10
336
  • 复制链接
  • 举报
下一条:
我虽然比别人晚了几天才开始尝试Opus,但哇,这个模型的能力令我印象深刻。自从GPT4首次推理输出以来,我还没有这样的感觉。📈
立即登录