来看一下关于Llama3.1405B的第三方评估结果。SEA-CSDN blink-领先的开发者技术社区

热门

最新

红包

立Flag

投票

同城

我的

发布

2 年前

truedevhero

来看一下关于 Llama 3.1 405B 的第三方评估结果。

SEAL 和 Allen AI 的 ZeroEval 两个独立评估机构给出了自己的结果，405B 确实🐂🍺。

SEAL 上405B指令遵循第一、代码第四、数学第二。

ZeroEval 测试它整体性能介于 Sonnet 3.5 和 GPT4o 之间。

LMsys的结果还没出需要等一段时间。

CSDN App 扫码分享

分享

4

51

复制链接
举报

下一条：

找了一下现在可以体验 Llama3 405B 的地方，也就 Huggingface 和 Groq 了。Groq 是限量的，现在服务挂了，稳定体验还是推荐 Huggingface chat。