ArenaELO图表已经更新了新模型。Llama370b看起-CSDN blink-领先的开发者技术社区

热门

最新

红包

立Flag

投票

同城

我的

发布

未眠叹流年、

2 年前

truedevmaximelabonne

Arena ELO图表已经更新了新模型。

Llama 3 70b看起来很让人印象深刻，但8b Instruct版本简直疯狂：它的表现超过了GPT-3.5、Claude 2和Mistral Medium。

目前变化很大，因为投票不多，但看它如何发展很有趣。

（抱歉我没能把Bigxtral instruct和Reka也放进去，重叠的内容太多了）

CSDN App 扫码分享

分享

14

206

复制链接
举报

下一条：

🦙 Early Llama 3 8B评估- 基础模型对于微调来说看起来很棒- 指令模型令人失望：与OpenChat/OpenHermes水平相当（但用了1000万样本！）- ORPO只用了1000个样本（和非常低的学习率）就取得了显著进展需要等待微调合并，但有趣的是它显著提高了GPT4All得分。🏆 排行榜：https://huggingface.co/spaces/mlabonne/Yet_Another_LLM_Leaderboard