热门

最新

红包

立Flag

投票

同城

我的

发布
devmaximelabonne
未眠叹流年、
2 年前
truedevmaximelabonne

Arena ELO图表已经更新了新模型。

Llama 3 70b看起来很让人印象深刻,但8b Instruct版本简直疯狂:它的表现超过了GPT-3.5、Claude 2和Mistral Medium。

目前变化很大,因为投票不多,但看它如何发展很有趣。

(抱歉我没能把Bigxtral instruct和Reka也放进去,重叠的内容太多了)

CSDN App 扫码分享
分享
14
206
  • 复制链接
  • 举报
下一条:
🦙 Early Llama 3 8B评估- 基础模型对于微调来说看起来很棒- 指令模型令人失望:与OpenChat/OpenHermes水平相当(但用了1000万样本!)- ORPO只用了1000个样本(和非常低的学习率)就取得了显著进展需要等待微调合并,但有趣的是它显著提高了GPT4All得分。🏆 排行榜:https://huggingface.co/spaces/mlabonne/Yet_Another_LLM_Leaderboard
立即登录