热门

最新

红包

立Flag

投票

同城

我的

发布
devyumeng
瑞德西韦孟
2 年前
truedevyumeng

介绍SimPO:更简单、更有效的偏好优化!🎉

显著超越DPO,无需参考模型!📈

Llama-3-8B-SimPO在排行榜中名列前茅!💪
✅在AlpacaEval 2上的LC胜率为44.7%
✅在Arena-Hard上的胜率为33.8%

https://arxiv.org/abs/2405.14734
🧵[1/n]

CSDN App 扫码分享
分享
15
168
  • 复制链接
  • 举报
下一条:
在Config会议期间或Config周有什么与AI相关的活动我应该参加吗?
立即登录