热门

最新

红包

立Flag

投票

同城

我的

发布
devjasonwei
燃燃Wei
2 年前
truedevjasonwei

新博客文章中我讨论了什么使得一个语言模型评估成功,以及“七个罪恶”如何阻碍评估在社区中的推广:https://www.jasonwei.net/blog/evals

昨天在斯坦福大学的NLP研讨会上演讲很有趣!

CSDN App 扫码分享
分享
9
92
  • 复制链接
  • 举报
下一条:
介绍SimPO:更简单、更有效的偏好优化!🎉显著超越DPO,无需参考模型!📈Llama-3-8B-SimPO在排行榜中名列前茅!💪✅在AlpacaEval 2上的LC胜率为44.7%✅在Arena-Hard上的胜率为33.8%https://arxiv.org/abs/2405.14734🧵[1/n]
立即登录