热门

最新

红包

立Flag

投票

同城

我的

发布
weixin_40436573
徐易杭
2 年前
trueweixin_40436573

请查看我们的论文以获取更多详细信息,并关注即将发布的基于此工作的开源模型权重!

📜:
https://arxiv.org/abs/2407.02552

该工作由@梨花与虎领衔,合作人员包括@weixin_40844377 @咚懂咚懂咚 @骆骒驷 @娜塔丽圈圈 @这么强假的吧。

CSDN App 扫码分享
分享
评论
8
  • 复制链接
  • 举报
下一条:
我们发现多语言偏好优化从越来越多的多语言偏好数据中受益,表现出跨语言传递,并且在线优化(RLOO)优于离线优化(DPO)。
立即登录