热门
最新
红包
立Flag
投票
同城
我的
发布
徐易杭
10 月前
trueweixin_40436573
……以及《多语言对齐棱镜:对齐全球和本地偏好以减少伤害》,
https://arxiv.org/abs/2406.18682
祝贺所有作者!✨
下一条:
RLHF 可以说多种语言:为 LLM 解锁多语言偏好优化
https://arxiv.org/abs/2407.02552LLM
看,LLM 做:引导数据生成以针对不可微目标
https://arxiv.org/abs/2407.01490
[...]
立即登录