RLHF 对齐多语言 LLM 是否有效?🤔我们的工作研究多语言偏好优化,以训练一个新的 SOTA 多语言 LLM,将对齐技术的前沿推进到涵盖世界一半人口的23种语言 🌎!https://arxiv.org/abs/2407.02552