比较坏苹果和好橘子:通过联合偏好优化对齐大型语言模型📜 https://arxiv.org/abs/2404.00530与 @草莓大咩咩 @徐piaoliang @有机社会 @jkhkkiojjhu @请闭眼沉思(2/3)