来自 @皮孩爱球孩(我想是对的)的相当不错的开放后训练动机——LMSYS 上使用发布微调数据的最佳模型:- zephyr mixtral ORPO(第66名)- wizardlm(rip)(第74名)- tulu 2 70b(第78名)- 完全开放的模型是原始的 olmo instruct(第119名)