新的ORPO Colab针对Llama-3 8b已发布!ORPO将SFT和DPO合并为一个步骤,因此不再需要两步骤方法!此外,通过@走丢了猫,微调速度提升了2倍,使用的VRAM减少了80%,同时支持的上下文长度增加了4倍!感谢oKatanaaa和At&Dev让这成为可能!https://colab.research.google.com/drive/11t4njE3c4Lxl-07OD8lJSMKkfyJml3Tn?usp=sharing