使用ORPO微调Llama3在几次实验之后，我编写了一个快速-CSDN blink-领先的开发者技术社区

热门

最新

红包

立Flag

投票

同城

我的

发布

未眠叹流年、

2 年前

truedevmaximelabonne

使用ORPO微调Llama 3

在几次实验之后，我编写了一个快速指南，介绍如何使用ORPO微调新的Llama 3 8B模型。希望你们会喜欢！

🤗 模型：https://huggingface.co/mlabonne/OrpoLlama-3-8B
💻 Colab：https://colab.research.google.com/drive/1eHNWg9gnaXErdAa8_mcvjMupbSS6rDvi?usp=sharing
📝 文章：https://huggingface.co/blog/mlabonne/orpo-llama-3

CSDN App 扫码分享

分享

11

290

复制链接
举报

下一条：

Arena ELO图表已经更新了新模型。Llama 3 70b看起来很让人印象深刻，但8b Instruct版本简直疯狂：它的表现超过了GPT-3.5、Claude 2和Mistral Medium。目前变化很大，因为投票不多，但看它如何发展很有趣。（抱歉我没能把Bigxtral instruct和Reka也放进去，重叠的内容太多了）