热门

最新

红包

立Flag

投票

同城

我的

发布
devmaximelabonne
未眠叹流年、
1 年前
truedevmaximelabonne

使用ORPO微调Llama 3

在几次实验之后,我编写了一个快速指南,介绍如何使用ORPO微调新的Llama 3 8B模型。希望你们会喜欢!

🤗 模型:
https://huggingface.co/mlabonne/OrpoLlama-3-8B
💻 Colab:https://colab.research.google.com/drive/1eHNWg9gnaXErdAa8_mcvjMupbSS6rDvi?usp=sharing
📝 文章:https://huggingface.co/blog/mlabonne/orpo-llama-3

CSDN App 扫码分享
分享
11
290
  • 复制链接
  • 举报
下一条:
Arena ELO图表已经更新了新模型。Llama 3 70b看起来很让人印象深刻,但8b Instruct版本简直疯狂:它的表现超过了GPT-3.5、Claude 2和Mistral Medium。目前变化很大,因为投票不多,但看它如何发展很有趣。(抱歉我没能把Bigxtral instruct和Reka也放进去,重叠的内容太多了)
立即登录