热门

最新

红包

立Flag

投票

同城

我的

发布
weixin_33630090
Hvyntivka Mosina
2 年前
trueweixin_33630090

Databricks 现在支持由 NVIDIA L4 Tensor Core GPU 提供动力的 Amazon EC2 G6 实例!

这一新增功能标志着在 Databricks 数据智能平台上实现更高效和可扩展的数据处理、机器学习和 AI 工作负载迈出了重要一步。立即开始👇
https://dbricks.co/4emHb4e

CSDN App 扫码分享
分享
评论
10
  • 复制链接
  • 举报
下一条:
我们还展示了如何使用 SFR-Judge 改进原生指令微调模型。我们使用了我们的 70B 模型,不仅对 Llama-3.1-8B 的模型响应进行评分,还生成了改进的响应。这些评估和改进的响应被用于创建 DPO 训练数据,以继续微调 Llama-3.1-8B。使用 SFR-Judge-70B 创建 DPO 训练样本,在 AlpacaEval-2 上与其他基于分类器的方法相比,带来了下游性能的提升,其中更大的性能提升来自于使用我们的评估模型生成的改进响应。
立即登录