现在任何人都可以用几行代码在自己的数据集上训练一个多模态模型-CSDN blink-领先的开发者技术社区

热门

最新

红包

立Flag

投票

同城

我的

发布

2 年前

truedevlewistunstall

现在任何人都可以用几行代码在自己的数据集上训练一个多模态模型，使用TRL🚀！

SFTTrainer现已支持像LLaVa这样的视觉LLMs，所以你可以微调你的模型以便它们既能“看见”又能遵循你的指示👀

TRL: https://github.com/huggingface/trl

完整脚本：https://github.com/huggingface/trl/blob/main/examples/scripts/vsft_llava.py

CSDN App 扫码分享

分享

5

253

复制链接
举报

下一条：

非常兴奋我们关于理解力（grokking）加上披萨的研究被@开水没温度报道了！人工智能或多或少是“外星智能”——就像在生物学中一样，我们需要科学方法来研究这些“新生命”。https://www.quantamagazine.org/how-do-machines-grok-data-20240412/