现在任何人都可以用几行代码在自己的数据集上训练一个多模态模型,使用TRL🚀!SFTTrainer现已支持像LLaVa这样的视觉LLMs,所以你可以微调你的模型以便它们既能“看见”又能遵循你的指示👀TRL: https://github.com/huggingface/trl完整脚本:https://github.com/huggingface/trl/blob/main/examples/scripts/vsft_llava.py