很高兴看到大家在使用我关于微调视觉语言模型(VLMs)的教程笔记 :)ChartGemma 是 PaliGemma 的微调版本。这个想法是使用一个闭源 API(Gemini Flash)来收集指令数据,然后用这些数据训练这个小模型https://huggingface.co/papers/2407.04172