热门
最新
红包
立Flag
投票
同城
我的
发布
CSDN App 扫码分享
7
7
- 复制链接
- 举报
下一条:
我在过去的一周里一直在摆弄像LLaVa这样的视觉LLMs,这让我想起了pytorch_pretrained_bert的日子,当时的生态系统是一个自由的混合体,随机的GitHub仓库和在GDrive上共享的权重🤠作为一个谦逊的微调者,我对视觉LLM社区有几个请求:1. 让我们就像ChatML那样为所有SFT模型同意一个公共的聊天模板。1.1 更好的是,直接将聊天模板存储在tokenizer中,这样人们就不必从README或一些推断代码中挖掘它。参见@是小啾鸭在模板上的精彩文档:https://huggingface.co/docs/transformers/chat_templating1.2 最终的QoL改进将是在预训练模型中包含特殊标记,如<|im_start|>和