关于微调与扩展的问题经常出现https://arxiv.or-CSDN blink-领先的开发者技术社区

热门

最新

红包

立Flag

投票

同城

我的

发布

追风章鱼烧Chang

2 年前

trueweixin_36377930

关于微调与扩展的问题经常出现 https://arxiv.org/abs/2402.17193

这篇文章有点难读，但显示了一个乘法关系：扩展 x 预训练。非常有趣，在这种设置下，模型大小 > 代币数。像llama风格的过度训练没有免费的午餐吗？

CSDN App 扫码分享

分享

2

30

复制链接
举报

下一条：