刚帮群里的一个老哥解决一个Bart模型生成的损失为0的问题。-CSDN blink-领先的开发者技术社区

热门

最新

红包

立Flag

投票

同城

我的

发布

4 年前

trueliu16659

刚帮群里的一个老哥解决一个Bart模型生成的损失为0的问题。给他找到了原因。发现是他对Bart训练的方式不理解，把target放到input中了，最后导致损失为0.简单总结一下：
损失为0 => 可能标签泄漏

CSDN App 扫码分享

分享

评论

点赞

打赏

复制链接
举报

下一条：

毕设选题推荐基于python的django框架的外来人口登记调查管理系统