热门

最新

红包

立Flag

投票

同城

我的

发布
liu16659
说文科技
3 年前
trueliu16659

刚帮群里的一个老哥解决一个Bart模型生成的损失为0的问题。给他找到了原因。发现是他对Bart训练的方式不理解,把target放到input中了,最后导致损失为0.简单总结一下:
损失为0 => 可能标签泄漏

CSDN App 扫码分享
分享
评论
点赞
打赏
  • 复制链接
  • 举报
下一条:
毕设选题推荐基于python的django框架的外来人口登记调查管理系统
立即登录