热门

最新

红包

立Flag

投票

同城

我的

发布
weixin_48653573
滴答滴滴答滴滴答滴滴答滴
4 年前
trueweixin_48653573

转

全套C C++ 编程视频课程收录

CSDN App 扫码分享
分享
评论
1
打赏
  • 复制链接
  • 举报
下一条:
原来自己写的normalization如果涉及很多参数的话是要设置成no grad啊。。。不然梯度一更新就爆炸,特征图全变成NAN。。但为什么损失还很正常呢。。。调了一下午一晚上的bug终于在睡前想到了这个可能性
立即登录