热门
最新
红包
立Flag
投票
同城
我的
发布
滴答滴滴答滴滴答滴滴答滴
4 年前
trueweixin_48653573
转
全套C C++ 编程视频课程收录
下一条:
原来自己写的normalization如果涉及很多参数的话是要设置成no grad啊。。。不然梯度一更新就爆炸,特征图全变成NAN。。
但为什么损失还很正常呢。。。调了一下午一晚上的bug终于在睡前想到了这个可能性
立即登录