热门
最新
红包
立Flag
投票
同城
我的
发布
泛泛之素
4 年前
truetonydz0523
打卡
杭州市长庆街道
下一条:
https://www.zhihu.com/question/303070254/answer/573037166
这个trick还是挺牛逼的。pytorch中使用opt.zero_step()可以进行很多骚操作,比如使用梯度叠加实现低显存处理大数据。
立即登录