之前达到96%准确率的记录是46秒,也是由我创下的。更新日志:* 改进了学习率计划:预热时间现在缩短了2.3倍,最终衰减到零。* 改进了架构:将每个模块的最终激活移动到残差之后,就像在原始的ResNet中那样。* 减少了权重衰减。