我写了一篇博客文章,介绍了我最近探索的一些内容:关于SGD学习动态的一些有趣方面以及SGD最终偏好的极小值类型https://rishit-dagli.github.io/2024/01/01/sgd.html