在一篇全面的技术指南中,Chaim Rand聚焦于模型训练方法,并讨论了“更高级的优化技术之一——将真正的高手与普通业余爱好者区分开来的技术——使用C++和CUDA创建自定义的PyTorch算子。” https://towardsdatascience.com/accelerating-ai-ml-model-training-with-custom-operators-163ef2a04b12