一句话解释什么是 gradient checking: 使用数值方法算出的梯度(近似值),来作为公式表示的梯度的近似值。 一句话补充原理:使用泰勒展开公式得到任意函数(也不是任意,需要一些条件,暂时略去)的近似计算公式, 这个公式在一堆临近点上求值,绘制出的曲线和真实的梯度误差很小。