过拟合是指一个模型拟合了部分噪声,而不是真正数据。对我们而言,一个模型的好坏取决于它能否准确预测未来的未知数据。交叉验证的核心思想,就是在模型拟合的过程中并不使用全部的历史数据,而是保留一部分数据,用来模拟未来的数据,对模型进行检验。当一个模型过于简单,以致连训练数据都拟合得不够好时,称之为欠拟合(underfitting)。模型对于任何它没见过的数据都没有泛化能力——这最终导致它过拟合。