在计算机系统中,“经验”通常以数据的形式存在,因此机器学习所研究的主要内容是通过这些数据产生“模型”(model)。从数据产生模型的过程称之为“训练”(training),训练过程中使用的数据称为“训练数据”。人们训练得到模型后需要对模型进行评估。人们通常把分类错误的样本数占总数的比例称为错误率(error rate)。更一般的,人们把模型实际预测的输出与真实的输出之间的差异称之为误差(error),将模型在训练数据上的误差称之为经验误差(empirical error)或训练误差(training error)。人们希望得到能够在未见样本上表现好的模型,但由于在训练时无法得到未见样本,因此需要用经验误差来判断模型的好坏。