首页 . 工学 . 信息与通信工程 . 模式识别 . 统计模式识别 . 偏差-方差

偏差-方差

/bias-variance/
条目作者康文雄

康文雄

最后更新 2022-12-21
浏览 213
最后更新 2022-12-21
浏览 213
0 意见反馈 条目引用

因模型无法表示数据的复杂度而造成的偏差,以及由模型对训练数据过度敏感而造成的方差的误差。

英文名称
bias-variance
所属学科
信息与通信工程

模型的偏差是指预测值(估计值)的期望与真实值之间的差距。偏差越大,预测值越偏离真实值。模型的方差是指预测值的变化范围或离散程度。方差越大,预测值的分布越分散。通常,在偏差与方差之间,有这样一种规律:如果模型过于简单而无法捕捉变量之间的相互关系,则其具有较大的偏差。这种现象叫作欠拟合。如果模型过于复杂,就会过于贴近训练数据,则其具有较大的方差。这种现象叫作过拟合。在进行模型拟合时,应该适当地调整模型的复杂度,在模型的偏差与方差之间寻求一种平衡,来提高模型的泛化能力。

具体地,在给定数据集和数据标签的情况下,训练后模型所产生的误差可以分解为:

…(1)

式中为偏差;为方差;为受噪声影响模型通过学习所能够达到的误差下限。

机器学习算法主要是通过降低偏差或方差来减小最终优化后模型的误差,以集成学习为例,Boosting算法是通过多个模型加权线性组合来降低偏差的集成学习方法,即:

…(2)

式中为多个基模型;为每个基模型的权重。由于每次累加的新模型都将纠正前个模型组合的偏差,因此可以缓解模型的欠拟合问题。

Bagging算法是通过多个模型平均来降低方差的方法,即。假设每个基模型的方差为,则多个模型平均后方差为,因此可以缓解模型的过拟合问题。

相关条目

阅读历史

    意见反馈

    提 交

    感谢您的反馈

    我们会尽快处理您的反馈!
    您可以进入个人中心的反馈栏目查看反馈详情。
    谢谢!