首页 . 理学 . 计算机科学技术 . 人工智能 . 机器学习 . 弱监督学习 . 强化学习

时序差分学习

/temporal difference learning/
最后更新 2024-12-05
浏览 166
最后更新 2024-12-05
浏览 166
0 意见反馈 条目引用

时序差分学习算法是强化学习中一种用于预测的经典算法,最早由R.萨顿(Richard Sutton)提出。此算法可以获得和监督学习同样的效果,并且占用的内存更少、收敛更快。

英文名称
temporal difference learning
创立时间
1988
创立者
R.萨顿(Richard Sutton)
所属学科
计算机科学技术

相关条目

阅读历史

    意见反馈

    提 交

    感谢您的反馈

    我们会尽快处理您的反馈!
    您可以进入个人中心的反馈栏目查看反馈详情。
    谢谢!