首页
[{"ID":42422,"Name":"理学"},{"ID":81272,"Name":"计算机科学技术"},{"ID":81532,"Name":"人工智能"},{"ID":81533,"Name":"机器学习"},{"ID":81550,"Name":"弱监督学习"},{"ID":81552,"Name":"强化学习"}]
. 理学 . 计算机科学技术 . 人工智能 . 机器学习 . 弱监督学习 . 强化学习时序差分学习
/temporal difference learning/
最后更新 2024-12-05
浏览 166次
时序差分学习算法是强化学习中一种用于预测的经典算法,最早由R.萨顿(Richard Sutton)提出。此算法可以获得和监督学习同样的效果,并且占用的内存更少、收敛更快。
- 英文名称
- temporal difference learning
- 创立时间
- 1988
- 创立者
- R.萨顿(Richard Sutton)
- 所属学科
- 计算机科学技术