时序差分学习

高级搜索

专业板块专题板块大众板块

/temporal difference learning/

最后更新 2024-12-05

浏览 166次

最后更新 2024-12-05

浏览 166次

0 意见反馈条目引用

时序差分学习算法是强化学习中一种用于预测的经典算法，最早由R.萨顿（Richard Sutton）提出。此算法可以获得和监督学习同样的效果，并且占用的内存更少、收敛更快。

阅读历史

意见反馈

我们会尽快处理您的反馈！

您可以进入个人中心的反馈栏目查看反馈详情。

谢谢！