ISBN/价格: | 978-7-115-58470-0:CNY99.90 |
---|---|
作品语种: | chi |
出版国别: | CN 110000 |
题名责任者项: | Easy RL/.王琦, 杨毅远, 江季编著 |
出版发行项: | 北京:,人民邮电出版社:,2022.03 |
载体形态项: | 245页:;+图 (部分彩图):;+23cm |
提要文摘: | 本书结合了李宏毅老师的“深度强化学习”、周博磊老师的“强化学习纲要”、李科浇老师的“世界冠军带你从零实践强化学习”公开课的精华内容, 在理论严谨的基础上深入浅出地介绍马尔可夫决策过程、蒙特卡洛方法、时序差分方法、Sarsa、Q学习等传统强化学习算法, 以及策略梯度、近端策略优化、深度Q网络、深度确定性策略梯度等常见深度强化学习算法的基本概念和方法, 并以大量生动有趣的例子帮助读者理解强化学习问题的建模过程以及核心算法的细节。 |
题名主题: | 机器学习 教材 |
中图分类: | TP181 |
个人名称等同: | 王琦 编著 |
个人名称等同: | 杨毅远 编著 |
个人名称等同: | 江季 编著 |
记录来源: | CN 湖北三新 20221026 |