ISBN/价格: | 978-7-121-36746-5:CNY89.00 |
---|---|
作品语种: | chi |
出版国别: | CN 110000 |
题名责任者项: | 深入浅出强化学习/.郭宪, 宋俊潇, 方勇纯著 |
出版发行项: | 北京:,电子工业出版社:,2020.03 |
载体形态项: | 264页:;+图:;+24cm |
提要文摘: | 本书分三大篇介绍了目前强化学习算法中最基本的算法。第一篇为基于值函数的强化学习算法, 该篇介绍了基于两种策略评估方法 (蒙特卡洛策略评估和时间差分策略评估) 的强化学习算法, 进而介绍了如何将函数逼近的方法引入到强化学习算法中。第二篇为直接策略搜索方法, 该篇介绍了最基本的策略梯度方法、基本的AC方法、PPO方法和DDPG算法。第三篇为基于模型的强化学习方法, 该篇介绍了基于mpc的方法, AlphaZero算法基本原理及在五子棋上的具体实现细节。 |
题名主题: | 机器学习 算法 |
中图分类: | TP181 |
个人名称等同: | 郭宪 著 |
个人名称等同: | 宋俊潇 著 |
个人名称等同: | 方勇纯 著 |
记录来源: | CN 人天书店 20200324 |