图书馆

书目详细信息： 深入浅出强化学习:编程实战

ISBN/价格：	978-7-121-36746-5:CNY89.00
作品语种：	chi
出版国别：	CN 110000
题名责任者项：	深入浅出强化学习/.郭宪, 宋俊潇, 方勇纯著
出版发行项：	北京:,电子工业出版社:,2020.03
载体形态项：	264页:;+图:;+24cm
提要文摘：	本书分三大篇介绍了目前强化学习算法中最基本的算法。第一篇为基于值函数的强化学习算法, 该篇介绍了基于两种策略评估方法 (蒙特卡洛策略评估和时间差分策略评估) 的强化学习算法, 进而介绍了如何将函数逼近的方法引入到强化学习算法中。第二篇为直接策略搜索方法, 该篇介绍了最基本的策略梯度方法、基本的AC方法、PPO方法和DDPG算法。第三篇为基于模型的强化学习方法, 该篇介绍了基于mpc的方法, AlphaZero算法基本原理及在五子棋上的具体实现细节。
题名主题：	机器学习算法
中图分类：	TP181
个人名称等同：	郭宪著
个人名称等同：	宋俊潇著
个人名称等同：	方勇纯著
记录来源：	CN 人天书店 20200324

总体评分：（共0人）

我的评分：

收藏加入课程