| ISBN/价格: | 978-7-122-45282-5:CNY69.80 |
|---|---|
| 作品语种: | chi |
| 出版国别: | CN 110000 |
| 题名责任者项: | 强化学习/.龚超 ... [等] 著 |
| 出版发行项: | 北京:,化学工业出版社:,2024.8 |
| 载体形态项: | 234页:;+图:;+21cm |
| 丛编项: | 人工智能超入门丛书 |
| 提要文摘: | 本书内容包含强化学习方向的基础知识, 如动态规划、时序差分等, 让读者在开始学习时对强化学习有初步的认识; 之后, 通过对马尔可夫决策过程及贝尔曼方程的解读, 逐渐过渡到强化学习的关键内容; 同时, 本书也解析了策略迭代与价值迭代两种核心算法, 也对蒙特卡洛方法、时序差分算法、深度强化学习及基于策略的强化学习算法进行了剖析。 |
| 并列题名: | Introduction to reinforcement learning eng |
| 题名主题: | 人工智能 普及读物 |
| 中图分类: | TP18 |
| 个人名称等同: | 龚超 著 |
| 个人名称等同: | 王冀 著 |
| 个人名称等同: | 梁霄 著 |
| 记录来源: | CN 百万庄 20250904 |