ISBN/价格: | 978-7-302-65644-9:CNY139.00 |
---|---|
作品语种: | chi eng |
出版国别: | CN 110000 |
题名责任者项: | 强化学习与最优控制/.(美)德梅萃·P. 博塞克斯著/.Dimitri P. Bertsekas/.李宇超译 |
出版发行项: | 北京:,清华大学出版社:,2024.04 |
载体形态项: | 271页:;+图:;+26cm |
丛编项: | 信息技术和电气工程学科国际知名教材中译本系列 |
提要文摘: | 本书考虑大规模且具有挑战性的多阶段决策问题。原则上, 动态规划能够给出此类问题的精确解。然而, 对于许多实际问题, 通过动态规划进行数值求解并不可行。本书探讨的求解方法通过采用恰当的近似手段, 在计算资源相对有限的前提下能够给出满足性能要求的次优策略。这类方法被统称为强化学习。强化学习的发展从最优控制和人工智能这两个领域的思想碰撞中获益良多。鉴于此, 作者力图在书中探讨这两个领域的共同边界, 从而为具有其中任一领域背景的研究者提供通向另一领域的桥梁。书中介绍的众多方法都已在实践中证明有效且具有坚实的理论与逻辑基础。作者将它们整理归纳到统一的理论框架下, 便于读者的理解。本书的主要内容包括: 精确动态规划、值空间的近似方法、参数化近似、无穷阶段问题的动态规划理论、相应的强化学习、聚集方法等。 |
题名主题: | 最佳控制 高等学校 教材 |
中图分类: | O232 |
个人名称等同: | 博塞克斯 著 |
个人名称次要: | 李宇超 译 |
记录来源: | CN 湖北三新 20240808 |