机读格式显示(MARC)
- 000 01312oam2 2200277 450
- 010 __ |a 978-7-302-65644-9 |d CNY139.00
- 100 __ |a 20240509d2024 em y0chiy50 ea
- 200 1_ |a 强化学习与最优控制 |A qiang hua xue xi yu zui you kong zhi |d Reinforcement learning and optimal control |f (美)德梅萃·P.博塞克斯(DimitriP.Bertsekas)著 |g 李宇超译 |z eng
- 210 __ |a 北京 |c 清华大学出版社 |d 2024
- 215 __ |a 271页 |c 图 |d 26cm
- 300 __ |a 信息技术和电气工程学科国际知名教材中译本系列
- 330 __ |a 本书探讨的求解方法通过采用相关的近似,能够给出满足性能要求的次优策略。此类方法被统称为强化学习。强化学习从最优控制和人工智能这两个领域的思想碰撞中获益良多。本书的目的之一便是探讨这两个领域的共同边界,从而为具有其中任一领域背景的研究者提供通向另一领域的桥梁。另外一个目的则是挑选出许多在实践中证明有效的且具有坚实的理论与逻辑基础的方法,并将它们有组织地整理起来。
- 510 1_ |a Reinforcement learning and optimal control |z eng
- 606 0_ |a 最佳控制 |A Zui Jia Kong Zhi |j 教材
- 701 _0 |c (美) |a 博塞克斯 |A bo sai ke si |c (Bertsekas, Dimitri P.) |4 著
- 702 _0 |a 李宇超 |A li yu chao |4 译
- 801 _0 |a CN |b HDUL |c 20240918
- 905 __ |a HDUL |d O232/4341