机读格式显示(MARC)
- 000 01236nam0 2200289 450
- 010 __ |a 978-7-302-65644-9 |d CNY139.00
- 100 __ |a 20240511d2024 emky0chiy50 ea
- 200 1_ |a 强化学习与最优控制 |9 qiang hua xue xi yu zui you kong zhi |b 专著 |d Reinforcement learning and optimal control |f (美)德梅萃·P.博塞克斯(Dimitri P. Bertsekas)著 |g 李宇超译 |z eng
- 210 __ |a 北京 |c 清华大学出版社 |d 2024.04
- 215 __ |a 271页 |c 图 |d 26cm
- 300 __ |a 信息技术和电气工程学科国际知名教材中译本系列
- 330 __ |a 本书的目的是考虑大型且具有挑战性的多阶段决策问题,这些问题原则上可以通过动态规划和最优控制来解决,但它们的精确解决方案在计算上是难以处理的。本书讨论依赖于近似的解决方法,以产生具有足够性能的次优策略。这些方法统称为增强学习,也可以叫做近似动态规划和神经动态规划等。
- 510 1_ |a Reinforcement learning and optimal control |z eng
- 701 _0 |c (美) |a 博塞克斯 |9 bo sai ke si |c (Bertsekas, Dimitri P.) |4 著
- 702 _0 |a 李宇超 |9 li yu chao |4 译
- 801 _0 |a CN |b 人天书店 |c 20240511