机读格式显示(MARC)

000 01236nam0 2200289 450

001 0000962064

005 20240524100214.0

010 __ |a 978-7-302-65644-9 |d CNY139.00

100 __ |a 20240511d2024 emky0chiy50 ea

101 1_ |a chi |c eng

102 __ |a CN |b 110000

105 __ |a ak z 000yy

106 __ |a r

200 1_ |a 强化学习与最优控制 |9 qiang hua xue xi yu zui you kong zhi |b 专著 |d Reinforcement learning and optimal control |f (美)德梅萃·P.博塞克斯(Dimitri P. Bertsekas)著 |g 李宇超译 |z eng

210 __ |a 北京 |c 清华大学出版社 |d 2024.04

215 __ |a 271页 |c 图 |d 26cm

300 __ |a 信息技术和电气工程学科国际知名教材中译本系列

330 __ |a 本书的目的是考虑大型且具有挑战性的多阶段决策问题，这些问题原则上可以通过动态规划和最优控制来解决，但它们的精确解决方案在计算上是难以处理的。本书讨论依赖于近似的解决方法，以产生具有足够性能的次优策略。这些方法统称为增强学习，也可以叫做近似动态规划和神经动态规划等。

333 __ |a 最佳控制相关研究人员

510 1_ |a Reinforcement learning and optimal control |z eng

606 0_ |a 最佳控制 |j 教材

690 __ |a O232 |v 5

701 _0 |c (美) |a 博塞克斯 |9 bo sai ke si |c (Bertsekas, Dimitri P.) |4 著

702 _0 |a 李宇超 |9 li yu chao |4 译

801 _0 |a CN |b 人天书店 |c 20240511

900 __ |a 教材

962 __ |a 75156491