机读格式显示(MARC)
- 010 __ |a 978-7-302-54032-8 |d CNY149.00
- 100 __ |a 20200619e2020 em y0chiy50 ba
- 200 1_ |a Reinforcement learning and optimal control |A Reinforcement learning and optimal control |f Dimitri P. Bertsekas |d = 强化学习与最优控制 |f (美) 德梅萃·P.博塞卡斯著 |z chi
- 210 __ |a 北京 |c 清华大学出版社 |d 2020.06
- 215 __ |a xvi, 373页 |c 图 |d 24cm
- 225 2_ |a 国际知名大学原版教材 |A guo ji zhi ming da xue yuan ban jiao cai |i 信息技术学科与电气工程学科系列
- 320 __ |a 有书目 (第345-368页) 和索引
- 330 __ |a 本书的目的是考虑大型且具有挑战性的多阶段决策问题, 这些问题原则上可以通过动态规划和最优控制来解决, 但它们的精确解决方案在计算上是难以处理的。该书分为六章, 内容包括: 动态规划的精确求解 ; 值空间的逼近 ; 参数逼近等。
- 410 _0 |1 2001 |a 国际知名大学原版教材 |i 信息技术学科与电气工程学科系列
- 510 1_ |a 强化学习与最优控制 |z chi
- 606 0_ |a 最佳控制 |A zui jia kong zhi |x 高等学校 |j 教材 |x 英文
- 701 _1 |a 博塞卡斯 |A bo sai ka si |g (Bertsekas, Dimitri P.) |4 著
- 801 _0 |a CN |b HDUL |c 20201022
- 905 __ |a HDUL |d O232/432