机读格式显示(MARC)

000 01148nam 2200277 450

001 0000857924

005 20220517110100.0

010 __ |a 978-7-302-59938-8 |d CNY139.00

100 __ |a 20220406d2022 em y0chiy50 ba

101 0_ |a eng

102 __ |a CN |b 110000

105 __ |a a a 001yy

106 __ |a r

200 1_ |a 策略前展、策略迭代与分布式强化学习 |A ce lue qian zhan、ce lue die dai yu fen bu shi qiang hua xue xi |f (美) 德梅萃·P. 博赛卡斯著 |z chi

210 __ |a 北京 |c 清华大学出版社 |d 2022

215 __ |a xii, 483页 |c 图 |d 24cm

225 2_ |a 国际知名大学原版教材 |A guo ji zhi ming da xue yuan ban jiao cai |i 信息技术学科与电气工程学科系列

320 __ |a 有书目 (第451-476页) 和索引

330 __ |a 本书主要内容包括: 第1章为动态规划原理; 第2章为策略前展与策略改进; 第3章为专用策略前展算法; 第4章为值和策略的学习; 第5章为无限时间分布式和多智能体算法。

410 _0 |1 2001 |a 国际知名大学原版教材 |i 信息技术学科与电气工程学科系列

606 0_ |a 机器学习 |A ji qi xue xi |x 高等学校 |j 教材 |x 英文

690 __ |a TP181 |v 5

701 _1 |a 博赛卡斯 |A bo sai ka si |g (Bertsekas, Dimitri P.) |4 著

801 _0 |a CN |b HDUL |c 20220517

905 __ |a HDUL |d TP181/4322

920 __ |a 233030 |z 1