机读格式显示(MARC)
- 000 02222nam0 2200373 450
- 010 __ |a 978-7-115-50830-0 |d CNY129.00
- 100 __ |a 20190413d2019 em y0chiy50 ea
- 200 1_ |a 基于函数逼近的强化学习与动态规划 |A ji yu han shu bi jin de qiang hua xue xi yu dong tai gui hua |f (罗) 卢西恩·布索尼 ... [等] 著 |d Reinforcement learning and dynamic programming using function approximators |f Lucian Busoniu |g 刘全, 傅启明, 章宗长译 |z eng
- 210 __ |a 北京 |c 人民邮电出版社 |d 2019
- 215 __ |a 249页 |c 图 |d 24cm
- 304 __ |a 题名页题: 卢西恩·布索尼, 罗伯特·巴布斯卡, 巴特·德·舒特, 达米安·厄恩斯特著
- 306 __ |a 本书中文简体字翻译版授权由人民邮电出版社独家出版并限在中国大陆地区销售
- 314 __ |a Lucian Busoniu, 荷兰代尔夫特理工大学代尔夫特系统与控制中心博士后研究员。Robert Babuska, 荷兰代尔夫特理工大学代尔夫特系统与控制中心教授。Bart De Schutter, 荷兰代尔夫特理工大学代尔夫特系统与控制中心海洋与运输技术系教授。刘全, 苏州大学教授、博士生导师。傅启明, 硕士生导师。章宗长, 苏州大学副教授。
- 320 __ |a 有书目 (第232-249页)
- 330 __ |a 本书讨论大规模连续空间的强化学习理论及方法, 重点介绍使用函数逼近的强化学习和动态规划方法。该研究已成为近年来计算机科学与技术领域中最活跃的研究分支之一。全书共分6章。第1章为概述; 第2章为动态规划与强化学习介绍; 第3章为大规模连续空间中的动态规划与强化学习; 第4章为基于模糊表示的近似值迭代; 第5章为用于在线学习和连续动作控制的近似策略迭代; 第6章为基于交叉熵基函数优化的近似策略搜索。
- 500 10 |a Reinforcement learning and dynamic programming using function approximators |A Reinforcement Learning And Dynamic Programming Using Function Approximators |m Chinese
- 606 0_ |a 机器学习 |A ji qi xue xi |x 研究
- 606 0_ |a 动态规划 |A dong tai gui hua |x 研究
- 701 _1 |a 布索尼 |A bu suo ni |g (Busoniu Lucian) |4 著
- 701 _1 |a 巴布斯卡 |A ba bu si ka |g (Babuska Robert) |4 著
- 701 _1 |a 舒特 |A shu te |g (Schutter Bart De) |4 著
- 702 _0 |a 刘全 |A liu quan |4 译
- 702 _0 |a 傅启明 |A fu qi ming |4 译
- 702 _0 |a 章宗长 |A zhang zong chang |4 译
- 801 _0 |a CN |b HDUL |c 20190520
- 905 __ |a HDUL |d TP181/4471