| 暂存书架(0) | 登录

MARC状态:审校 文献类型:中文图书 浏览次数:117

题名/责任者:
基于函数逼近的强化学习与动态规划/(罗) 卢西恩·布索尼 ... [等] 著 刘全, 傅启明, 章宗长译
出版发行项:
北京:人民邮电出版社,2019
ISBN及定价:
978-7-115-50830-0/CNY129.00
载体形态项:
249页:图;24cm
统一题名:
Reinforcement learning and dynamic programming using function approximators
个人责任者:
布索尼 (Busoniu Lucian)
个人责任者:
巴布斯卡 (Babuska Robert)
个人责任者:
舒特 (Schutter Bart De)
个人次要责任者:
刘全
个人次要责任者:
傅启明
个人次要责任者:
章宗长
学科主题:
机器学习-研究
学科主题:
动态规划-研究
中图法分类号:
TP181
题名责任附注:
题名页题: 卢西恩·布索尼, 罗伯特·巴布斯卡, 巴特·德·舒特, 达米安·厄恩斯特著
出版发行附注:
本书中文简体字翻译版授权由人民邮电出版社独家出版并限在中国大陆地区销售
责任者附注:
Lucian Busoniu, 荷兰代尔夫特理工大学代尔夫特系统与控制中心博士后研究员。Robert Babuska, 荷兰代尔夫特理工大学代尔夫特系统与控制中心教授。Bart De Schutter, 荷兰代尔夫特理工大学代尔夫特系统与控制中心海洋与运输技术系教授。刘全, 苏州大学教授、博士生导师。傅启明, 硕士生导师。章宗长, 苏州大学副教授。
书目附注:
有书目 (第232-249页)
提要文摘附注:
本书讨论大规模连续空间的强化学习理论及方法, 重点介绍使用函数逼近的强化学习和动态规划方法。该研究已成为近年来计算机科学与技术领域中最活跃的研究分支之一。全书共分6章。第1章为概述; 第2章为动态规划与强化学习介绍; 第3章为大规模连续空间中的动态规划与强化学习; 第4章为基于模糊表示的近似值迭代; 第5章为用于在线学习和连续动作控制的近似策略迭代; 第6章为基于交叉熵基函数优化的近似策略搜索。
全部MARC细节信息>>
索书号 条码号 年卷期 馆藏地 书刊状态 还书位置
TP181/4471 72296349   自然书库(3F东)     可借 现代技术部(1F)
TP181/4471 72296350   自然书库(3F东)     可借 自然书库(3F东)
显示全部馆藏信息
CADAL相关电子图书
借阅趋势

同名作者的其他著作(点击查看)
用户名:
密码:
验证码:
请输入下面显示的内容
  证件号 条码号 Email
 
姓名:
手机号:
送 书 地:
收藏到: 管理书架