| 暂存书架(0) | 登录

MARC状态:审校 文献类型:中文图书 浏览次数:188

题名/责任者:
强化学习/(加) Richard S. Sutton, (美) Andrew G. Barto著 俞凯等译
出版发行项:
北京:电子工业出版社,2019
ISBN及定价:
978-7-121-29516-4/CNY168.00
载体形态项:
xxviii, 519页:图;24cm
统一题名:
Reinforcement learning : an introduction
丛编项:
智源人工智能丛书
个人责任者:
桑顿 (Sutton, Richard S.)
个人责任者:
巴图 (Barto, Andrew G.)
个人次要责任者:
俞凯
学科主题:
机器学习-算法-研究
中图法分类号:
TP181
版本附注:
译自原书第2版
出版发行附注:
本书简体中文专有翻译出版权由博达著作权带你有限公司Bradon Chinese Media Agency代理The MIT Press授权电子工业出版社
责任者附注:
责任者Sutton规范汉译姓: 桑顿; 责任者Barto规范汉译姓: 巴图
责任者附注:
理查德·桑顿, DeepMind (埃德蒙顿) 公司的杰出科学家, 阿尔伯塔大学计算科学系教授。安德鲁·巴图, 马萨诸塞大学阿默斯特分校信息与计算机科学学院名誉教授。俞凯, 上海交通大学教授科学与工程系教授, 思必驰公司创始人、首席科学家。清华大学自动化系本科、硕士。剑桥大学工程系博士。
书目附注:
有书目 (第473-519页)
提要文摘附注:
本书作为强化学习思想的深度解剖之作, 被业内公认为是一本强化学习基础理论的经典著作。它从强化学习的基本思想出发, 深入浅出又严谨细致地介绍了马尔可大决策过程、蒙特卡落方法、时序差分方法、同轨离轨策略等强化学习的基本概念和方法, 并以大量的实例帮助读者理解强化学习的问题建模过程以及核心的算法细节。
全部MARC细节信息>>
索书号 条码号 年卷期 馆藏地 书刊状态 还书位置
TP181/750 72335479   自然书库(3F东)     可借 现代技术部(1F)
TP181/750 72335480   自然书库(3F东)     可借 现代技术部(1F)
TP181/750 72461547   自然书库(3F东)     可借 现代技术部(1F)
TP181/750 72461548   自然书库(3F东)     借出-应还日期:2024-12-08 现代技术部(1F)
TP181/750 72461549   自然书库(3F东)     借出-应还日期:2024-11-19 现代技术部(1F)
显示全部馆藏信息
CADAL相关电子图书
借阅趋势

同名作者的其他著作(点击查看)
用户名:
密码:
验证码:
请输入下面显示的内容
  证件号 条码号 Email
 
姓名:
手机号:
送 书 地:
收藏到: 管理书架