MARC状态:审校 文献类型:中文图书 浏览次数:211
- 题名/责任者:
- 强化学习/(加) Richard S. Sutton, (美) Andrew G. Barto著 俞凯等译
- 出版发行项:
- 北京:电子工业出版社,2019
- ISBN及定价:
- 978-7-121-29516-4/CNY168.00
- 载体形态项:
- xxviii, 519页:图;24cm
- 丛编项:
- 智源人工智能丛书
- 个人责任者:
- 桑顿 (Sutton, Richard S.) 著
- 个人责任者:
- 巴图 (Barto, Andrew G.) 著
- 个人次要责任者:
- 俞凯 译
- 学科主题:
- 机器学习-算法-研究
- 中图法分类号:
- TP181
- 版本附注:
- 译自原书第2版
- 出版发行附注:
- 本书简体中文专有翻译出版权由博达著作权带你有限公司Bradon Chinese Media Agency代理The MIT Press授权电子工业出版社
- 责任者附注:
- 责任者Sutton规范汉译姓: 桑顿; 责任者Barto规范汉译姓: 巴图
- 责任者附注:
- 理查德·桑顿, DeepMind (埃德蒙顿) 公司的杰出科学家, 阿尔伯塔大学计算科学系教授。安德鲁·巴图, 马萨诸塞大学阿默斯特分校信息与计算机科学学院名誉教授。俞凯, 上海交通大学教授科学与工程系教授, 思必驰公司创始人、首席科学家。清华大学自动化系本科、硕士。剑桥大学工程系博士。
- 书目附注:
- 有书目 (第473-519页)
- 提要文摘附注:
- 本书作为强化学习思想的深度解剖之作, 被业内公认为是一本强化学习基础理论的经典著作。它从强化学习的基本思想出发, 深入浅出又严谨细致地介绍了马尔可大决策过程、蒙特卡落方法、时序差分方法、同轨离轨策略等强化学习的基本概念和方法, 并以大量的实例帮助读者理解强化学习的问题建模过程以及核心的算法细节。
全部MARC细节信息>>
索书号 | 条码号 | 年卷期 | 馆藏地 | 书刊状态 | 还书位置 |
TP181/750 | 72335479 | 自然书库(3F东) | 可借 | 现代技术部(1F) | |
TP181/750 | 72335480 | 自然书库(3F东) | 可借 | 现代技术部(1F) | |
TP181/750 | 72461547 | 自然书库(3F东) | 可借 | 现代技术部(1F) | |
TP181/750 | 72461548 | 自然书库(3F东) | 借出-应还日期:2024-12-08 | 现代技术部(1F) | |
TP181/750 | 72461549 | 自然书库(3F东) | 借出-应还日期:2024-11-19 | 现代技术部(1F) |
显示全部馆藏信息
CADAL相关电子图书
借阅趋势
同名作者的其他著作(点击查看)
收藏到: 管理书架