杭州电子科技大学图书馆书目检索系统

Online Public Access Catalogue

| 暂存书架(0) | 登录

馆藏检索简单检索多字段检索

借阅关系图

相关资源

把本书分享到

EverNote
麦库
豆瓣
腾讯微博
新浪微博
人人网
网易微博
开心网

使用说明二维码

收藏此书的书架

点击查看CALIS E读信息

MARC状态：审校文献类型：中文图书浏览次数：188

题名/责任者:: 强化学习/(加) Richard S. Sutton, (美) Andrew G. Barto著俞凯等译

出版发行项:: 北京:电子工业出版社,2019

ISBN及定价:: 978-7-121-29516-4/CNY168.00

载体形态项:: xxviii, 519页:图;24cm

统一题名:: Reinforcement learning : an introduction

丛编项:: 智源人工智能丛书

个人责任者:: 桑顿 (Sutton, Richard S.) 著

个人责任者:: 巴图 (Barto, Andrew G.) 著

个人次要责任者:: 俞凯译

学科主题:: 机器学习-算法-研究

中图法分类号:: TP181

版本附注:: 译自原书第2版

出版发行附注:: 本书简体中文专有翻译出版权由博达著作权带你有限公司Bradon Chinese Media Agency代理The MIT Press授权电子工业出版社

责任者附注:: 责任者Sutton规范汉译姓: 桑顿; 责任者Barto规范汉译姓: 巴图

责任者附注:: 理查德·桑顿, DeepMind (埃德蒙顿) 公司的杰出科学家, 阿尔伯塔大学计算科学系教授。安德鲁·巴图, 马萨诸塞大学阿默斯特分校信息与计算机科学学院名誉教授。俞凯, 上海交通大学教授科学与工程系教授, 思必驰公司创始人、首席科学家。清华大学自动化系本科、硕士。剑桥大学工程系博士。

书目附注:: 有书目 (第473-519页)

提要文摘附注:: 本书作为强化学习思想的深度解剖之作, 被业内公认为是一本强化学习基础理论的经典著作。它从强化学习的基本思想出发, 深入浅出又严谨细致地介绍了马尔可大决策过程、蒙特卡落方法、时序差分方法、同轨离轨策略等强化学习的基本概念和方法, 并以大量的实例帮助读者理解强化学习的问题建模过程以及核心的算法细节。

全部MARC细节信息>>

索书号	条码号	年卷期	馆藏地	书刊状态	还书位置
TP181/750	72335479		自然书库（3F东）	可借	现代技术部（1F）
TP181/750	72335480		自然书库（3F东）	可借	现代技术部（1F）
TP181/750	72461547		自然书库（3F东）	可借	现代技术部（1F）
TP181/750	72461548		自然书库（3F东）	借出-应还日期：2024-12-08	现代技术部（1F）
TP181/750	72461549		自然书库（3F东）	借出-应还日期：2024-11-19	现代技术部（1F）

显示全部馆藏信息

CADAL相关电子图书

借阅趋势

同名作者的其他著作(点击查看)

收藏到：管理书架