| 暂存书架(0) | 登录

MARC状态:审校 文献类型:中文图书 浏览次数:55

题名/责任者:
深度强化学习实践/(俄) 马克西姆·拉潘著 林然, 王薇译
出版发行项:
北京:机械工业出版社,2021
ISBN及定价:
978-7-111-68738-2/CNY149.00
载体形态项:
XVII, 617页:图;24cm
并列正题名:
Deep reinforcement learning hands-on
丛编项:
智能系统与技术丛书
个人责任者:
拉潘 (Lapan, Maxim)
个人次要责任者:
林然
个人次要责任者:
王薇
学科主题:
机器学习-算法
中图法分类号:
TP181
版本附注:
据原书第2版译出
出版发行附注:
本书中文简体字版由Packt Publishing授权出版
责任者附注:
马克西姆·拉潘, 一位深度学习爱好者和独立研究者。林然, 在2016年加入Thoughtworks之后, 主要担任全栈软件开发工程师。王薇, 北京邮电大学硕士, 现任Thoughtworks数据分析师。
提要文摘附注:
本书介绍了强化学习的基础知识, 以及如何动手编写智能体以执行一系列实际任务。本书首先介绍强化学习的概念、OpenAI Gym库以及PyTorch库。接着分别介绍几种强化学习方法: 交叉熵、Q-learning、DQN及其扩展以及高级强化学习库。然后介绍策略梯度及其扩展的A2C、A3C方法, 并研究可以使用策略梯度方法解决的实际问题: 使用RL训练聊天机器人、通过TextWorld环境解决基于文本的文字冒险游戏、Web导航和浏览器自动化。之后介绍连续控制问题、机器人技术中的强化学习、置信域方法等高级强化学习部分。接着介绍另一套RL方法: 黑盒优化。最后讨论RL的高级探索、基于模型的方法、AlphaGo Zero、离散优化、多智能体强化学习。
全部MARC细节信息>>
索书号 条码号 年卷期 馆藏地 书刊状态 还书位置
TP181/5302.2 60262337   临安自科(N-Z)(2F)(信息工程学院)     可借 临安自科(N-Z)(2F)(信息工程学院)
TP181/5302.2 60262338   临安自科(N-Z)(2F)(信息工程学院)     可借 临安自科(N-Z)(2F)(信息工程学院)
TP181/5302.2 72415256   自然书库(3F东)     借出-应还日期:2024-08-04 现代技术部(1F)
TP181/5302.2 72415257   自然书库(3F东)     借出-应还日期:2024-12-18 现代技术部(1F)
显示全部馆藏信息
CADAL相关电子图书
借阅趋势

同名作者的其他著作(点击查看)
用户名:
密码:
验证码:
请输入下面显示的内容
  证件号 条码号 Email
 
姓名:
手机号:
送 书 地:
收藏到: 管理书架