MARC状态:审校 文献类型:中文图书 浏览次数:77
- 题名/责任者:
- 深度强化学习实践/(俄) 马克西姆·拉潘著 林然, 王薇译
- 出版发行项:
- 北京:机械工业出版社,2021
- ISBN及定价:
- 978-7-111-68738-2/CNY149.00
- 载体形态项:
- XVII, 617页:图;24cm
- 丛编项:
- 智能系统与技术丛书
- 个人责任者:
- 拉潘 (Lapan, Maxim) 著
- 个人次要责任者:
- 林然 译
- 个人次要责任者:
- 王薇 译
- 学科主题:
- 机器学习-算法
- 中图法分类号:
- TP181
- 版本附注:
- 据原书第2版译出
- 出版发行附注:
- 本书中文简体字版由Packt Publishing授权出版
- 责任者附注:
- 马克西姆·拉潘, 一位深度学习爱好者和独立研究者。林然, 在2016年加入Thoughtworks之后, 主要担任全栈软件开发工程师。王薇, 北京邮电大学硕士, 现任Thoughtworks数据分析师。
- 提要文摘附注:
- 本书介绍了强化学习的基础知识, 以及如何动手编写智能体以执行一系列实际任务。本书首先介绍强化学习的概念、OpenAI Gym库以及PyTorch库。接着分别介绍几种强化学习方法: 交叉熵、Q-learning、DQN及其扩展以及高级强化学习库。然后介绍策略梯度及其扩展的A2C、A3C方法, 并研究可以使用策略梯度方法解决的实际问题: 使用RL训练聊天机器人、通过TextWorld环境解决基于文本的文字冒险游戏、Web导航和浏览器自动化。之后介绍连续控制问题、机器人技术中的强化学习、置信域方法等高级强化学习部分。接着介绍另一套RL方法: 黑盒优化。最后讨论RL的高级探索、基于模型的方法、AlphaGo Zero、离散优化、多智能体强化学习。
全部MARC细节信息>>
索书号 | 条码号 | 年卷期 | 馆藏地 | 书刊状态 | 还书位置 |
TP181/5302.2 | 60262337 | 临安自科(N-Z)(2F)(信息工程学院) | 可借 | 临安自科(N-Z)(2F)(信息工程学院) | |
TP181/5302.2 | 60262338 | 临安自科(N-Z)(2F)(信息工程学院) | 可借 | 临安自科(N-Z)(2F)(信息工程学院) | |
TP181/5302.2 | 72415256 | 自然书库(3F东) | 借出-应还日期:2024-08-04 | 现代技术部(1F) | |
TP181/5302.2 | 72415257 | 自然书库(3F东) | 可借 | 现代技术部(1F) |
显示全部馆藏信息
CADAL相关电子图书
借阅趋势
同名作者的其他著作(点击查看)
收藏到: 管理书架