MARC状态:审校 文献类型:中文图书 浏览次数:222
- 题名/责任者:
- Python深度强化学习入门:强化学习和深度学习的搜索与控制/(日) 伊藤多一 ... [等] 著 王卫兵, 杨秋香等译
- 出版发行项:
- 北京:机械工业出版社,2022
- ISBN及定价:
- 978-7-111-70072-2/CNY89.00
- 载体形态项:
- xi, 239页:图;24cm
- 其它题名:
- 强化学习和深度学习的搜索与控制
- 个人责任者:
- 伊藤多一 著
- 个人责任者:
- 今津义充 著
- 个人责任者:
- 须藤广大 著
- 个人次要责任者:
- 王卫兵 译
- 个人次要责任者:
- 杨秋香 译
- 学科主题:
- 软件工具-程序设计
- 中图法分类号:
- TP311.561
- 题名责任附注:
- 题名页题: (日) 伊藤多一, 今津义充, 须藤广大, 仁平将人, 川崎悠介等著
- 出版发行附注:
- 本书由翔泳社授权机械工业出版社在中国大陆地区 (不包括香港、澳门特别行政区及台湾地区) 出版与发行
- 书目附注:
- 有书目 (第238-239页)
- 提要文摘附注:
- 本书共7章。第1章介绍了机器学习的分类、强化学习的学习机制以及深度强化学习的概念; 第2章通过强化学习的基本概念、马尔可夫决策过程和贝尔曼方程、贝尔曼方程的求解方法、无模型控制等介绍了强化学习的基本算法; 第3章通过深度学习、卷积神经网络 (CNN)、循环神经网络 (RNN)介绍了强化学习中深度学习的特征提取方法; 第4章通过行动价值函数的网络表示、策略函数的网络表示介绍了深度强化学习的实现; 第5章通过策略梯度法的连续控制、学习算法和策略模型等, 详细介绍了深度强化学习在连续控制问题中的应用及具体实现; 第6章通过巡回推销员问题和魔方问题详细介绍了深度强化学习在组合优化中的应用及具体实现; 第7章通过SeqGAN的文本生成和神经网络架构的搜索详细介绍了深度强化学习在时间序列数据生成的应用。在附录中还给出了Colaboratory和Docker等深度强化学习开发环境的构建。
全部MARC细节信息>>
索书号 | 条码号 | 年卷期 | 馆藏地 | 书刊状态 | 还书位置 |
TP311.561/2424 | 72449673 | 自然书库(3F东) | 借出-应还日期:2025-05-30 | 现代技术部(1F) | |
TP311.561/2424 | 72449674 | 自然书库(3F东) | 可借 | 现代技术部(1F) | |
TP311.561/2424 | 72449675 | 自然书库(3F东) | 可借 | 现代技术部(1F) |
显示全部馆藏信息
CADAL相关电子图书
借阅趋势
同名作者的其他著作(点击查看)
收藏到: 管理书架