杭州电子科技大学图书馆书目检索系统

Online Public Access Catalogue

| 暂存书架(0) | 登录

馆藏检索简单检索多字段检索

借阅关系图

相关资源

把本书分享到

EverNote
麦库
豆瓣
腾讯微博
新浪微博
人人网
网易微博
开心网

使用说明二维码

收藏此书的书架

点击查看CALIS E读信息

MARC状态：审校文献类型：中文图书浏览次数：221

题名/责任者:: Python深度强化学习入门:强化学习和深度学习的搜索与控制/(日) 伊藤多一 ... [等] 著王卫兵, 杨秋香等译

出版发行项:: 北京:机械工业出版社,2022

ISBN及定价:: 978-7-111-70072-2/CNY89.00

载体形态项:: xi, 239页:图;24cm

其它题名:: 强化学习和深度学习的搜索与控制

个人责任者:: 伊藤多一著

个人责任者:: 今津义充著

个人责任者:: 须藤广大著

个人次要责任者:: 王卫兵译

个人次要责任者:: 杨秋香译

学科主题:: 软件工具-程序设计

中图法分类号:: TP311.561

题名责任附注:: 题名页题: (日) 伊藤多一, 今津义充, 须藤广大, 仁平将人, 川崎悠介等著

出版发行附注:: 本书由翔泳社授权机械工业出版社在中国大陆地区 (不包括香港、澳门特别行政区及台湾地区) 出版与发行

书目附注:: 有书目 (第238-239页)

提要文摘附注:: 本书共7章。第1章介绍了机器学习的分类、强化学习的学习机制以及深度强化学习的概念; 第2章通过强化学习的基本概念、马尔可夫决策过程和贝尔曼方程、贝尔曼方程的求解方法、无模型控制等介绍了强化学习的基本算法; 第3章通过深度学习、卷积神经网络 (CNN)、循环神经网络 (RNN)介绍了强化学习中深度学习的特征提取方法; 第4章通过行动价值函数的网络表示、策略函数的网络表示介绍了深度强化学习的实现; 第5章通过策略梯度法的连续控制、学习算法和策略模型等, 详细介绍了深度强化学习在连续控制问题中的应用及具体实现; 第6章通过巡回推销员问题和魔方问题详细介绍了深度强化学习在组合优化中的应用及具体实现; 第7章通过SeqGAN的文本生成和神经网络架构的搜索详细介绍了深度强化学习在时间序列数据生成的应用。在附录中还给出了Colaboratory和Docker等深度强化学习开发环境的构建。

全部MARC细节信息>>

索书号	条码号	年卷期	馆藏地	书刊状态	还书位置
TP311.561/2424	72449673		自然书库（3F东）	借出-应还日期：2025-05-30	现代技术部（1F）
TP311.561/2424	72449674		自然书库（3F东）	可借	现代技术部（1F）
TP311.561/2424	72449675		自然书库（3F东）	可借	现代技术部（1F）

显示全部馆藏信息

CADAL相关电子图书

借阅趋势

同名作者的其他著作(点击查看)

收藏到：管理书架