机读格式显示(MARC)

000 01998nam0 2200337 450

001 0000859707

005 20220615091500.0

010 __ |a 978-7-111-70072-2 |d CNY89.00

100 __ |a 20220425d2022 em y0chiy50 ea

101 1_ |a chi |c jpn

102 __ |a CN |b 110000

105 __ |a ak a 000yy

106 __ |a r

200 1_ |a Python深度强化学习入门 |A Python shen du qiang hua xue xi ru men |e 强化学习和深度学习的搜索与控制 |f (日) 伊藤多一 ... [等] 著 |g 王卫兵, 杨秋香等译

210 __ |a 北京 |c 机械工业出版社 |d 2022

215 __ |a xi, 239页 |c 图 |d 24cm

304 __ |a 题名页题: (日) 伊藤多一, 今津义充, 须藤广大, 仁平将人, 川崎悠介等著

306 __ |a 本书由翔泳社授权机械工业出版社在中国大陆地区 (不包括香港、澳门特别行政区及台湾地区) 出版与发行

320 __ |a 有书目 (第238-239页)

330 __ |a 本书共7章。第1章介绍了机器学习的分类、强化学习的学习机制以及深度强化学习的概念; 第2章通过强化学习的基本概念、马尔可夫决策过程和贝尔曼方程、贝尔曼方程的求解方法、无模型控制等介绍了强化学习的基本算法; 第3章通过深度学习、卷积神经网络 (CNN)、循环神经网络 (RNN)介绍了强化学习中深度学习的特征提取方法; 第4章通过行动价值函数的网络表示、策略函数的网络表示介绍了深度强化学习的实现; 第5章通过策略梯度法的连续控制、学习算法和策略模型等, 详细介绍了深度强化学习在连续控制问题中的应用及具体实现; 第6章通过巡回推销员问题和魔方问题详细介绍了深度强化学习在组合优化中的应用及具体实现; 第7章通过SeqGAN的文本生成和神经网络架构的搜索详细介绍了深度强化学习在时间序列数据生成的应用。在附录中还给出了Colaboratory和Docker等深度强化学习开发环境的构建。

517 1_ |a 强化学习和深度学习的搜索与控制 |A qiang hua xue xi he shen du xue xi de sou suo yu kong zhi

606 0_ |a 软件工具 |A ruan jian gong ju |x 程序设计

690 __ |a TP311.561 |v 5

701 _0 |a 伊藤多一 |A yi teng duo yi |4 著

701 _0 |a 今津义充 |A jin jin yi chong |4 著

701 _0 |a 须藤广大 |A xu teng guang da |4 著

702 _0 |a 王卫兵 |A wang wei bing |4 译

702 _0 |a 杨秋香 |A yang qiu xiang |4 译

801 _0 |a CN |b HDUL |c 20220615

905 __ |a HDUL |d TP311.561/2424

920 __ |a 233030 |z 1