机读格式显示(MARC)

000 01300nam 2200301 450

001 0000831187

005 20220506110200.0

010 __ |a 978-7-302-57820-8 |d CNY59.80

100 __ |a 20210906d2021 em y0chiy50 ea

101 0_ |a chi

102 __ |a CN |b 110000

105 __ |a af a 000yy

106 __ |a r

200 1_ |a 深度强化学习 |A shen du qiang hua xue xi |e 原理、算法与PyTorch实战 |f 刘全, 黄志刚编著

210 __ |a 北京 |c 清华大学出版社 |d 2021

215 __ |a XII, 243页, [12] 页图版 |c 图 |d 26cm

225 2_ |a 大数据与人工智能技术丛书 |A da shu ju yu ren gong zhi neng ji shu cong shu

300 __ |a 微课视频版

320 __ |a 有书目 (第241-243页)

330 __ |a 本书基于PyTorch框架, 用通俗易懂的语言深入浅出地介绍了强化学习的基本原理, 包括传统的强化学习基本方法和目前流行的深度强化学习方法。在对强化学习任务建模的基础上, 首先介绍动态规划法、蒙特卡洛法、时序差分法等表格式强化学习方法, 然后介绍在PyTorch框架下, DQN、DDPG、A3C等基于深度神经网络的大规模强化学习方法。全书以一个扫地机器人任务贯穿始终, 并给出具有代表性的实例, 增加对每个算法的理解。

410 _0 |1 2001 |a 大数据与人工智能技术丛书

606 0_ |a 机器学习 |A ji qi xue xi

690 __ |a TP181 |v 5

701 _0 |a 刘全 |A liu quan |4 编著

701 _0 |a 黄志刚 |A huang zhi gang |4 编著

801 _0 |a CN |b HDUL |c 20211028

905 __ |a HDUL |d TP181/080

920 __ |a 233030 |z 1