机读格式显示(MARC)

000 01060nam0 2200253 450

001 0000707399

005 20190513132100.0

010 __ |a 978-7-121-34000-0 |d CNY80.00

100 __ |a 20180511d2017 em y0chiy50 ea

101 0_ |a chi

105 __ |a y z 000yy

106 __ |a r

200 1_ |a 强化学习精要 |A Qiang Hua Xue Xi Jing Yao |e 核心算法与TensorFlow实现 |b 专著 |f 冯超著

210 __ |a 北京 |c 电子工业出版社 |d 2018

215 __ |a 392页 |d 26cm

225 2_ |a 博文视点AI系列 |A Bo Wen Shi Dian Ai Xi Lie

330 __ |a 强化学习是机器学习的一个分支，是阿尔法狗大战围棋冠军李世石时用到的核心技术。本书从学习强化学习必备的基础知识讲起（基础数学知识+神经网络+TensorFlow），过度到强化学习关注的经典算法（policy Gradient、Actor Critic、Q-Learning等），最后讲解前沿的强化学习方法（例如反向强化学习等）。

333 __ |a 人工智能从业者、科研人员。有深度学习、强化学习基础的读者。

606 0_ |a 机器学习-算法-研究 |A Ji Qi Xue Xi - Suan Fa - Yan Jiu

690 __ |a TP181 |v 4

701 _0 |a 冯超 |A Feng Chao |4 著

801 _0 |a CN |b HDUL |c 20181031

905 __ |a HDUL |d TP181/340

920 __ |a 233030 |z 1