机读格式显示(MARC)
- 000 01060nam0 2200253 450
- 010 __ |a 978-7-121-34000-0 |d CNY80.00
- 100 __ |a 20180511d2017 em y0chiy50 ea
- 200 1_ |a 强化学习精要 |A Qiang Hua Xue Xi Jing Yao |e 核心算法与TensorFlow实现 |b 专著 |f 冯超著
- 210 __ |a 北京 |c 电子工业出版社 |d 2018
- 225 2_ |a 博文视点AI系列 |A Bo Wen Shi Dian Ai Xi Lie
- 330 __ |a 强化学习是机器学习的一个分支,是阿尔法狗大战围棋冠军李世石时用到的核心技术。本书从学习强化学习必备的基础知识讲起(基础数学知识+神经网络+TensorFlow),过度到强化学习关注的经典算法(policy Gradient、Actor Critic、Q-Learning等),最后讲解前沿的强化学习方法(例如反向强化学习等)。
- 333 __ |a 人工智能从业者、科研人员。有深度学习、强化学习基础的读者。
- 606 0_ |a 机器学习-算法-研究 |A Ji Qi Xue Xi - Suan Fa - Yan Jiu
- 701 _0 |a 冯超 |A Feng Chao |4 著
- 801 _0 |a CN |b HDUL |c 20181031
- 905 __ |a HDUL |d TP181/340