机读格式显示(MARC)

000 01613nam0 2200349 450

001 0000774573

005 20201228133400.0

010 __ |a 978-7-111-64812-3 |d CNY45.00

100 __ |a 20200514d2020 em y0chiy50 ea

101 1_ |a chi |c eng

102 __ |a CN |b 110000

105 __ |a y z 000yy

106 __ |a r

200 1_ |a TensorFlow强化学习快速入门指南 |A TensorFlow qiang hua xue xi kuai su ru men zhi nan |e 使用Python动手搭建自学习的智能体 |f (美)考希克·巴拉克里希南(Kaushik Balakrishnan)著 |g 赵卫东译

210 __ |a 北京 |c 机械工业出版社 |d 2020

215 __ |a 12,108页 |d 24cm

225 1_ |a 大数据丛书 |A da shu ju cong shu

305 __ |a 由Packt Publishing Ltd授权出版

306 __ |a 本书限中国大陆发行

312 __ |a 版权页英文题名：Deep learning with TensorFlow

312 __ |a 书名原文：TensorFlow reinforcement learning quick start guide

330 __ |a 本书首先介绍了强化学习的基本原理，然后介绍典型的强化学习算法，包括时序差分、SARSA、Q-Learning、DeepQ-network、Double DQN、竞争网络结构、Rainbow、Actor-Critic、A2C、A3C、TRPO和PPO等，每种算法基本上利用了主流的开源机器学习框架TensorFlow，使用Python编程进行实现。

510 1_ |a Deep learning with TensorFlow |z eng

510 1_ |a TensorFlow reinforcement learning quick start guide |z eng

517 1_ |a 使用Python动手搭建自学习的智能体 |A shi yong Python dong shou da jian zi xue xi de zhi neng ti

606 0_ |a 人工智能 |A ren gong zhi neng |x 算法

690 __ |a TP18 |v 5

701 _0 |c (美) |a 巴拉克里希南 |A ba la ke li xi nan |c (Balakrishnan, Kaushik) |4 著

702 _0 |a 赵卫东 |A zhao wei dong |4 译

801 _0 |a CN |b HDUL |c 20200617

905 __ |a HDUL |d TP18/754

920 __ |a 233030 |z 1