机读格式显示(MARC)
- 000 01613nam0 2200349 450
- 010 __ |a 978-7-111-64812-3 |d CNY45.00
- 100 __ |a 20200514d2020 em y0chiy50 ea
- 200 1_ |a TensorFlow强化学习快速入门指南 |A TensorFlow qiang hua xue xi kuai su ru men zhi nan |e 使用Python动手搭建自学习的智能体 |f (美)考希克·巴拉克里希南(Kaushik Balakrishnan)著 |g 赵卫东译
- 210 __ |a 北京 |c 机械工业出版社 |d 2020
- 215 __ |a 12,108页 |d 24cm
- 225 1_ |a 大数据丛书 |A da shu ju cong shu
- 305 __ |a 由Packt Publishing Ltd授权出版
- 312 __ |a 版权页英文题名:Deep learning with TensorFlow
- 312 __ |a 书名原文:TensorFlow reinforcement learning quick start guide
- 330 __ |a 本书首先介绍了强化学习的基本原理,然后介绍典型的强化学习算法,包括时序差分、SARSA、Q-Learning、DeepQ-network、Double DQN、竞争网络结构、Rainbow、Actor-Critic、A2C、A3C、TRPO和PPO等,每种算法基本上利用了主流的开源机器学习框架TensorFlow,使用Python编程进行实现。
- 510 1_ |a Deep learning with TensorFlow |z eng
- 510 1_ |a TensorFlow reinforcement learning quick start guide |z eng
- 517 1_ |a 使用Python动手搭建自学习的智能体 |A shi yong Python dong shou da jian zi xue xi de zhi neng ti
- 606 0_ |a 人工智能 |A ren gong zhi neng |x 算法
- 701 _0 |c (美) |a 巴拉克里希南 |A ba la ke li xi nan |c (Balakrishnan, Kaushik) |4 著
- 702 _0 |a 赵卫东 |A zhao wei dong |4 译
- 801 _0 |a CN |b HDUL |c 20200617
- 905 __ |a HDUL |d TP18/754