机读格式显示(MARC)

000 01774oam2 2200373 450

001 0000954274

005 20240815144327.0

010 __ |a 978-7-115-64917-1 |d CNY109.80

100 __ |a 20240815d2024 em y0chiy50 ea

101 0_ |a chi |c jpn

102 __ |a CN |b 110000

105 __ |a a z 000yy

106 __ |a r

200 1_ |a 深度学习入门 |9 shen du xue xi ru men |h 4 |i 强化学习 |b 专著 |f (日)斋藤康毅著 |g 郑明智译

210 __ |a 北京 |c 人民邮电出版社 |d 2024.08

215 __ |a 313页 |c 彩图 |d 21cm

225 2_ |a 图灵程序设计丛书

304 __ |a 英文共同题名：Reinforcement learning

305 __ |a O'Reilly Japan, Inc.授权出版

306 __ |a 限中国大陆发行

314 __ |a 斋藤康毅，1984年出生于日本长崎县，东京工业大学毕业，并完成东京大学研究生院课程。现从事计算机视觉与机器学习相关的研究和开发工作。是IntroducingPython、PythoninPractice、TheElementsofComputingSystems、BuildingMachineLearningSystemswithPython的日文版译者。

330 __ |a 本书前半部分介绍强化学习的重要思想和基础知识，后半部分介绍如何将深度学习应用于强化学习，遴选讲解了深度强化学习的最新技术。全书从最适合入门的多臂老虎机问题切入，依次介绍了定义一般强化学习问题的马尔可夫决策过程、用于寻找最佳答案的贝尔曼方程，以及解决贝尔曼方程的动态规划法、蒙特卡洛方法和TD方法。随后，神经网络和Q学习、DQN、策略梯度法等几章则分别讨论了深度学习在强化学习领域的应用。

333 __ |a 本书适用于深度学习初学者

461 _0 |1 2001 |a 图灵程序设计丛书

606 0_ |a 机器学习

690 __ |a TP181 |v 5

701 _0 |c (日) |a 斋藤康毅 |9 zhai teng kang yi |f (1984-) |4 著

702 _0 |a 郑明智 |9 zheng ming zhi |4 译

801 _0 |a CN |b 浙江省新华书店集团公司 |c 20240815

902 __ |a cat28

908 __ |a 大陆 |f 图灵教育 |f O'REILLY

909 __ |a 套 |b ①图灵程序设计丛书-----深度学习入门～4～强化学习 |c 1

961 __ |a 6371709 |c 2024.08.15

998 __ |c 日 |e 著 |g 北京 |h 1