机读格式显示(MARC)

000 01319nam0 2200289 450

001 0000953664

005 20241016114200.0

010 __ |a 978-7-122-45282-5 |d CNY69.80

100 __ |a 20240729d2024 em y0chiy50 ea

101 0_ |a chi

102 __ |a CN |b 110000

105 __ |a ak z 000yy

106 __ |a r

200 1_ |a 强化学习 |A qiang hua xue xi |d Introduction to reinforcement learning |e 人工智能如何知错能改 |f 龚超[等]著 |z eng

210 __ |a 北京 |c 化学工业出版社 |d 2024

215 __ |a 234页 |c 图 |d 21cm

225 1_ |a 人工智能超入门丛书 |A Ren Gong Zhi Neng Chao Ru Men Cong Shu

304 __ |a 著者还有：王冀、梁霄、贵宁

330 __ |a 本书包含强化学习方向的基础知识，如动态规划、时序差分等，让读者在开始学习时对强化学习有初步的认识；之后，通过对马尔可夫决策过程及贝尔曼方程的解读，逐渐过渡到强化学习的关键内容；同时，本书也重点解析了策略迭代与价值迭代两种核心算法，也对蒙特卡洛方法、时序差分算法、深度强化学习及基于策略的强化学习算法进行了深度剖析。本书内容结构完整、逻辑清晰、层层递进，并配有相关实例与代码，让读者在阅读学习过程中能够加深理解。

510 1_ |a Introduction to reinforcement learning |z eng

517 1_ |a 人工智能如何知错能改

606 0_ |a 人工智能 |A Ren Gong Zhi Neng |j 普及读物

690 __ |a TP18 |v 5

701 _0 |a 龚超 |A gong chao |4 著

801 _0 |a CN |b HDUL |c 20241016

905 __ |a HDUL |d TP18/44021.5

920 __ |a 233030 |z 1