机读格式显示(MARC)

000 01756nam0 2200277 450

001 0000957366

005 20241018134400.0

010 __ |a 978-7-302-67051-3 |d CNY118.00

100 __ |a 20240814d2024 em y0chiy50 ea

101 0_ |a chi

102 __ |a CN |b 110000

105 __ |a a z 000yy

106 __ |a r

200 1_ |a 大语言模型开发 |A da yu yan mo xing kai fa |e 用开源模型开发本地系统 |f 范煜著

210 __ |a 北京 |c 清华大学出版社 |d 2024

215 __ |a 10,320页 |c 图 |d 26cm

300 __ |a 新时代·技术新未来

314 __ |a 范煜,江苏南通人，研究员级高级工程师，毕业于南京航空航天大学，中国商业联合会数据分析专业委员会专家组成员，南通理工学院教师，中国移动集团、51CTO外聘讲师，为全国各地中国移动省公司、研究院讲授大数据、数据分析、人工智能等方面课程。著有《人工智能与ChatGPT》《数据革命–-大数据价值实现方法、技术与案例》。兼具大数据(AI)、软件、工业控制(嵌入式系统和软PLC)技术背景。目前主要从事可私有化部署的类ChatGPT模型研究、以及硬件、软件、数据(OT、IT、DT)融合的智能系统开发。

330 __ |a 本书旨在帮助读者理解开源大语言模型的架构、训练和推理过程，以及相关的源代码。主要研究对象是Meta开源的Llama模型。本书从PyTorch实现单层感知机和神经网络开始，逐步讲解了如何实现Transformer模型和Llama模型。此外，本书还介绍了增量预训练模型、监督微调和人类反馈强化学习等模型训练过程。对于私有知识的加入，书中重点介绍了监督微调，也介绍了RAG中词向量的计算。本书采用循序渐进的方式，通过功能框图、代码分解执行、执行结果显示、背景知识补充等手段帮助读者理解模型和算法。本书的核心读者群体定位为大语言模型应用的开发人员，特别适合那些想从计算机视觉转向自然语言处理的人。

517 1_ |a 用开源模型开发本地系统

606 0_ |a 自然语言处理 |A Zi Ran Yu Yan Chu Li

690 __ |a TP391 |v 5

701 _0 |a 范煜 |A fan yu |4 著

801 _0 |a CN |b HDUL |c 20241018

905 __ |a HDUL |d TP391/4901

920 __ |a 233030 |z 1