机读格式显示(MARC)
- 000 01756nam0 2200277 450
- 010 __ |a 978-7-302-67051-3 |d CNY118.00
- 100 __ |a 20240814d2024 em y0chiy50 ea
- 200 1_ |a 大语言模型开发 |A da yu yan mo xing kai fa |e 用开源模型开发本地系统 |f 范煜著
- 210 __ |a 北京 |c 清华大学出版社 |d 2024
- 215 __ |a 10,320页 |c 图 |d 26cm
- 314 __ |a 范煜,江苏南通人,研究员级高级工程师,毕业于南京航空航天大学,中国商业联合会数据分析专业委员会专家组成员,南通理工学院教师,中国移动集团、51CTO外聘讲师,为全国各地中国移动省公司、研究院讲授大数据、数据分析、人工智能等方面课程。著有《人工智能与ChatGPT》《数据革命–-大数据价值实现方法、技术与案例》。兼具大数据(AI)、软件、工业控制(嵌入式系统和软PLC)技术背景。目前主要从事可私有化部署的类ChatGPT模型研究、以及硬件、软件、数据(OT、IT、DT)融合的智能系统开发。
- 330 __ |a 本书旨在帮助读者理解开源大语言模型的架构、训练和推理过程,以及相关的源代码。主要研究对象是Meta开源的Llama模型。本书从PyTorch实现单层感知机和神经网络开始,逐步讲解了如何实现Transformer模型和Llama模型。此外,本书还介绍了增量预训练模型、监督微调和人类反馈强化学习等模型训练过程。对于私有知识的加入,书中重点介绍了监督微调,也介绍了RAG中词向量的计算。本书采用循序渐进的方式,通过功能框图、代码分解执行、执行结果显示、背景知识补充等手段帮助读者理解模型和算法。本书的核心读者群体定位为大语言模型应用的开发人员,特别适合那些想从计算机视觉转向自然语言处理的人。
- 606 0_ |a 自然语言处理 |A Zi Ran Yu Yan Chu Li
- 701 _0 |a 范煜 |A fan yu |4 著
- 801 _0 |a CN |b HDUL |c 20241018
- 905 __ |a HDUL |d TP391/4901