机读格式显示(MARC)
- 000 01607nam0 2200289 450
- 010 __ |a 978-7-5766-0941-7 |d CNY78.00
- 100 __ |a 20231215d2023 em y0chiy50 ea
- 200 1_ |a R自然语言处理导论 |A R zi ran yu yan chu li dao lun |d Introduction to natural language processing with R |f 鲍贵,莫俊华,陆俊花编著 |z eng
- 210 __ |a 南京 |c 东南大学出版社 |d 2023
- 215 __ |a 307页 |c 图 |d 26cm
- 330 __ |a 本书系统介绍R语言在自然语言处理中的应用,包括十一章内容,遵循由易到难、循序渐进的原则。第一章是R语言入门,第二章介绍字符串处理。第三章介绍常见的文本统计方法,包括统计文本词数、句子数和平均长、绘制词频表以及词频分布图。第四章依据R数据包koRpus介绍与讨论文本词汇多样性测量方法,包括传统的类符形符比和平均分段类符形符比等。第五章同第四章一样利用R数据包koRpus。第六章聚焦于n元组和关键词提取方法。第七章介绍两种特殊形式的n元组,即搭配和搭配构式。第八章介绍文档或文本相似度和距离测量。第九章着重介绍基于整洁文本的自然语言处理技术。第十章介绍中文自然语言处理技术。第十一章是本书的最后一章,介绍如何对文本词汇开展词类标注和句法成分依存分析,包括数据包udpipe的安装与初试、词语共现和快速自动关键词提取等。
- 510 1_ |a Introduction to natural language processing with R |z eng
- 606 0_ |a 程序语言 |A Cheng Xu Yu Yan |x 自然语言处理
- 610 0_ |a R语言 |A R Yu Yan
- 701 _0 |a 鲍贵 |A bao gui |4 编著
- 701 _0 |a 莫俊华 |A mo jun hua |4 编著
- 701 _0 |a 陆俊花 |A lu jun hua |4 编著
- 801 _0 |a CN |b HDUL |c 20240314
- 905 __ |a HDUL |d TP312.8R/250