机读格式显示(MARC)
- 000 01938nam0 2200385 450
- 010 __ |a 978-7-111-58855-9 |d CNY59.00
- 100 __ |a 20180930d2018 em y0chiy50 ea
- 200 1_ |a 文本挖掘 |A wen ben wa jue |e 基于R语言的整洁工具 |f Julia Silge, David Robinson著 |g 刘波, 罗棻, 唐亮贵译
- 210 __ |a 北京 |c 机械工业出版社 |d 2018
- 215 __ |a 161页 |c 图 |d 24cm
- 305 __ |a O’Reilly Media, Inc.授权机械工业出版社出版
- 314 __ |a 责任者Silge规范汉译姓: 斯拉格 ; 责任者Robinson规范汉译姓: 罗宾逊
- 314 __ |a Julia Silge,Stack Overflow公司的数据科学家,她主要分析复杂数据集,喜欢与各种人交流技术问题。
- 314 __ |a David Robinson,Stack Overflow公司的数据科学家,普林斯顿大学定量与计算生物学博士。
- 320 __ |a 有书目 (第160-161页)
- 330 __ |a 全书共9章,主要介绍如何使用基于R的整洁工具来进行文本分析。首先介绍了整洁文本的格式,以及如何获取整洁文本数据集;并通过tidytext中的情感数据集来进行情绪分析;接着介绍了如何根据tf-idf统计量来识别特定文档中的重要单词,以及如何利用n-gram来分析文本中的文字网络;之后介绍了如何将整洁文本转换为文档词项矩阵和Corpus对象格式,并给出了主题建模的概念;最后通过整合多种已知的整洁文本挖掘方法,给出了一些研究案例,这些案例涉及Twitter归档文件、NASA数据集以及来自新闻组的即时通信信息。
- 333 __ |a 本书非常适合从事相关文本挖掘的工作人员和自然语言的初学者阅读。
- 500 10 |a Text mining with R : a tidy approach |A Text mining with R : a tidy approach |m Chinese
- 606 0_ |a R语言 |A R yu yan |x 程序设计
- 701 _1 |a 斯拉格 |A si la ge |g (Silge, Julia) |4 著
- 701 _1 |a 罗宾逊 |A luo bin xun |g (Robinson, David) |4 著
- 702 _0 |a 刘波 |A liu bo |4 译
- 702 _0 |a 罗棻 |A luo fen |4 译
- 702 _0 |a 唐亮贵 |A tang liang gui |4 译
- 801 _0 |a CN |b HDUL |c 20180930
- 905 __ |a HDUL |d TP312R/454