MARC状态:审校 文献类型:中文图书 浏览次数:55
- 题名/责任者:
- 数据挖掘/蔡毅[等]编著
- 出版发行项:
- 北京:清华大学出版社,2023
- ISBN及定价:
- 978-7-302-63425-6/CNY44.50
- 载体形态项:
- 222页:图;26cm
- 丛编项:
- 大数据系列丛书
- 个人责任者:
- 蔡毅 编著
- 学科主题:
- 数据采集-高等学校-教材
- 中图法分类号:
- TP274
- 一般附注:
- 水木书荟 轩辕网络
- 题名责任附注:
- 编著还有:黄清宝、许可、王国华、伍慰珍
- 提要文摘附注:
- 本书从算法的角度介绍数据挖掘使用的技术和相关的应用。第1章介绍数据挖掘的基本概念。第2章介绍数据和数据集的基本概念,并简单介绍大数据。第3章是数据挖掘中重要的第一步一数据的预处理;本章通过代码和实例展示及说明如何对结构化数据、非结构化文本数据进行预处理。第4章介绍分类任务的基本算法,包括常用的KNN、SVM、随机森林、朴素贝叶斯等,并附有相应的代码;同时,介绍特征选择的方法和特征权重的概念,及其在分类算法中的作用;此外,本章还对类别不平衡、模糊分类、多分类等情况进行详细的介绍,并给出相应的实战演练。近年来,深度学习模型在很多数据挖掘任务中表现突出。第5章介绍基于深度学习的分类算法,如常用的CNN、RNN、LSTM 算法在结构化数据、图像、文本数据上的分类。第6章介绍层次聚类、基于密度的聚类、主题模型等主流聚类算法,及其在结构化数据和文本数据上的应用。第7章介绍个性化建模的方法及基于不同方式的推荐算法,如基于内容、协同过滤、主题模型、深度学习、混合推荐等算法。
全部MARC细节信息>>
索书号 | 条码号 | 年卷期 | 馆藏地 | 书刊状态 | 还书位置 |
TP274/4009 | 72551777 | 自然书库(3F东) | 可借 | 自然书库(3F东) | |
TP274/4009 | 72551778 | 自然书库(3F东) | 可借 | 自然书库(3F东) | |
TP274/4009 | 72551779 | 自然书库(3F东) | 可借 | 自然书库(3F东) |
显示全部馆藏信息
CADAL相关电子图书
借阅趋势
同名作者的其他著作(点击查看)
收藏到: 管理书架