MARC状态:审校 文献类型:中文图书 浏览次数:52
- 题名/责任者:
- Hadoop大数据分布式计算框架:原理与应用/杨成伟,祝翠玲,刘位龙编著
- 出版发行项:
- 北京:经济科学出版社,2023
- ISBN及定价:
- 978-7-5218-4565-5/CNY65.00
- 载体形态项:
- 352页:图;24cm
- 并列正题名:
- Hadoop big data distributed computing framework:principle and application
- 个人责任者:
- 杨成伟 编著
- 个人责任者:
- 祝翠玲 编著
- 个人责任者:
- 刘位龙 编著
- 学科主题:
- 数据处理
- 中图法分类号:
- TP274
- 提要文摘附注:
- 本书内容讨论大数据技术时, 首先需要了解大数据的基本处理流程, 主要包括数据采集、存储、分析和结果呈现等环节。数据无处不在, 互联网网站、政务系统、零售系统、办公系统、自动化生产系统、监控摄像头、传感器等, 每时每刻都在不断产生数据。这些分散在各处的数据, 需要采用相应的设备或软件进行采集。采集到的数据通常无法直接用于后续的数据分析, 因为对于来源众多、类型多样的数据而言, 数据缺失和语义模糊等问题是不可避免的, 因而必须采取相应的措施有效解决这些问题, 这就需要一个被称为“数据预处理”的过程, 把数据变成一个可用的状态。数据预处理以后, 会被存放到文件系统或数据库系统中进行存储与管理, 然后采用数据挖掘工具对数据进行处理分析, 最后采用可视化工具为用户呈现结果。在整个数据处理过程中, 还必须注意隐私保护和数据安全等问题。因此, 从数据分析全流程的角度, 大数据技术主要包括数据采集与预处理、数据存储和管理、数据处理与分析、数据安全和隐私保护等几个层面的内容。
全部MARC细节信息>>
索书号 | 条码号 | 年卷期 | 馆藏地 | 书刊状态 | 还书位置 |
TP274/4524 | 72429510 | 自然书库(3F东) | 可借 | 自然书库(3F东) | |
TP274/4524 | 72429511 | 自然书库(3F东) | 可借 | 自然书库(3F东) | |
TP274/4524 | 72429512 | 自然书库(3F东) | 可借 | 自然书库(3F东) |
显示全部馆藏信息
CADAL相关电子图书
借阅趋势
同名作者的其他著作(点击查看)
收藏到: 管理书架