机读格式显示(MARC)
- 010 __ |a 978-7-121-42169-3 |d CNY69.00
- 100 __ |a 20211028d2021 em y0chiy50 ea
- 200 1_ |a 大数据技术及应用 |A da shu ju ji shu ji ying yong |e 基于Python语言 |f 严宣辉 ... [等] 编著
- 210 __ |a 北京 |c 电子工业出版社 |d 2021
- 215 __ |a xii, 345页 |c 图 |d 26cm
- 225 2_ |a 新工科·数据科学与大数据系列 |A xin gong ke·shu ju ke xue yu da shu ju xi lie
- 304 __ |a 编著者还有: 张仕, 赖会霞, 韩凤萍
- 330 __ |a 本书共9章,围绕大数据的基本概念和大数据处理的主要环节编写。第1章介绍大数据的基础知识,包括大数据的基本概念、价值和作用等;第2章介绍大数据实验环境构建,主要内容包括在Windows系统中安装Linux虚拟机及构建Hadoop集群的方法等;第3章介绍数据采集与预处理,主要内容包括常用数据采集工具的使用方法及数据预处理的方法等;第4章介绍Hadoop分布式文件系统,首先介绍了Hadoop的发展历史、优势、生态系统和核心组件等,然后以HDFS为重点,介绍了其体系结构和特点,并详细介绍了HDFS的交互式命令;第5章介绍HBase基础与应用;第6章介绍Hive基础与应用;第7章介绍分布式计算框架MapReduce;第8章介绍数据分析与挖掘;第9章介绍数据可视化,主要内容包括数据可视化的常用方法及常用工具等。
- 410 _0 |1 2001 |a 新工科·数据科学与大数据系列
- 517 1_ |a 基于Python语言 |A ji yu Python yu yan
- 606 0_ |a 数据处理 |A shu ju chu li
- 701 _0 |a 严宣辉 |A yan xuan hui |4 编著
- 701 _0 |a 张仕 |A zhang shi |4 编著
- 701 _0 |a 赖会霞 |A lai hui xia |4 编著
- 801 _0 |a CN |b HDUL |c 20211206
- 905 __ |a HDUL |d TP274/139