MARC状态:审校 文献类型:中文图书 浏览次数:89
- 题名/责任者:
- Python数据分析与大数据处理从入门到精通/朱春旭编著
- 出版发行项:
- 北京:北京大学出版社,2019
- ISBN及定价:
- 978-7-301-30765-6/CNY89.00
- 载体形态项:
- 449页;26cm
- 个人责任者:
- 朱春旭 编著
- 学科主题:
- 面向对象语言,Python-软件工具-程序设计
- 非控制主题词:
- Python
- 中图法分类号:
- TP311.561
- 书目附注:
- 有书目
- 提要文摘附注:
- 本书主要讲解数据分析与大数据处理所需的技术、基础设施、核心概念、实施流程。从编程语言准备、数据采集与清洗、数据分析与可视化,到大型数据的分布式存储与分布式计算,贯穿了整个大数据项目开发流程。本书轻理论、重实践,目的是让读者快速上手。第1篇首先介绍了Python的基本语法、面向对象开发、模块化设计等,掌握Python的编程方式。第2篇介绍了网络数据采集、数据清洗、数据存储等技术。第3篇介绍了Python常用的数据分析工具,扩展了更多的数据清洗、插值方法,为最终的数据可视化奠定基础。第4篇是大数据分析的重点。首先介绍了Hadoop的框架原理、调度原理,MapReduce原理与编程模型、环境搭建,接着介绍了Spark框架原理、环境搭建方式,以及如何与Hive等第三方工具进行交互,还介绍了最新的结构化流式处理技术。第5篇通过三个项目实例,综合介绍了如何分析网页、如何搭建分布式爬虫、如何应对常见的反爬虫、如何设计数据模型、如何设计架构模型、如何在实践中综合运用前四篇涉及的技术。
全部MARC细节信息>>
索书号 | 条码号 | 年卷期 | 馆藏地 | 书刊状态 | 还书位置 |
TP311.561/2541 | 72337841 | 自然书库(3F东) | 可借 | 现代技术部(1F) | |
TP311.561/2541 | 72337842 | 自然书库(3F东) | 可借 | 现代技术部(1F) |
显示全部馆藏信息
CADAL相关电子图书
借阅趋势
同名作者的其他著作(点击查看)
收藏到: 管理书架