MARC状态:审校 文献类型:中文图书 浏览次数:56
- 题名/责任者:
- 深入大型数据集:并行与分布化Python代码/(美) John T. Wolohan著 张若飞译
- 出版发行项:
- 北京:电子工业出版社,2021
- ISBN及定价:
- 978-7-121-40368-2/CNY99.00
- 载体形态项:
- xx, 300页:图;24cm
- 其它题名:
- 并行与分布化Python代码
- 个人责任者:
- 沃勒翰 (Wolohan, John T.) 著
- 个人次要责任者:
- 张若飞 译
- 学科主题:
- 软件工具-程序设计
- 中图法分类号:
- TP311.561
- 一般附注:
- 博文视点
- 责任者附注:
- 责任者Wolohan规范汉译姓: 沃勒翰
- 提要文摘附注:
- 本书共分3部分,主要介绍如何使用Python语言来处理大型数据集。第1部分介绍map和reduce编程风格,以及Python中基础的map和reduce函数,并介绍如何将对象持久化,通过惰性函数和并行函数来加快大型数据集的处理速度。第2部分介绍Hadoop和Spark框架,以及如何使用mrjob库来编写Hadoop作业,如何实现PageRank算法,如何使用Spark来实现决策树和随机森林的机器学习模型。第3部分重点介绍云计算和云存储的基础知识,包括如何通过boto3的Python库将文件上传到AWS S3服务,以及如何在AWS的EMR集群中运行分布式的Hadoop和Spark作业。
全部MARC细节信息>>
索书号 | 条码号 | 年卷期 | 馆藏地 | 书刊状态 | 还书位置 |
TP311.561/3441 | 60253518 | 临安自科(N-Z)(2F)(信息工程学院) | 可借 | 临安自科(N-Z)(2F)(信息工程学院) | |
TP311.561/3441 | 60253519 | 临安自科(N-Z)(2F)(信息工程学院) | 可借 | 临安自科(N-Z)(2F)(信息工程学院) | |
TP311.561/3441 | 72341701 | 自然书库(3F东) | 可借 | 自然书库(3F东) | |
TP311.561/3441 | 72341702 | 自然书库(3F东) | 可借 | 自然书库(3F东) | |
TP311.561/3441 | 72341703 | 自然书库(3F东) | 可借 | 自然书库(3F东) |
显示全部馆藏信息
CADAL相关电子图书
借阅趋势
同名作者的其他著作(点击查看)
收藏到: 管理书架