MARC状态:审校 文献类型:中文图书 浏览次数:43
- 题名/责任者:
- Apache Spark大数据分析:基于Azure Databricks云平台/(瑞典) 罗伯特·伊利杰森著 袁国忠译
- 出版发行项:
- 北京:人民邮电出版社,2023
- ISBN及定价:
- 978-7-115-61456-8/CNY79.80
- 载体形态项:
- 236页:图;23cm
- 并列正题名:
- Beginning Apache Spark using Azure Databricks:unleashing large cluster analytics in the cloud
- 个人责任者:
- 伊利杰森 (Ilijason, Robert) 著
- 个人次要责任者:
- 袁国忠 译
- 学科主题:
- 数据处理软件-机器学习
- 非控制主题词:
- Spark
- 中图法分类号:
- TP274
- 出版发行附注:
- 由Apress Media, LLC授权出版
- 提要文摘附注:
- AzureDatabricks是一款基于云的大数据分析和机器学习平台, 用于实现基于ApacheSpark的数据处理, 为快速增长的海量数据的处理和决策需求分析提供了良好的支撑。本书首先介绍了大规模数据分析相关的概念, 然后介绍了受管的Spark及其与Databricks的关系, 以及Databricks的版本差异和使用方法 (涵盖工作区、集群、笔记本、Databricks文件系统、数据导入/导出等内容)。此外, 书中还介绍了使用SQL和Python分别实现数据分析的过程, 数据提取、变换、加载、存储、优化技巧等高阶数据处理方法, 以及外部连接工具、生产环境集成等内容, 最后探讨了运行机器学习算法、合并数据更新以及通过API运行Databricks、Delta流处理等高阶主题。
全部MARC细节信息>>
索书号 | 条码号 | 年卷期 | 馆藏地 | 书刊状态 | 还书位置 |
TP274/2246 | 60336338 | 临安自科(N-Z)(2F)(信息工程学院) | 可借 | 临安自科(N-Z)(2F)(信息工程学院) | |
TP274/2246 | 60336339 | 临安自科(N-Z)(2F)(信息工程学院) | 可借 | 临安自科(N-Z)(2F)(信息工程学院) | |
TP274/2246 | 72560136 | 自然书库(3F东) | 可借 | 自然书库(3F东) | |
TP274/2246 | 72560137 | 自然书库(3F东) | 可借 | 自然书库(3F东) | |
TP274/2246 | 72560138 | 自然书库(3F东) | 可借 | 自然书库(3F东) |
显示全部馆藏信息
CADAL相关电子图书
借阅趋势
同名作者的其他著作(点击查看)
收藏到: 管理书架