| 暂存书架(0) | 登录

MARC状态:审校 文献类型:中文图书 浏览次数:44

题名/责任者:
Apache Spark大数据分析:基于Azure Databricks云平台/(瑞典) 罗伯特·伊利杰森著 袁国忠译
出版发行项:
北京:人民邮电出版社,2023
ISBN及定价:
978-7-115-61456-8/CNY79.80
载体形态项:
236页:图;23cm
并列正题名:
Beginning Apache Spark using Azure Databricks:unleashing large cluster analytics in the cloud
个人责任者:
伊利杰森 (Ilijason, Robert)
个人次要责任者:
袁国忠
学科主题:
数据处理软件-机器学习
非控制主题词:
Spark
中图法分类号:
TP274
出版发行附注:
由Apress Media, LLC授权出版
提要文摘附注:
AzureDatabricks是一款基于云的大数据分析和机器学习平台, 用于实现基于ApacheSpark的数据处理, 为快速增长的海量数据的处理和决策需求分析提供了良好的支撑。本书首先介绍了大规模数据分析相关的概念, 然后介绍了受管的Spark及其与Databricks的关系, 以及Databricks的版本差异和使用方法 (涵盖工作区、集群、笔记本、Databricks文件系统、数据导入/导出等内容)。此外, 书中还介绍了使用SQL和Python分别实现数据分析的过程, 数据提取、变换、加载、存储、优化技巧等高阶数据处理方法, 以及外部连接工具、生产环境集成等内容, 最后探讨了运行机器学习算法、合并数据更新以及通过API运行Databricks、Delta流处理等高阶主题。
全部MARC细节信息>>
索书号 条码号 年卷期 馆藏地 书刊状态 还书位置
TP274/2246 60336338   临安自科(N-Z)(2F)(信息工程学院)     可借 临安自科(N-Z)(2F)(信息工程学院)
TP274/2246 60336339   临安自科(N-Z)(2F)(信息工程学院)     可借 临安自科(N-Z)(2F)(信息工程学院)
TP274/2246 72560136   自然书库(3F东)     可借 自然书库(3F东)
TP274/2246 72560137   自然书库(3F东)     可借 自然书库(3F东)
TP274/2246 72560138   自然书库(3F东)     可借 自然书库(3F东)
显示全部馆藏信息
CADAL相关电子图书
借阅趋势

同名作者的其他著作(点击查看)
用户名:
密码:
验证码:
请输入下面显示的内容
  证件号 条码号 Email
 
姓名:
手机号:
送 书 地:
收藏到: 管理书架