机读格式显示(MARC)
- 000 01794nam0 2200337 450
- 010 __ |a 978-7-5198-6353-1 |d CNY98.00
- 100 __ |a 20220415d2022 em y0chiy50 ea
- 200 1_ |a 高性能Spark |A gao xing neng Spark |f (美) 霍顿·卡劳, 雷切尔·沃伦著 |g 夏锐 ... [等] 译
- 210 __ |a 北京 |c 中国电力出版社 |d 2022
- 215 __ |a xi, 356页 |c 图 |d 24cm
- 304 __ |a 题名页题: 夏锐, 陈志鹏, 李迅, 赵立攀译
- 306 __ |a 英文原版有O'Reilly Media, Inc.出版2017 简体中文版由中国电力出版社出版2022。英文原版的翻译得到O'Reilly Media, Inc.的授权
- 314 __ |a Holden Karau, 是一位加拿大人, 在IBM的Spark技术中心担任软件开发工程师。Rachel Warren, 是Alpine Data的软件工程师和数据科学家。
- 330 __ |a 通过本书, 你可以了解到: Spark SQL的新接口如何为SQL的RDD数据结构提升性能。Spark Core与Spark SQL中数据join的不同选择方式。充分利用标准RDD转换的技术。如何解决Spark中键值范式的性能问题。不借助Scala或其他JVM语言来编写高性能的Spark代码。采用改进建议后, 如何来测试其功能及性能情况。使用Spark MLlib和Spark ML机器学习库。Spark的流处理组件、外部的社区扩展包。 本书提到的相关技术可以节约数据系统架构的成本以及开发人员的时间, 适用软件工程师、数据工程师, 以及面对大规模数据应用的系统管理员。此外你还可以加深对Spark的理解, 然后学会如何驾驭它。
- 500 10 |a High performance spark |A High performance spark |m Chinese
- 606 0_ |a 数据处理软件 |A shu ju chu li ruan jian
- 701 _1 |a 卡劳 |A ka lao |g (Karau, Holden) |4 著
- 701 _1 |a 沃伦 |A wo lun |g (Warren, Rachel) |4 著
- 702 _0 |a 夏锐 |A xia rui |4 译
- 702 _0 |a 陈志鹏 |A chen zhi peng |4 译
- 801 _0 |a CN |b HDUL |c 20220615
- 905 __ |a HDUL |d TP274/240.3/2