机读格式显示(MARC)
- 000 01219nam0 2200277 450
- 010 __ |a 978-7-313-30169-7 |d CNY59.80
- 100 __ |a 20240428d2024 em y0chiy50 ea
- 200 1_ |a 大数据采集与预处理技术 |A da shu ju cai ji yu yu chu li ji shu |f 夏国清,洪洲,陈统主编
- 210 __ |a 上海 |c 上海交通大学出版社 |d 2024
- 215 __ |a 245页 |c 图 |d 29cm
- 330 __ |a 本书按照“理论+实战”的形式编写,将企业项目需求分解为单独的任务,讲解了大数据采集与预处理的相关知识与技术。全书针对数据采集的不同来源,将知识内容分为五个项目,包括网络数据采集、分布式消息系统Kafka、实时数据库采集工具Canal和Maxwell、ETL日志采集技术栈以及ETL工具——Kettle。本书针对大数据采集与预处理的关键技术及其应用场景,从数据的采集、存储和分析等多个方面介绍了大数据的数据处理流程,通过任务实例为读者展示了如何有效地使用技术或工具。
- 606 0_ |a 数据采集 |A Shu Ju Cai Ji
- 606 0_ |a 数据处理 |A Shu Ju Chu Li
- 701 _0 |a 夏国清 |A xia guo qing |4 主编
- 701 _0 |a 洪洲 |A hong zhou |4 主编
- 701 _0 |a 陈统 |A chen tong |4 主编
- 801 _0 |a CN |b HDUL |c 20240603
- 905 __ |a HDUL |d TP274/1631