机读格式显示(MARC)
- 010 __ |a 978-7-111-71694-5 |d CNY79.00
- 100 __ |a 20221230d2023 em y0chiy50 ea
- 200 1_ |a 网络爬虫原理与实践 |A wang luo pa chong yuan li yu shi jian |e 基于C#语言 |d = Principle and practice of |e web crawler in C# |f 李健, 种惠芳著 |z eng
- 210 __ |a 北京 |c 机械工业出版社 |d 2023
- 215 __ |a 265页 |c 图 |d 26cm
- 225 2_ |a 数据科学与工程技术丛书 |A shu ju ke xue yu gong cheng ji shu cong shu
- 300 __ |a 战略支援部队信息工程大学出版基金
- 320 __ |a 有书目 (第264-265页)
- 330 __ |a 本书以C#为平台, 介绍网络爬虫开发的基本知识、原理和方法。全书共分11章: 第1章介绍网络爬虫的基础知识, 包括网络、网页和爬虫概述 ; 第2章简要介绍C#编程, 并侧重与网络爬虫相关的内容 ; 第3章介绍网络资源下载的方法, 并实现通用资源下载器 ; 第4章介绍网页数据抽取的方法, 重点实现HTM解析器: 第5章介绍xI和JSON数据抽取的方法, 从而获得更丰富的目标数据 ; 第6章介绍爬虫数据的存储, 可将采集结果保存到文件或数据库 ; 第7章介绍网络爬虫的搜索方式, 包括深度优先搜索和广度优先搜索, 并实现爬虫控制器 ; 第8章介绍多线程爬虫, 并实现自定义线程池以提高爬虫效率 ; 第9章介绍如何使用代理服务器, 并实现自定义代理池 ; 第10章介绍常见的浏览器内核, 以及如何使用GeckoFx模拟浏览器获取深层数据 ; 第11章介绍抽取模板的表示、管理以及可视化配置方法。
- 410 _0 |1 2001 |a 数据科学与工程技术丛书
- 510 1_ |a Principle and practice of |e web crawler in C# |z eng
- 606 0_ |a 软件工具 |A ruan jian gong ju |x 程序设计
- 701 _0 |a 李健 |A li jian |4 著
- 701 _0 |a 种惠芳 |A zhong hui fang |4 著
- 801 _0 |a CN |b HDUL |c 20230323
- 905 __ |a HDUL |d TP311.561/4201.2