| 暂存书架(0) | 登录

MARC状态:审校 文献类型:中文图书 浏览次数:69

题名/责任者:
网络爬虫原理与实践:基于C#语言/李健, 种惠芳著
出版发行项:
北京:机械工业出版社,2023
ISBN及定价:
978-7-111-71694-5/CNY79.00
载体形态项:
265页:图;26cm
并列正题名:
Principle and practice of:web crawler in C#
丛编项:
数据科学与工程技术丛书
个人责任者:
李健
个人责任者:
种惠芳
学科主题:
软件工具-程序设计
中图法分类号:
TP311.561
一般附注:
战略支援部队信息工程大学出版基金
书目附注:
有书目 (第264-265页)
提要文摘附注:
本书以C#为平台, 介绍网络爬虫开发的基本知识、原理和方法。全书共分11章: 第1章介绍网络爬虫的基础知识, 包括网络、网页和爬虫概述 ; 第2章简要介绍C#编程, 并侧重与网络爬虫相关的内容 ; 第3章介绍网络资源下载的方法, 并实现通用资源下载器 ; 第4章介绍网页数据抽取的方法, 重点实现HTM解析器: 第5章介绍xI和JSON数据抽取的方法, 从而获得更丰富的目标数据 ; 第6章介绍爬虫数据的存储, 可将采集结果保存到文件或数据库 ; 第7章介绍网络爬虫的搜索方式, 包括深度优先搜索和广度优先搜索, 并实现爬虫控制器 ; 第8章介绍多线程爬虫, 并实现自定义线程池以提高爬虫效率 ; 第9章介绍如何使用代理服务器, 并实现自定义代理池 ; 第10章介绍常见的浏览器内核, 以及如何使用GeckoFx模拟浏览器获取深层数据 ; 第11章介绍抽取模板的表示、管理以及可视化配置方法。
全部MARC细节信息>>
索书号 条码号 年卷期 馆藏地 书刊状态 还书位置
TP311.561/4201.2 72516224   自然书库(3F东)     可借 自然书库(3F东)
TP311.561/4201.2 72516225   自然书库(3F东)     可借 自然书库(3F东)
TP311.561/4201.2 72516226   自然书库(3F东)     可借 自然书库(3F东)
显示全部馆藏信息
CADAL相关电子图书
借阅趋势

同名作者的其他著作(点击查看)
用户名:
密码:
验证码:
请输入下面显示的内容
  证件号 条码号 Email
 
姓名:
手机号:
送 书 地:
收藏到: 管理书架