杭州电子科技大学图书馆书目检索系统

Online Public Access Catalogue

| 暂存书架(0) | 登录

馆藏检索简单检索多字段检索

借阅关系图

相关资源

把本书分享到

EverNote
麦库
豆瓣
腾讯微博
新浪微博
人人网
网易微博
开心网

使用说明二维码

收藏此书的书架

点击查看CALIS E读信息

MARC状态：审校文献类型：中文图书浏览次数：124

题名/责任者:: 用Python写网络爬虫/(德) 凯瑟琳·雅姆尔, (澳) 理查德·劳森著李斌译

出版发行项:: 北京:人民邮电出版社,2018

ISBN及定价:: 978-7-115-47967-9/CNY49.00

载体形态项:: 196页:图;24cm

统一题名:: Python web scraping

个人责任者:: 雅姆尔 (Jarmul, Katharine) 著

个人责任者:: 劳森 (Lawson, Richard) 著

个人次要责任者:: 李斌译

学科主题:: 面向对象语言,Python-软件工具-程序设计

非控制主题词:: Python

中图法分类号:: TP311.56

版本附注:: 据原书第2版译出

出版发行附注:: 本书由Packt Publishing授权人民邮电出版社出版

责任者附注:: 凯瑟琳·雅姆尔 (Katharine Jarmul)，德国柏林的一位数据科学家和Python支持者。经营了一家数据科学咨询公司——Kjamistan。

责任者附注:: 理查德·劳森 (Richard Lawson)，来自澳大利亚，毕业于墨尔本大学计算机科学专业。创办了一家专注于网络爬虫的公司，为超过50个国家的业务提供远程工作。

责任者附注:: 李斌，毕业于北京科技大学计算机科学与技术专业，获得硕士学位。当前供职于凡普金科，负责应用安全工作。

提要文摘附注:: 本书包括网络爬虫的定义以及如何爬取网站，如何使用几种库从网页中抽取数据，如何通过缓存结果避免重复下载的问题，如何通过并行下载来加速数据抓取，如何利用不同的方式从动态网站中抽取数据，如何使用叔叔及导航等表达进行搜索和登录，如何访问被验证码图像保护的数据，如何使用Scrapy爬虫框架进行快速的并行抓取，以及使用Portia的Web界面构建网路爬虫。

使用对象附注:: 本书适合有一定Python编程经验而且对爬虫技术感兴趣的读者阅读。

全部MARC细节信息>>

索书号	条码号	年卷期	馆藏地	书刊状态	还书位置
TP311.56/7423	72280148		自然书库（3F东）	可借	现代技术部（1F）
TP311.56/7423	72280149		自然书库（3F东）	可借	现代技术部（1F）
TP311.56/7423	72280150		自然书库（3F东）	可借	现代技术部（1F）
TP311.56/7423	72312169		自然书库（3F东）	可借	现代技术部（1F）
TP311.56/7423	72312505		自然书库（3F东）	可借	现代技术部（1F）

显示全部馆藏信息

CADAL相关电子图书

借阅趋势

同名作者的其他著作(点击查看)

收藏到：管理书架