| 暂存书架(0) | 登录

MARC状态:审校 文献类型:中文图书 浏览次数:124

题名/责任者:
用Python写网络爬虫/(德) 凯瑟琳·雅姆尔, (澳) 理查德·劳森著 李斌译
出版发行项:
北京:人民邮电出版社,2018
ISBN及定价:
978-7-115-47967-9/CNY49.00
载体形态项:
196页:图;24cm
统一题名:
Python web scraping
个人责任者:
雅姆尔 (Jarmul, Katharine)
个人责任者:
劳森 (Lawson, Richard)
个人次要责任者:
李斌
学科主题:
面向对象语言,Python-软件工具-程序设计
非控制主题词:
Python
中图法分类号:
TP311.56
版本附注:
据原书第2版译出
出版发行附注:
本书由Packt Publishing授权人民邮电出版社出版
责任者附注:
凯瑟琳·雅姆尔 (Katharine Jarmul),德国柏林的一位数据科学家和Python支持者。经营了一家数据科学咨询公司——Kjamistan。
责任者附注:
理查德·劳森 (Richard Lawson),来自澳大利亚,毕业于墨尔本大学计算机科学专业。创办了一家专注于网络爬虫的公司,为超过50个国家的业务提供远程工作。
责任者附注:
李斌,毕业于北京科技大学计算机科学与技术专业,获得硕士学位。当前供职于凡普金科,负责应用安全工作。
提要文摘附注:
本书包括网络爬虫的定义以及如何爬取网站,如何使用几种库从网页中抽取数据,如何通过缓存结果避免重复下载的问题,如何通过并行下载来加速数据抓取,如何利用不同的方式从动态网站中抽取数据,如何使用叔叔及导航等表达进行搜索和登录,如何访问被验证码图像保护的数据,如何使用Scrapy爬虫框架进行快速的并行抓取,以及使用Portia的Web界面构建网路爬虫。
使用对象附注:
本书适合有一定Python编程经验而且对爬虫技术感兴趣的读者阅读。
全部MARC细节信息>>
索书号 条码号 年卷期 馆藏地 书刊状态 还书位置
TP311.56/7423 72280148   自然书库(3F东)     可借 现代技术部(1F)
TP311.56/7423 72280149   自然书库(3F东)     可借 现代技术部(1F)
TP311.56/7423 72280150   自然书库(3F东)     可借 现代技术部(1F)
TP311.56/7423 72312169   自然书库(3F东)     可借 现代技术部(1F)
TP311.56/7423 72312505   自然书库(3F东)     可借 现代技术部(1F)
显示全部馆藏信息
CADAL相关电子图书
借阅趋势

同名作者的其他著作(点击查看)
用户名:
密码:
验证码:
请输入下面显示的内容
  证件号 条码号 Email
 
姓名:
手机号:
送 书 地:
收藏到: 管理书架