机读格式显示(MARC)
- 000 01916nam0 2200361 450
- 010 __ |a 978-7-115-47967-9 |d CNY49.00
- 100 __ |a 20180801d2018 em y0chiy50 ea
- 200 1_ |a 用Python写网络爬虫 |A yong Python xie wang luo pa chong |f (德) 凯瑟琳·雅姆尔, (澳) 理查德·劳森著 |d = Python web scraping |f Katharine Jarmul, Richard Lawson |g 李斌译 |z eng
- 210 __ |a 北京 |c 人民邮电出版社 |d 2018
- 215 __ |a 196页 |c 图 |d 24cm
- 306 __ |a 本书由Packt Publishing授权人民邮电出版社出版
- 314 __ |a 凯瑟琳·雅姆尔 (Katharine Jarmul),德国柏林的一位数据科学家和Python支持者。经营了一家数据科学咨询公司——Kjamistan。
- 314 __ |a 理查德·劳森 (Richard Lawson),来自澳大利亚,毕业于墨尔本大学计算机科学专业。创办了一家专注于网络爬虫的公司,为超过50个国家的业务提供远程工作。
- 314 __ |a 李斌,毕业于北京科技大学计算机科学与技术专业,获得硕士学位。当前供职于凡普金科,负责应用安全工作。
- 330 __ |a 本书包括网络爬虫的定义以及如何爬取网站,如何使用几种库从网页中抽取数据,如何通过缓存结果避免重复下载的问题,如何通过并行下载来加速数据抓取,如何利用不同的方式从动态网站中抽取数据,如何使用叔叔及导航等表达进行搜索和登录,如何访问被验证码图像保护的数据,如何使用Scrapy爬虫框架进行快速的并行抓取,以及使用Portia的Web界面构建网路爬虫。
- 333 __ |a 本书适合有一定Python编程经验而且对爬虫技术感兴趣的读者阅读。
- 500 10 |a Python web scraping |A Python web scraping |m Chinese
- 606 0_ |a 面向对象语言,Python |A mian xiang dui xiang yu yan,Python |x 软件工具 |x 程序设计
- 610 0_ |a Python |A Python
- 701 _1 |a 雅姆尔 |A ya mu er |g (Jarmul, Katharine) |4 著
- 701 _1 |a 劳森 |A lao sen |g (Lawson, Richard) |4 著
- 702 _0 |a 李斌 |A li bin |4 译
- 801 _0 |a CN |b HDUL |c 20181128
- 905 __ |a HDUL |d TP311.56/7423