用Python写网络爬虫

用Python写网络爬虫 pdf epub mobi txt 电子书下载 2025

简体网页||繁体网页

☆☆☆☆☆

[澳]理查德劳森李斌

下载链接在页面底部

facebook linkedin mastodon messenger pinterest reddit telegram twitter viber vkontakte whatsapp 复制链接

承接住宅自建房室内改造装修设计免费咨询 QQ：624617358 一级注册建筑师亲自为您回答、经验丰富，价格亲民。无论项目大小，都全力服务。期待合作，欢迎咨询！QQ：624617358

想要找书就要到静思书屋

book.tinynews.org

立刻按 ctrl+D收藏本页

你会得到大惊喜!!

2016-8-1 平装 9787115431790

具体描述

Richard Lawson来自澳大利亚，毕业于墨尔本大学计算机科学专业。毕业后，他创办了一家专注于网络爬虫的公司，为超过50个国家的业务提供远程工作。他精通于世界语，可以使用汉语和韩语对话，并且积极投身于开源软件。他目前在牛津大学攻读研究生学位，并利用业余时间研发自主无人机。

作为一种便捷地收集网上信息并从中抽取出可用信息的方式，网络爬虫技术变得越来越有用。使用Python这样的简单编程语言，你可以使用少量编程技能就可以爬取复杂的网站。

《用Python写网络爬虫》作为使用Python来爬取网络数据的杰出指南，讲解了从静态页面爬取数据的方法以及使用缓存来管理服务器负载的方法。此外，本书还介绍了如何使用AJAX URL和Firebug扩展来爬取数据，以及有关爬取技术的更多真相，比如使用浏览器渲染、管理cookie、通过提交表单从受验证码保护的复杂网站中抽取数据等。本书使用Scrapy创建了一个高级网络爬虫，并对一些真实的网站进行了爬取。

《用Python写网络爬虫》介绍了如下内容：

通过跟踪链接来爬取网站；

使用lxml从页面中抽取数据；

构建线程爬虫来并行爬取页面；

将下载的内容进行缓存，以降低带宽消耗；

解析依赖于JavaScript的网站；

与表单和会话进行交互；

解决受保护页面的验证码问题；

对AJAX调用进行逆向工程；

使用Scrapy创建高级爬虫。

本书读者对象

本书是为想要构建可靠的数据爬取解决方案的开发人员写作的，本书假定读者具有一定的Python编程经验。当然，具备其他编程语言开发经验的读者也可以阅读本书，并理解书中涉及的概念和原理。

用户评价

评分☆☆☆☆☆

评分☆☆☆☆☆

##最近又重新浏览了一遍，里面还是有些干货的，虽然基于Python2版本。

评分☆☆☆☆☆

##2.7

评分☆☆☆☆☆

##书中内容没有跟进到 python3.x 版本，薄薄的一本书，亮点应该在验证码识别和 Scrapy 的 Portia 吧。

评分☆☆☆☆☆

##15年出的书，16年翻译出版，17年就已经看不了了。代码都是python2.7版的，有点老。

评分☆☆☆☆☆

评分☆☆☆☆☆

2.7的代码，唉:-(

评分☆☆☆☆☆

##还可以，讲得比较基础

评分☆☆☆☆☆

##py2.7

相关图书

本站所有内容均为互联网搜索引擎提供的公开搜索信息，本站不存储任何数据与内容，任何内容与数据均与本站无关，如有需要请联系相关搜索引擎包括但不限于百度，google,bing,sogou 等

© 2025 book.tinynews.org All Rights Reserved. 静思书屋版权所有

中国国家图书馆

国立台湾图书馆

美国国会图书馆

开放图书馆 openlibrary.org