Scrapy是使用Python開發的一個快速、高層次的屏幕抓取和Web抓取框架,用於抓Web站點並從頁麵中提取結構化的數據。《精通Python爬蟲框架Scrapy》以Scrapy 1.0版本為基礎,講解瞭Scrapy的基礎知識,以及如何使用Python和三方API提取、整理數據,以滿足自己的需求。
本書共11章,其內容涵蓋瞭Scrapy基礎知識,理解HTML和XPath,安裝Scrapy並爬取一個網站,使用爬蟲填充數據庫並輸齣到移動應用中,爬蟲的強大功能,將爬蟲部署到Scrapinghub雲服務器,Scrapy的配置與管理,Scrapy編程,管道秘訣,理解Scrapy性能,使用Scrapyd與實時分析進行分布式爬取。本書附錄還提供瞭各種軟件的安裝與故障排除等內容。
本書適閤軟件開發人員、數據科學傢,以及對自然語言處理和機器學習感興趣的人閱讀。
##這本書總體來說還不錯,xpath基礎講的蠻不錯的。整個邏輯思路還是蠻清晰,但是有一點特彆蛋疼,就是版本太久,有些東西都不能用瞭。比如第三章中的urljoin()現在屬於urllib庫中的一個方法,MapCompose(unicode.strip)方法已經不能使用。我就我就粗略地將後麵給看瞭一遍,後麵難度有點大。發現不怎麼適閤用來入門scrapy框架。不過裏麵的知識點也屬於乾貨,學到不少新東西。總體來說當做一本讀物還是不錯瞭,如果想依靠這本書學習scrapy框架的話,可能會有點遺憾。
評分##基礎要求較高。
評分##走馬觀花看完的一本書,翻譯不算太好。 可能是我太菜瞭,看著有些費力。
評分距離上一本技術書籍,這是過去多少年瞭,真是慚愧。感覺這真是一本好書,由淺入深,輕鬆愉悅。很快就看完瞭。此前看文檔和網上零碎的文章學 Scrapy,真是痛苦死瞭,這書是個很好的路徑規劃。打 4 星,扣分在 5毛 的插圖上麵…… 補充兩句,感覺不要太糾結版本的問題,現在軟件版本翻新很快的,不過我看著 1.8 的文檔學瞭半天,迴來看這個老版本,沒覺得有什麼地方老舊過時,核心概念都沒變化。如果用的時候,發現不對瞭,那順便看看文檔,正好當作復習和鞏固瞭。
評分##很不錯啊。使用scrapy1.0的。
評分##第 8 章 Twisted 編程、接口圖、第 9 章非阻塞 pipeline,第 10 章 scrapy 性能分析,這些比較有價值,其他一般。第4章、第6章都是軟廣。
評分距離上一本技術書籍,這是過去多少年瞭,真是慚愧。感覺這真是一本好書,由淺入深,輕鬆愉悅。很快就看完瞭。此前看文檔和網上零碎的文章學 Scrapy,真是痛苦死瞭,這書是個很好的路徑規劃。打 4 星,扣分在 5毛 的插圖上麵…… 補充兩句,感覺不要太糾結版本的問題,現在軟件版本翻新很快的,不過我看著 1.8 的文檔學瞭半天,迴來看這個老版本,沒覺得有什麼地方老舊過時,核心概念都沒變化。如果用的時候,發現不對瞭,那順便看看文檔,正好當作復習和鞏固瞭。
評分##@2019-03-13 19:01:37
評分##基礎要求較高。
本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度,google,bing,sogou 等
© 2026 book.tinynews.org All Rights Reserved. 静思书屋 版权所有