精通Python爬蟲框架Scrapy

精通Python爬蟲框架Scrapy pdf epub mobi txt 電子書 下載 2025

[美]迪米特裏奧斯 考奇斯-勞卡斯 李斌
想要找書就要到 靜思書屋
立刻按 ctrl+D收藏本頁
你會得到大驚喜!!
2018-2-1 平裝 9787115474209

具體描述

作者:[美]迪米特裏奧斯 考奇斯-勞卡斯(Dimitrios Kouzis-Loukas) 譯者:李斌

Dimitrios Kouzis-Loukas作為一位軟件開發人員,已經擁有超過15年的經驗。同時,他還使用自己掌握的知識和技能,嚮廣大讀者講授如何編寫軟件。

他學習並掌握瞭多門學科,包括數學、物理學以及微電子學。他對這些學科的透徹理解,提高瞭自身的標準,而不隻是“實用的解決方案”。他知道真正的解決方案應當是像物理學規律一樣確定,像ECC內存一樣健壯,像數學一樣通用。

Dimitrios目前正在使用新的數據中心技術開發低延遲、高可用的分布式係統。他是語言無關論者,不過對Python、C++和Java略有偏好。他對開源軟硬件有著堅定的信念,他希望他的貢獻能夠造福於各個社區和全人類。

關於譯者

李斌,畢業於北京科技大學計算機科學與技術專業,獲得碩士學位。曾任職於阿裏巴巴,當前供職於凡普金科,負責應用安全工作。熱愛Python編程和Web安全,希望以更加智能和自動化的方式提升網絡安全。

Scrapy是使用Python開發的一個快速、高層次的屏幕抓取和Web抓取框架,用於抓Web站點並從頁麵中提取結構化的數據。《精通Python爬蟲框架Scrapy》以Scrapy 1.0版本為基礎,講解瞭Scrapy的基礎知識,以及如何使用Python和三方API提取、整理數據,以滿足自己的需求。

本書共11章,其內容涵蓋瞭Scrapy基礎知識,理解HTML和XPath,安裝Scrapy並爬取一個網站,使用爬蟲填充數據庫並輸齣到移動應用中,爬蟲的強大功能,將爬蟲部署到Scrapinghub雲服務器,Scrapy的配置與管理,Scrapy編程,管道秘訣,理解Scrapy性能,使用Scrapyd與實時分析進行分布式爬取。本書附錄還提供瞭各種軟件的安裝與故障排除等內容。

本書適閤軟件開發人員、數據科學傢,以及對自然語言處理和機器學習感興趣的人閱讀。

用戶評價

評分

評分

評分

評分

##@2019-03-13 19:01:37 我看瞭前言,說是要先找附錄A安裝各種,於是我前往。 一開始很順利,安裝瞭Vagrant和Docker 當進行到 vagrant up --no-parallel 時,我的cmd報錯瞭。如圖 我懷疑是網絡通訊有問題,於是我用瞭vpn,還是不行。 究竟是怎麼迴事呢?someone help me, thank you kind hearte...  

評分

評分

評分

##快速看瞭前麵幾章,能夠入門爬取一些簡單的頁麵。因為不是專門做爬蟲,所以沒有必要繼續深入。準備再去官網翻一翻最新的tutorial

評分

##這本書總體來說還不錯,xpath基礎講的蠻不錯的。整個邏輯思路還是蠻清晰,但是有一點特彆蛋疼,就是版本太久,有些東西都不能用瞭。比如第三章中的urljoin()現在屬於urllib庫中的一個方法,MapCompose(unicode.strip)方法已經不能使用。我就我就粗略地將後麵給看瞭一遍,後麵難度有點大。發現不怎麼適閤用來入門scrapy框架。不過裏麵的知識點也屬於乾貨,學到不少新東西。總體來說當做一本讀物還是不錯瞭,如果想依靠這本書學習scrapy框架的話,可能會有點遺憾。

評分

本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度google,bing,sogou

© 2025 book.tinynews.org All Rights Reserved. 静思书屋 版权所有