02.28 學python爬蟲,哪本書基礎,全面,求推理?

YT884


《Python編程從入門到實踐》

《Selenium 3+Python 3自動化測試項目實戰:從菜鳥到高手》

可以直接入手第二本。學習爬蟲足夠了,第一本讓你明白python。

因為爬蟲也是可以用其他語言來實現


蜜蜂攻城獅


自己的想法吧!

我也是最近剛剛開始學習python編程 真的是小白接觸這個 一點點也看不懂聽不懂 就買了體驗課8 .9 學習了三四天 要懂英語 函數一系列高難度東西 但是我沒有放棄 還是堅持學習 學習語法 現在也開始慢慢看懂理解 可以自己寫一寫語法啥的 雖然說艱難不好學 但是我感覺只要自己不放棄就一定會成功


騎著蝸牛賽跑Lester


未來最大的能源不是石油而是大數據。對大數據的獲取、處理與分析,以及基於大數據的智能應用,已成為提高未來競爭力...

回答之前,先有情提醒一句,「蟲有風險」,刑法已明確非法獲取計算機信息系統數據罪。我們先來看看善意爬蟲和惡意爬蟲的區分:

  • 善意爬蟲,比如百度搜索引擎的爬蟲,嚴格遵守Robots協議規範爬取網頁數據(如URL),它的存在能夠增加網站的曝光度,給網站帶來流量。
  • 惡意爬蟲,它無視Robots協議,對網站中某些深層次的、不願意公開的數據肆意爬取,其中不乏個人隱私或者商業秘密等重要信息。

Python爬蟲,不懂Python可以嗎?不懂HTTP基礎可以嗎?不會基本的抓包工具你能玩通爬蟲嗎?一圖勝前言,我們先來看看python爬蟲都涉及哪些方面的知識:



言歸正傳,有什麼好的資料推薦呢?下面說說自己的看法。

1、Python 3網絡爬蟲開發實戰

豆瓣評分8.9分,全書以python3為基礎,從基本的開發環境、常用的爬蟲庫開始,對爬蟲過程涉及的基礎知識HTTP、Web基礎、代理進行了介紹,接下來詳細講解python中urllib、requests、正則等基礎庫的用法,並以實例「抓取貓眼電影排行」為例講解。

文中的內容不僅涉及爬蟲過程中代理的處理,驗證碼的識別,模擬登陸過程,更介紹了移動時代下APP數據的爬取,最後介紹了Scrapy框架,分佈式爬蟲的原理及部署。

具體內容可見上圖PDF,如果有需要這本書的童鞋,可關注+留言獲取。

2. 爬蟲實戰篇

talk is cheap,show me the code!

這裡直接推薦Github的開源項目「awesome-python-login-model」,這裡就不再貼地址了,大家直接去git上搜索即可。使用python模擬登陸一些大型網站,還有一些簡單的爬蟲。


眼過千遍不如手過一遍,多動手實踐,多多debug,永遠是提升自己編程技能的鐵的定律 !


一個程序員的奮鬥史


最好的書肯定是官方的文檔了,其實初級的同學隨便找哪個初級教程學一下就好了,把基本語法和原理搞清楚了,然後看你後期的需要,根據你自己需要來著重關注是更多是用哪個模塊,是遊戲,還是數據分析,還是做網站,等等,後邊的具體學到的東西就不一樣了。


蓬鬆的架


視頻解答

\n

{!-- PGC_VIDEO:{"thumb_height": 544, "vposter": "http://p0.pstatp.com/origin/tos-cn-p-0000/173f78d0838e4c90b9a5da6066ab9490\

北漂程序員大松


書看著不直觀,可以搜下爬蟲的基礎視頻,好多,有些老師會推薦一些書,到時候你可以查下目錄,看看有沒有覺得可以彌補自己的。有點要注意,看下書是基於python哪個版本的,我剛買的一個Django的書,結果是2.7的[捂臉][捂臉][捂臉],雖說也有學習作用,到時麻煩了


這輩子就python了


官方里pythonbooks.org


宜翔小哥哥


不建議動不動就說搞爬蟲,因為你不知道你的行為會不會涉及侵權知識產權,或者商業機密!


分享到:


相關文章: