python爬蟲突破圖片驗證碼,模擬登陸古詩詞網

很喜歡python,喜歡使用python爬蟲的,難免不了,有圖片驗證碼。本次就模擬模擬登陸

古詩詞網(gushici。org)。

python爬蟲突破圖片驗證碼,模擬登陸古詩詞網

古詩詞登陸界面

提交登陸,獲取參數

第一次,我們先提交登陸,然後谷歌瀏覽開啟調試工具,看提交參數。

python爬蟲突破圖片驗證碼,模擬登陸古詩詞網

code為驗證碼,email為賬號,pwd為密碼,from為空,denglu為固定參數,古詩詞網的是.net 的程序,因而,__VIEWSTATE和__VIEWSTATEGENERATOR每次變更,需要在登錄界面獲取,


python爬蟲突破圖片驗證碼,模擬登陸古詩詞網

核心代碼:

python爬蟲突破圖片驗證碼,模擬登陸古詩詞網核心代碼如下,主要是獲取2個參數,以及識別驗證碼:


python爬蟲突破圖片驗證碼,模擬登陸古詩詞網

好了,就到這裡了,注意這種方式驗證碼識別有成功率,不一定一次成功,需要多測試幾次,加上s = requests.session() 就可以保持登陸會話狀態,登陸進去之後,就可以想幹嘛就幹嘛了 。

需要完整代碼的,私信回覆:古詩詞,即可哈。


分享到:


相關文章: