01.30 2019再出發!全網python爬蟲之urllib庫最簡解析系列(二)

書接上文,本節主要涉及urllib.request.urlopen()返回的http.client.HttpResponse的的屬性和方法通俗講解


方法講解

  • readinto()—已經被放棄的方法

這個方法相信很多人在很多書上都有看過,然而基本上就是跟大家提及下就沒有說用法了,百度了也都找不到,但作為初學者的我們還是需要時刻保持著好奇心,為什麼這個方法會被放棄?本著研究的態度我仔細研究了下,

2019再出發!全網python爬蟲之urllib庫最簡解析系列(二)

這個方法需要一個bytes-like的對象,

2019再出發!全網python爬蟲之urllib庫最簡解析系列(二)

一臉懵逼的我調用了help函數看看

2019再出發!全網python爬蟲之urllib庫最簡解析系列(二)

翻一下就是:讀出二進制對象(bytes-like object),轉換成字節數組並返回二進制對象的大小

,什麼是二進制對象?怎麼轉換成二進制對象呢?比如

2019再出發!全網python爬蟲之urllib庫最簡解析系列(二)

圖中的b就是二進制對象,‘中文’剛好是6字節的大小

最後這個方法到底用來幹嘛的?

2019再出發!全網python爬蟲之urllib庫最簡解析系列(二)

  • getheaders()

這個東西物如其名,就是用來“取頭”的,而且是把頭全部都拿了,至於這個頭需要大家注意的是我們都知道頭有兩個,一個是請求頭,一個是響應頭,拿人人頭你覺得會是自己的嗎?(標準答案:響應頭)

  • getheader(name)

指明道姓的拿響應頭的某個部分!

  • fileno()

返回句柄(windows就是這個叫法,其他系統又叫文件描述符)。這哥們簡單說就是程序在內存的索引(不懂的同學可能還得腦補下關於內存方面的知識,我之前的文章裡面有關於這方面的介紹),

2019再出發!全網python爬蟲之urllib庫最簡解析系列(二)

一定是非負整數(≥0的整數)。


屬性講解

  • msg

返回響應狀態碼的描述,比如200表示成功,它的描述就是ok

  • version

返回http的版本,跟程序的版本一樣這個很好理解,比如10就是HTTP/1.0,,11就是HTTP/1.1.

  • status

返回響應的狀態碼,比如上面的200,找不到網頁的404

  • reason

這個跟msg有點像,只不過它返回的是原因

  • debuglevel

程序的調試部件,debuglevel如果大於0的話就會把信息打印成輸出文件,通常情況下你沒有設置默認是0,那具體是什麼意思呢?比如說這個

2019再出發!全網python爬蟲之urllib庫最簡解析系列(二)

跟我們直接打開response不同的是,這裡多了一個設置sslcontext的內容,即使沒有print語句也會有下面的輸出

2019再出發!全網python爬蟲之urllib庫最簡解析系列(二)

也就是說,當debuglevel設置大於0時,會把http請求和響應的過程打印出來

  • closed

這個好理解,就是把某個東西關閉。那具體時什麼呢?就是http的信息流,如果要求一直連接,信息流就不會斷這時候就會返回False,如果關的上就會返回True

希望我的解答真的能夠讓小白能夠理解,與你共勉,我是求道僧,歡迎關注!

有需要python學習資料的請關注並私信我!!


分享到:


相關文章: