常見的錯誤代碼及錯誤原因

響應狀態碼

響應狀態碼錶示服務器的響應狀態,如200代表服務器正常響應,404代表頁面未找到,500代表服務器內部發生錯誤。在爬蟲中,我們可以根據狀態碼來判斷服務器響應狀態,如狀態碼為200,則證明成功返回數據,再進行進一步的處理,否則直接忽略。


常見的錯誤代碼及錯誤原因


常見的錯誤代碼及錯誤原因


(3) 響應體

最重要的當屬響應體的內容了。響應的正文數據都在響應體中,比如請求網頁時,它的響應體就是網頁的HTML代碼;請求一張圖片時,它的響應體就是圖片的二進制數據。我們做爬蟲請求網頁後,要解析的內容就是響應體


分享到:


相關文章: