python3.x 網絡爬蟲之 urllib 庫下 parse 模塊

1、parse 模塊:他是 urllib 庫中的一個模塊,屬於python3中自帶的庫模塊,不需要再次安裝

2、parse 模塊下的兩個函數:

(1) parse.urlencode:這個函數可以將請求中的非法字符,重新編碼成合法字符

(2) parse.parse_qs : 這個函數可以將 urlencode 編碼後的字符串解碼還原成原來的字符

3、為什麼要重新編碼?

因為在網絡請求的過程中,有些 URL 是帶有中文的,但是我們直接使用代碼進行請求的時 候是無法被識別的,所以要自己進行重新編碼一下,然後再進行請求。

那為什麼在瀏覽器中可以輸入中文呢?

因為在你輸入之後,瀏覽器的底層幫你做了重新編碼這一步,而這個你是看不見的

代碼演示:

# 1、導入 parse 模塊
from urllib import parse

# 2、定義一個編碼對象
parser = {"name": "小明", "age": "18"}

# 3、重新編碼 parser對象
qs = parse.urlencode(parser)

# 4、打印結果
print(qs) # 結果顯示為:name=%E5%B0%8F%E6%98%8E&age=18


# 5、使用parse.parse_qs 解碼 qs 對象

qss = parse.parse_qs(qs)

# 6、打印解析結果
print(qss) # 結果顯示為 :{'name': ['小明'], 'age': ['18']}
python3.x 網絡爬蟲之 urllib 庫下 parse 模塊

【純個人手打,替老師傳道,不求多大成就但願 能幫到大家,在閒暇的時間裡為大家共享一些工作經驗和各種技術資源文章,希望幫助大家共同進步 也希望我的發佈對你有所幫助,我的發佈裡有更多類似的文章可以查閱,喜歡的請點關注,謝謝。你們的關注是我不停發佈的最大動力在我發佈裡好多類似這樣的文章,請盡情閱覽】


分享到:


相關文章: