用python解析網絡新聞JSon數據，業精於勤_ _ 頭條網

當網站頁面是使用了AJAX架構的時候

AJAX是動態數據，經常是返回json數據，這時候就要分析返回的json數據包。

所以json數據包的解析是必要的。

獲取數據必須要靈活使用網頁調試工具

目前的瀏覽器用Chrome，肯定是能夠更好的跟蹤調試要追蹤的頁面內容。

可以專門找個帖子看兩眼，或者自己直接打開這個瀏覽器，然後從右上角的菜單，進入開發者工具，然後就可以看到下面的工具了。

這裡面有個XHR,專門用來看ajax的數據的。

如下圖裡，進入network菜單，然後再點下XHR,可以看到各個請求與響應數據。

裡面這個webid非常珍貴。

肯定可以想象，website是有各自預防手段的

def getdata(url, headers, cookies)

獲取數據的基本參數是這樣

這裡的url可以直接用瀏覽器訪問下後獲取，URL裡面有重要的參數_sigXXnatureXX，aXsXX,這兩個是專門用來屏蔽的了。XX去掉。應該是有時效的參數。

但肯定是有短期辦法。

圖裡的cookie部分，是一個重要參數。

作者就是在代碼中使用的這個參數cookies = {'XXtt_XXwebXXid': '68058XX60779XX611653639'}

XX要去掉。

這個參數是要自己去用瀏覽器獲得的，不可複製的，哈哈，不要傻傻的複製。

用pycharm調試的時候用到的三個庫

import requests

import json

from openpyxl import Workbook

小技巧就是把光標放到比如requests前面，然後按alt+enter就可以出現菜單，安裝這個庫了。

如果訪問速度太慢，就用國內的鏡像，舉例如下：XX可以網絡查到豆瓣，阿里，清華的鏡像

pip install -i https:XX --trusted-host YY requests

略微示意下關鍵代碼

可以去代碼網站上查找得到哈，（我們這裡實在閱讀代碼不方便，審核也麻煩）

def main(max_behot_time, title,

source_url, s_url, source, media_url):

# 主函數

for i in range(3): # 此處的數字類似於你刷頁面的次數

ascp = get_as_XXcXXp() # 獲取XXaXXs和cXXp參數的函數,xx去掉

demo = getdata(start_url, headers, cookies)

print(demo)

# time.sleep(1)

for j in range(len(demo['data'])):

# print(demo['data'][j]['title'])

if demo['data'][j]['title'] not in title:

# 獲取title

title.append(demo['data'][j]['title'])

重要的是與大家交流，拋磚引玉。

一塊交流遇到的問題，打造實用代碼。

當網站頁面是使用了AJAX架構的時候

獲取數據必須要靈活使用網頁調試工具

肯定可以想象，website是有各自預防手段的

用pycharm調試的時候用到的三個庫

略微示意下關鍵代碼

重要的是與大家交流，拋磚引玉。

相關文章:

潛逃壓力過大暴瘦40多斤，一涉黑A級通緝犯在河北投案自首

當我們在談 SaaS 的時候，在談什麼？

合同詐騙的類型有哪些？企業無力償還借款是否構成合同詐騙罪？

5月西安招聘會時間安排來了！找工作的別錯過

剛剛工作的畢業生，一個月只有2000多，是不是太少了？

全球鬧「美元荒」帶動穩定幣需求暴增！以太坊交易量創近兩年新高

“幫助當地居民解決用水難題”-今日頭條-手機光明網

灌籃高手無水印壁紙，每一張都是回憶

通遼藍天救援隊成功解救遼河公園水上被困群眾

5月6日·武漢要聞及抗擊肺炎快報

肖副省長等省市領導到孝感市楚澴中學調研九年級復學暨疫情防控常態化工作

相聲界的顏值擔當張雲雷稱號大揭祕

美國百年薅羊毛攻略

《全職高手》：一口氣刷了10集，對楊洋路轉粉了

共同承擔責任！Rookie談BP問題：輸了是我們打得太臭

LOL"中韓對抗賽"遭選手反對？Zoom直言不想打，Doinb的回答太真實

李亞鵬攜李嫣出席慈善晚會，李嫣手上鑽戒搶鏡，1個動作獲誇讚！

53歲郭富城再度升級當爸，方媛懷二胎，Chant要做姐姐了

那些拼命的演員：王寶強喝了一大桶牛奶，孫儷吃10斤瓜子

賈乃亮用上了“一米陽光”這個詞，他依然渴望擁有美麗的愛情！

搞笑GIF開心一刻：我的老家農村，有妹子願意嫁給我嗎？

為什麼只有edg賺錢？

程瀟身材多好？雙腿劈叉才明白，這才是“腿精”

張柏芝承認三胎產子，否認小夥的老爸是孫東海，看來她選擇保密

T1戰隊搶注Faker商標，“囊括多個領域產品，商業潛力媲美喬丹”

雲頂之弈“最不平衡的版本”誕生，全員搶一費卡，運氣成吃雞關鍵

LPL春季賽"6宗最"：Uzi最遺憾，阿水最驚喜，V5最離譜

雷佳音被問：跟佟麗婭拍那麼多親熱戲是啥感受？他的回答笑翻眾人

JDG成最“慘”冠軍戰隊？拿到LPL冠軍人氣依舊低迷，TES成贏家！

#戰疫必勝#“症和狀”都有了，我與新冠擦肩而過

T1提議中韓友誼賽，但LPL隊伍都不想參加？理由其實很簡單

網友投稿：光山縣潑陂河鎮至白雀園鎮的X015縣道德兩座壞橋經過5個月的等待終於開修啦#光山 #信陽

2020最佳韓劇追起來~《愛的迫降》僅排名第二，TOP 1絕對實至名歸

搞笑GIF開心一刻：我正在睡覺，誰敢打擾我

備考消防的幾大錯覺，你有這個情況嗎？

“頂流”李敏鎬啞火，渣男出軌劇出圈，韓劇觀眾也長大了？

網上羅馬仕充電寶20000毫安的，參數怎麼很多樣？哪個是真的？

應急科普丨“五一” 期間氣溫回升 謹防森林火災隱患

搞笑GIF開心一刻：拍照啦，趕緊看鏡頭

工程發承包、工程造價條款，或迎來大調整

應急科普丨“五一” 期間氣溫回升謹防森林火災隱患