基於 Python 的網易民謠歌詞數據分析

(1)目標確定和分析 網易歌曲鏈接地址為:https://music.163.com/discover/

playlist/?cat=%E6%B0%91%E8%B0%A3&order=hot,在此鏈 接地址 Response 中可以看到源代碼以及頁面的具體信息,通 過在Headers裡可以看到request URL,從而利用URL的地址 鏈接進行接下來的信息採集。

(2)編寫python爬蟲代碼 首先在下載網頁內容前,需要進行 download 代碼封裝,

進而對下載的信息有了安全性和隱蔽性的保障,限制了一定 的訪問者,必要地要通過接口才可進行訪問。

(3)執行爬蟲

整個爬蟲爬取信息的重點即是通過 get_music()方法獲 取 top10 的歌手以及歌詞內容並保存到 TXT 文件中 。

基於 Python 的網易民謠歌詞數據分析

歌手情緒數據分析

本節運用 Python 類庫(SnowNLP)對民謠 top10 歌手的 歌詞文本進行情緒分析, 運用 SnowNLP 後對 top10 民謠歌手的歌詞進行情感分析。

運用詞雲統計歌詞詞頻與可視化 為了讓數據分析出來更加直觀清晰,首先運用 jieba 庫

行分詞和詞頻統計分析,得到歌詞中詞頻統計信息 。

基於 Python 的網易民謠歌詞數據分析


分享到:


相關文章: