我用python找到了室友的初戀

我用python找到了室友的初戀

我的室友王大國,一直號稱自己母胎單身,但我和其他室友一致不相信,因為剛上大學的時候明明經常聽到他打電話啊,還騷裡騷氣的

我用python找到了室友的初戀


不知道是在家待傻了,還是春天來了,今天,我的室友王大國發了下面一條朋友圈:

我用python找到了室友的初戀

於是大家都開始誇他“不要face”

就在此時,我靈機一現,想出一個絕妙的辦法——用python找出大國小朋友的前任女友

我用python找到了室友的初戀


首先我進入他的qq空間(因為以前微信沒流行的時候,廣大90後還是很喜歡玩qq的,尤其是小情侶,幾乎天天留言膩歪),然後很自然的來到了留言板

我用python找到了室友的初戀

發現王大國的留言在3年前就斷了,但是還是有幾十頁的留言,原來他的人緣以前就那麼好

下面開始用python絕技開始分析這些留言:

1.用python爬取留言並保存

爬取方式大概可以分為2種:

①用selenium操控瀏覽器,模擬登錄,然後逐頁爬取,缺點:速度較慢;

②requests創建1個會話,然後模擬登錄,再根據參數特徵進行逐頁爬取,缺點:模擬登錄過程太難;

這麼看來哪種方式都不合我心意,那麼怎麼才能找到即快又簡單的方式呢?

我們只需改進一下第二種方式就ok了,即用requests帶著登錄後的cookie值去爬取,省去了參數分析的步驟,代碼如下:

我用python找到了室友的初戀

最後的results為評論的列表,再把qq號、暱稱、評論時間、評論內容保存在表格中:

我用python找到了室友的初戀

2.先分析一下留言數量排名

先找到留言數量排名前十的好友,主要涉及到pandas操控excel表格知識,代碼如下:

我用python找到了室友的初戀

最後將留言數量排名前十的好友信息以數據框的格式存入new_dataframe中。

3.用pyecharts畫出柱狀圖

Pyecharts之前已經講過很多次了,代碼如下:

我用python找到了室友的初戀

柱狀圖為:

我用python找到了室友的初戀

(暱稱已改)

一位暱稱為“小靜”的好友評論次數最多,總共48次,我們可以發現王大國這個厚臉皮自己給自己留了30多次言

接下來對“小靜”的留言內容進行分析,畫一個詞雲圖,代碼如下:

我用python找到了室友的初戀

詞雲圖為:

我用python找到了室友的初戀

哈哈哈,又是“班裡”,又是“好想你”的,這簡直是學生時代偷偷摸摸愛情的典型啊,趕緊返回看一看留言時間:

我用python找到了室友的初戀

看來在一起的時間還不短呢

然後就開始給王大國“對質”:

我用python找到了室友的初戀

又是和大國鬥智鬥勇的一天,開森!

需要代碼的請私聊回覆初戀獲取


分享到:


相關文章: