微博用戶數據分析

研究目的

通過對博主和所發佈數據的抽樣,分析微博用戶的活躍情況、使用習慣傾向、關注的內容焦點等。

數據來源

收集微博用戶主頁上的第一頁微博數據,在博主主頁上收集博主信息和發佈的博文信息,博主是隨機選的,這裡選擇的數據主題是採集明星博主的數據,通過在微博用戶搜索界面輸入關鍵詞"藝人"進行搜索,然後再採集搜索出來的各個明星博主的主頁鏈接,把採集到的博主主頁鏈接添加到微博博主主頁數據採集工具箱,選擇只採集首頁,整理得到的數據表如下圖所示。

微博用戶數據分析

數據分析

1、全局統計

博主數量: 87

博文數量: 3855

轉發博文數量:915

平均發佈博文數:44.31

平均轉發博文數量:10.52

微博用戶數據分析

2、博主統計:分全量統計和樣本數據範圍統計

2.1、全量統計

博文發佈總數top3博主

1、陳法蓉:9062

2、胡兵:9021

3、容祖兒:8926

微博用戶數據分析

粉絲總數top3博主

2.2、樣本範圍統計

樣本博文被轉發總數top3博主

1、angelababy:8605365

2、汪蘇瀧:2516437

3、劉憲華Henry-Lau:1538185

微博用戶數據分析

樣本博文被評論總數top3博主

1、angelababy:1278484

2、樸寶劍_ParkBoGum:537637

3、陳羽凡: 520805

微博用戶數據分析

1、angelababy:8349033

2、鄭愷:6114702

3、王子文Olivia:5729370

微博用戶數據分析

3、博文統計:以下都是以樣本數據範圍做統計

轉發數top3的博文

1、angelababy,轉發數:1169490

http://weibo.com/1642351362/Gb8zXdt4N?from=page_1006051642351362_profile&wvr=6&mod=weibotime

微博用戶數據分析

微博用戶數據分析

評論數top3的博文

1、樸寶劍_ParkBoGum,評論數:253978

http://weibo.com/5896449921/E1OMA30uh?from=page_1005055896449921_profile&wvr=6&mod=weibotime

微博用戶數據分析

2、周渝民,評論數:221048

http://weibo.com/3197249862/D3ec766AP?from=page_1006053197249862_profile&wvr=6&mod=w

微博用戶數據分析

3、陳羽凡,評論數,200147

http://weibo.com/2113045567/EEGLn6ydW?from=page_1003062113045567_profile&wvr=6&mod=weibotime

微博用戶數據分析

http://weibo.com/3197249862/D3ec766AP?from=page_1006053197249862_profile&wvr=6&mod=weibotime

​​​​

微博用戶數據分析

http://weibo.com/2113045567/EEnOW0aY9?from=page_1003062113045567_profile&wvr=6&mod=weibotime

微博用戶數據分析

http://weibo.com/2113045567/EEGLn6ydW?from=page_1003062113045567_profile&wvr=6&mod=weibotime

微博用戶數據分析

有互動博文:3842條

微博用戶數據分析

有三種互動和有一種以上互動的博文

有三種互動博文:3773條

有一種以上互動的博文:3842條

微博用戶數據分析

4、終端統計:

不同終端發佈博文的統計

微博用戶數據分析

5、發佈時間統計:

24小時發佈規律

微博用戶數據分析

6、博文詞雲分析:

把博文做成詞雲圖,我們需要先對博文進行分詞,篩選出與研究目的相關的詞,再把這些篩選好的詞製作成詞雲圖,下面利用的是集搜客分詞打標工具對博文進行分詞,操作步驟如下:

這裡以有互動的微博博文為例,首先把有互動的微博博文單獨拷貝出來,保存到一個新的Excel表裡,然後登錄,把這張有互動的微博博文表導入,導入後在軟件裡就可以看到原數據,然後就可以在篩選詞語模塊下勾選與研究目的相關的詞,選完詞之後,在選詞結果模塊下可以看到前面選好的詞語以及詞語的頻數、詞語的樣本數據,如果覺得哪一個詞不想要了,可以在這個模塊進行刪除,點擊下載按鈕就可以把選詞表、打標結果表、分詞效果表一次性地下載下來,這些表都是可以做更加深入的拓展運算,比如詞雲圖、語義分析、建模運算等等。

下面就是利用的tagul詞雲工具把分詞效果表製作成詞雲圖,效果如下:

有互動的博文詞雲圖

微博用戶數據分析

無互動的博文詞雲圖

微博用戶數據分析

7、總結:

從top統計博文來看,微博用戶大多喜歡關注社會熱點事件,熱衷討論娛樂和社會輿論;

從終端佔比圖來看,微博用戶使用微博的方式是以手機為主,大部分用戶都喜歡使用蘋果手機發佈微博;

從24小時微博發佈規律圖來看,微博用戶從早上7:00開始活躍起來,白天的12:00到晚上的12:00全天都處於微博用戶的活躍高峰期,可見微博深受用戶喜愛,到了晚上12:00後活躍度才開始下降。

從博文詞雲圖來看,帶正能量的微博會引起更多微博用戶的互動,而帶廣告的博文則會降低用戶活躍度。


分享到:


相關文章: