抓取頭號玩家電影的微博評論數據做口碑分析

《頭號玩家》在上映17天后就斬獲超過12億人民幣票房,從貓眼9.1評分、豆瓣8.9評分,可見這部電影的高口碑,這也就能解釋為什麼能得到這麼好的票房了。從貓眼的映前想看日增圖上看,在上映日3月30這一天,觀眾的觀影慾望是最大的,後面的日增量也有幾個小高峰,說明後勁很足,為了研究電影口碑的作用,我特地選取了上映當天,由第三方影評人寫的一篇微博,把微博下面的評論作為研究語料,分析電影的口碑變化。


抓取頭號玩家電影的微博評論數據做口碑分析

注:圖片來自於貓眼電影,侵刪

1,收集數據

選取了一個影評人某一條微博,通過集搜客爬蟲的微博評論採集工具把它的評論採集下來。

採集網址:

https://weibo.com/1218981184/G9MOIFbb7?refer_flag=1001030103_&type=comment#_rnd1526022314512

微博評論採集工具:https://www.gooseeker.com/land/weibo.html

抓取頭號玩家電影的微博評論數據做口碑分析

由於一點開評論默認就是顯示熱門評論,不能按時間順序爬取,另外微博還有反爬限制,所以很難採到全部的數據,不過,另做爬蟲規則點擊按時間排序或者是採集過程中手工點擊按時間排序,還是可以採集到大部分數據,不過我沒做這步處理,所以總共收集到864條數據,雖然數據少了點,但是做樣本分析也夠了。

抓取頭號玩家電影的微博評論數據做口碑分析

2,數據清洗

2.1,從採到的數據中,選取了4月內的791條數據進行統計,因為後面5月份採到的數據有些零散就不用了,也就是過濾掉73條數據;

2.2,採集到的評論前面都是博主名字,這裡就用到了函數=REPLACE(G2,1,FIND(":",G2),""),把評論裡的博主名字過濾掉;

抓取頭號玩家電影的微博評論數據做口碑分析

2.4,把發佈時間裡的月日提取出來,這裡用數據分列功能完成;

抓取頭號玩家電影的微博評論數據做口碑分析

3,數據統計分析

3.1,評論走勢

抓取頭號玩家電影的微博評論數據做口碑分析

按評論日期,統計出每天的評論量,如上圖,電影上映的第一週,除了開始的兩天內有個小起伏,基本上每天的評論量都不多,然後在第二週的4月9日(週一)和4月15日(週日)突然都有一個大高峰,結合評論內容來看,大多數是一些觀影感受、討論劇情之類的內容,再結合前面貓眼的映前想看日增圖來看,可以說明應該是第一週的口碑已經建立起來了,然後看電影的人就多了,接著就有了後面交流吐槽的高峰期;

3.2,評論互動性

抓取頭號玩家電影的微博評論數據做口碑分析

抓取頭號玩家電影的微博評論數據做口碑分析

3.3,評論情感分析

3.3.1,對評論進行文本分詞

利用集搜客的分詞打標應用https://www.gooseeker.com/tagtool2,把評論一列數據導入然後自動分詞。

抓取頭號玩家電影的微博評論數據做口碑分析

3.3.2,選出情感詞

然後選出具有情感傾向的詞語,再把情感詞分成正面詞、中性詞、負面詞三類,根據原數據中包含的詞語組合規則,算出其代表的情感傾向。

抓取頭號玩家電影的微博評論數據做口碑分析

3.3.3,情感分析

抓取頭號玩家電影的微博評論數據做口碑分析

抓取頭號玩家電影的微博評論數據做口碑分析

從情感傾向圖可以看出,正面評論最多,佔比48%,其次是中性評論43%,負面評論只有9%,也就是說,有91%的評論是偏向積極友好的;

從情感走勢圖可以看出,正面評論、中性評論都是持續產生的,負面評論則是不連續的。

3.4,詞雲分析

抓取頭號玩家電影的微博評論數據做口碑分析

把分詞表導入到talgul第三方詞雲工具,得到上面的詞雲圖,從雲圖中看出,大家對電影自帶的遊戲標籤討論最熱烈,其次是對電影的觀後感,好看是使用最多的好評詞語,對於現實與虛擬的感悟是很多的,然後看到資源、1080等詞,就知道有不少評論是資源小廣告,雖然這種行為非常不好,但是也從側面說明,頭號玩家這部電影的確是很吸引人。


分享到:


相關文章: