數據分析案例:誰是2018當之無愧的“第一”國產電影?

2018年度國產電影佳片不少,如何利用數據分析,來一次“年度國產電影第一名”的評比呢?

数据分析案例:谁是2018当之无愧的“第一”国产电影?

海選:票房才是話語權

酒香也怕巷子深,雖然票房不是衡量影片好壞的唯一標準,但是票房一定程度反映了包括你我在內的廣大群眾對該影片的偏好。

這裡,我們簡單粗暴地挑選2018年三部年度總票房突破“30億”的大片:《紅海行動》、《唐人街探案2》和《我不是藥神》。

初賽:基本面分析

1. 票房信息

数据分析案例:谁是2018当之无愧的“第一”国产电影?

我們選取的三部影片年度總票房都超過了30億,票房最少的《我不是藥神》都比排名第10的《前任3:再見前任》高出將近一倍。從中國票房網上的年度票房數據情況上看,三部電影各有千秋:

(1)年度總票房上看,《紅海行動》略勝一籌,36.5億拔得頭籌。

(2)場均人次上看,《唐人街探案2》達到了39人,可謂“座無空席”。

(3)作為前十唯一的劇情片《我不是藥神》在動作、喜劇的票房殺手中殺出重圍。

2. 搜索熱度

数据分析案例:谁是2018当之无愧的“第一”国产电影?

百度作為最常使用的中文搜索引擎,我們用百度搜索指數“還原”影片上映期間的搜索熱度,可以看到《我不是藥神》和《紅海行動》搜索熱度相近(《我不是藥神》有更高的搜索峰值,但《紅海行動》搜索熱度持續時間更長)。相比之下,作為續集的《唐人街探案2》在“吸納”了《唐人街探案1》的熱度後反而發力不足,在搜索熱度上完敗。

3. 討論熱度

討論熱度衡量影片的話題性和公眾自發的討論熱度。作為國內即時通訊一哥的微信,我們用微信指數作為衡量影片討論熱度的指標。

数据分析案例:谁是2018当之无愧的“第一”国产电影?

可以看到討論熱度上,《我不是藥神》“吊打”其餘兩部影片,用生命救贖和仿製藥的衝突掀起了一波討論狂潮,製造了空前的話題性

同時,帶著“愛國”屬性的《紅海行動》也比商業喜劇《唐人街探案2》具有更大的可討論性。

4. 人群畫像

数据分析案例:谁是2018当之无愧的“第一”国产电影?

由於分析的時間跨度為一年,並不是所有觀眾都在電影院看的這三部電影,因此我們仍然用百度指數的人群畫像來分析搜索人群的特徵。

(1)三部影片的觀眾特徵

可以看到除了《紅海行動》的觀眾略微偏向“中老年”(大於40歲)觀眾外,三部“30億”的影片觀眾年齡分佈較為相似,主要觀眾年齡處於30-49(和我的預期不太一致~)。

從性別分佈上看,《紅海行動》和《唐人街探案2》男女分佈較為平均,但是觀看《我不是藥神》的男性比例要顯著多於女性

(2)票房電影和流量電影的觀眾特徵比較

我挑選了兩部流量電影,一部是楊冪的《寶貝兒》,另一部是吳磊的《阿修羅》。可以看到流量電影的性別比例更加失衡,不過個人對百度的人群畫像數據持懷疑態度,因為20-29歲上網主力軍的存在感有點太低了。

5. 豆瓣評分

数据分析案例:谁是2018当之无愧的“第一”国产电影?
数据分析案例:谁是2018当之无愧的“第一”国产电影?数据分析案例:谁是2018当之无愧的“第一”国产电影?

在國內影評可信度較高的豆瓣,我們可以看到《我不是藥神》討論熱度和評分雙豐收,《紅海行動》評分也拿到了較高的8.3,但是《唐人街探案2》不及同類型電影的平均水平,僅僅只有6.7分。

6. 基本面分析結論

基本面各方面分析中《紅海行動》表現尚佳,《我不是藥神》通過掀起討論狂潮成為票房口碑雙豐收的佳片,相比之下《唐人街探案2》各方面表現平平,因此國產“第一”電影將在《紅海行動》和《我不是藥神》的角逐中產生

決賽:影評數據分析

我們下一步通過挖掘豆瓣影評信息,實現對兩部部影片的深度分析。

1. 數據獲取

数据分析案例:谁是2018当之无愧的“第一”国产电影?

我們嘗試簡單地爬取《紅海行動》和《我不是藥神》豆瓣短評的用戶暱稱、評論內容、評論日期、點贊數(其他用戶對該條評論的點贊)和星級數(用戶給電影的打分,50對應5星評價),為下一步的分析做準備

注:由於豆瓣對爬蟲的限制,我們只能爬取兩部影片各500條短評的數據,雖然會對最終的分析結果產生干擾,但大體結論應該出入不大。

数据分析案例:谁是2018当之无愧的“第一”国产电影?

2. 電影評分時間走勢分析

在仔細分析兩部電影的評論數據之前,我們先看一下兩部電影的評分走勢。該步驟主要是為了查看兩部電影的影評是不是存在惡意“差評”或者“水軍”刷分的情況,保證兩者比較的公平性。

数据分析案例:谁是2018当之无愧的“第一”国产电影?数据分析案例:谁是2018当之无愧的“第一”国产电影?

注:《紅海行動》上映日期2月16號,《我不是藥神》6月30號大規模點映,7月5號上映

可以看到豆瓣影評數在兩部電影上映期間達到峰值,並且兩部電影三星以下的評價都較少(《我不是藥神》的低星評價更少從而獲得更高的豆瓣評分)。可以看到兩部電影的評分走勢沒有顯著的異常,因此不存在人為的故意“灌水”/“抹黑”的情況

3. 豆瓣影評情感分析

我們對兩部影片的每條評論進行情感分析,得分高於0.5的為正面情緒,得分低於0.5的為負面情緒,最終得到的兩部電影情感分析圖如下:

数据分析案例:谁是2018当之无愧的“第一”国产电影?

從豆瓣影評情感分析圖中,我們可以發現兩部電影情感得分≤0.94的影評數量分佈基本一致,但是情感接近1的影評數量《紅海行動》要佔絕對優勢。

我翻看了兩部電影的豆瓣影評後發現,《紅海行動》影評大多提及影片的熱血和刺激,用詞更偏正面性;但是《我不是藥神》由於其選題紮根生活,引發的更多是對於生命救贖的思考

因此我認為在影評的情感分析上兩部影片都表現不錯。

4. 影評詞雲分析

我們對兩部影片的評論繪製詞雲圖:

数据分析案例:谁是2018当之无愧的“第一”国产电影?
数据分析案例:谁是2018当之无愧的“第一”国产电影?

可以看到,《紅海行動》作為典型的愛國主旋律戰爭片,影評強調的是“中國”和“主旋律”。但是同時作為一部寫實的戰爭片,它又自帶“血腥”的負面屬性,這也和我們在電影人群畫像部分的分析中看到的年齡分佈偏“中老年化”相吻合。血腥的戰爭鏡頭可能不適合低齡觀眾觀看。

《我不是藥神》影片中既有對故事的肯定:“煽情”,“現實”,“題材”,同時又引發了人們的反思

:“問題”,“希望”,“社會”。

結論

電影到底是為了追求帶給人們強烈的視覺體驗還是帶給人們對生活的反思,這個問題可能需要一代又一代的導演去權衡去解決。

在《紅海行動》之前,類似題材《戰狼2》已經創造了56億的票房,帶給觀眾的觀感體驗有所減弱。而《我不是藥神》作為出色的商業片收穫30億票房的同時,又能緊扣現實題材,掀起了民眾巨大的討論狂潮,不能說後無來者但也是前無古人了。

在這個意義上,我覺得《我不是藥神》已經勝利了,希望中國出現越來越多類似的商業影片,別寒了用心拍戲導演的心。

相關工具:

  1. 爬蟲:八爪魚採集器;
  2. 繪圖:pyecharts;
  3. 文本分析:snownlp,jieba,wordcloud;
  4. 圖片處理:photoshop。

作者:Tomocat,女朋友是產品經理的數據分析師。

本文由 @Tomocat 原創發佈於人人都是產品經理,未經許可,禁止轉載。

題圖來自 Unsplash,基於 CC0 協議。


分享到:


相關文章: