最容易被忽略的數據分析方法,90%的人都踩過這個坑

本文是《數據分析基礎方法與思維》

系列文章的第三篇,其他相關文章可以點擊我的主頁查看!

上兩篇我們講了數據分析方法中最基礎的對比思維和細分思維,不少同學都私信問我:為什麼自己在做對比分析的時候,只能做現有問題的原因分析和對比差異,得到的數據結果很難為下一步的工作決策做輔助,不知道是哪裡出了問題?

我們在進行對比分析的時候,往往會忽略一個重要的分析方法——趨勢分析。這時候還會有同學說,自己也經常做數據趨勢圖,並沒有忽略。其實,單純的數據趨勢圖是根本沒有任何價值的,趨勢分析最核心的關鍵,就是能否針對核心指標進行變化原因分析。

具體怎麼做呢?不要著急,我們慢慢來看

一、什麼才是趨勢分析?

你可以簡單地把趨勢分析定義為對比分析的一種,一般來說是按照時間的維度,對某一數據或者不同數據變化趨勢進行差異化研究,以及對數據的下一步變化進行預測。

趨勢分析一般而言,適用於產品核心指標的長期跟蹤,比如,點擊率,GMV,活躍用戶數等。做出簡單的數據趨勢圖,並不算是趨勢分析,趨勢分析更多的是需要明確數據的變化,以及對變化原因進行分析

趨勢分析另一個核心目的則是對趨勢做出解釋,對於趨勢線中明顯的拐點,發生了什麼事情要給出合理的解釋,無論是外部原因還是內部原因。

比如,下圖是某公司按崗位類別劃分的招聘天數的變化趨勢:

最容易被忽略的數據分析方法,90%的人都踩過這個坑

從中可看出:客服類崗位的招聘天數下降明顯,而運營和銷售類崗位的天數都呈上升趨勢,其中銷售類的趨勢尤為明顯。從HR的角度來分析,我們就需要重點關心銷售類崗位,解決其耗時上升的問題。,

但是要注意一點,這樣的趨勢數據圖是分析不出什麼價值的,需要結合其他維度的數據進行橫向、縱向的差異化對比,才能進行完整有效的趨勢分析。

趨勢分析除了可以用時間作為維度之外,還包括地區、人群等,不過並不常見,這裡就不介紹了。

二、趨勢分析的分類

在進行趨勢分析之前,我們首先要明確自己要做的趨勢分析屬於哪一類,然後才能針對性地採用各種方法,一般來說趨勢分析的分類方法主要有兩種:

一是按照分析目的分類,可以分為預測趨勢分析和現狀分析,比如你如果想評判一下某個產品賣得好不好,就屬於現狀分析,一般只需要對比當前數據和歷史數據即可;而假如你想預測一下某個產品能不能繼續擴大市場,也就是預測分析。

最容易被忽略的數據分析方法,90%的人都踩過這個坑

機器學習中最常見的預測分析

二是按照分析方向分類,可以分為縱向分析和橫向分析兩種。分類的方法非常簡單,如果你的趨勢圖上只有一條線,也就是對單個數據進行自身趨勢對比,就屬於縱向分析;如果你想對多個數據進行同一緯度的趨勢對比,就屬於橫向對比。

最容易被忽略的數據分析方法,90%的人都踩過這個坑

得到這樣的趨勢線,無非就是數據的統計、彙總、出圖,但是我們的重點在於分析曲線的發展原因。

怎麼做趨勢分析?

這裡我就統一進行預測分析進行說明:

1、如果你想要做單一數據的縱向趨勢分析,最核心的分析要點就是找拐點,然後結合不同維度數據進行原因分析,最後進行有效預測,得到趨勢分析結果。

具體我們舉個例子,下圖展示了2015-2019年間某家企業的年增長率(折線)和營收總額(柱狀)變化情況,如果想要對這家企業進行增長率預測分析,該如何做呢?

最容易被忽略的數據分析方法,90%的人都踩過這個坑

第一步,找拐點。根據增長率的變化圖波動來看,我們可以選取曲線突然下降的2017年作為分析拐點,我們首先要找到異常數據。

第二步,分析原因。為什麼企業年增長率從2015年開始的不斷上升,突然在2017年急劇下降呢?我們單從增長率變化上看不出原因,因此需要另一維度的數據進行對比分析,比如圖中的營收總額,很明顯在2017年的時候,營收總額突然下降,之後雖然營收總額不斷回升,卻仍然阻止不了企業增長率的下跌。

根據這兩個數據,我們得到以下結論:

2017年企業營收情況太差,造成企業增長速率的放緩;

2017年之後,企業營收基本保持不變,難以支撐高速發展的企業,因此企業發展逐漸陷入停滯;

第三步,有效預測。數據預測的方法有很多,我這裡用的是FineBI中的迴歸擬合,可以做出一條預測分析線,可以看出因為營收情況的平緩增長,企業的增長率大概率會保持在現有的9%不變,或者緩慢下降,除非企業採取措施擴大市場。

最容易被忽略的數據分析方法,90%的人都踩過這個坑

2、如果你想對多個數據進行橫向趨勢分析,核心點就是找差異。

比如下圖的數據,展示了A、B、C、D、E五個不同產品在不同時間內的銷售情況,那麼如何對不同產品的銷量進行趨勢分析呢?

最容易被忽略的數據分析方法,90%的人都踩過這個坑

第一步,找差異點。因為數據比較多,我們在進行差異點尋找的時候往往難以清晰找到,而且每個產品的波動都比較大,拐點非常多,這時候怎麼辦呢?

這時候我們就要轉而尋找差異點,例如我們可以看到2010年3月B產品的銷量上升到了高峰,而其他產品均下降,這就是一個差異點;而2011年1月雖然B產品銷量也達到了高峰,但是其他產品也同時呈現了銷量上升的情況,因此不足以成為一個差異點。

第二步,拆分指標。因為多維度指標的趨勢分析很難針對所有指標進行分析,因此需要將指標進行拆分,比如下面這樣:

最容易被忽略的數據分析方法,90%的人都踩過這個坑

最容易被忽略的數據分析方法,90%的人都踩過這個坑

第三步,分析趨勢。根據上面已經拆分出來的數據趨勢圖,就能看出整體的趨勢。最終,我們可以得到一個產品分類和管理的模型,作為我們的分析結果:

最容易被忽略的數據分析方法,90%的人都踩過這個坑


分享到:


相關文章: