指標,用數據分析解決問題

無論是產品還是運營,都離不開去用數據分析、解決異常問題。但是,在我們找到數據後,數據並不會直接告訴我們答案,我們需要做的就是把問題轉譯成維度和指標,然後提取數據,之後才是分析、解決問題。

明确锚点/维度/指标,用数据分析解决问题

數據分析是產品、市場、運營等崗位的基本技能,越來越多的招聘要求中,將數據分析視作基本要求。當然,大部分情況下,業務需要的數據分析是非常基礎的,只需用Excel做基本的統計計算,無須像專業的數據分析師,手握SQL和R,運用迴歸、分類樹等算法,輸出高精尖的報告。

從業務場景出發,數據分析是問題驅動的。也就是說,每一次啟動數據分析,本質是發現問題、翻譯問題、歸因問題和解決問題。

基於數據,發現問題是數據分析的第一步。問題之所以被稱為問題,是因為數據表現不符合“常理”或邏輯,正所謂“事出反常必有妖”。

01 發現問題:異常與錨點

大學時上普通心理學課程,講到精神障礙一章定義“正常行為”時,老師課上討論過“正常”的定義——是取平均值,還是取眾數,還是取中位數?

數據分析中也是如此,“常”是什麼?

常”可以是時序中的歷史數據

。比如App的日活用戶數(DAU),我們要判斷它是否正常,通常需要參考T-1、T-7、T-30的DAU,計算環比增幅(降幅)。

常”也可以是競品或者行業均值的指標表現。例如,微信公眾號頭條文章的粉絲打開率為5%(一個虛擬的數字不具備實際參考意義,即100個公眾號粉絲,平均5個會打開公眾號推送的頭條文章)。如果你的公眾號的粉絲打開率低於這個數值,那麼就要反思,是否是頭條文章的內容不夠吸引人。

或許你也發現了,“正常”也好,“異常”也罷,都是基於比較產生的。增速“快”、滲透率“高”、客戶數“少”,都是相對而言的。因此,基於數據定位問題的第一步,在於找到正確的錨點。

再看一個簡單的例子,你就會明白選擇正確的“錨點”對於定義問題是多麼的至關重要,因為只有選對錨點才能發現真問題。

互聯網廣告有一個顯著的特點,廣告主特別是中小廣告主傾向在週末減投或者停止投放,因此週末大盤的廣告主數量都會比較少因此。如果是將週六在投的廣告主數量與T-1(昨天,也就是週五)的投放廣告主數量相比,在部分行業會出現“斷崖式”的下跌。但是如果你去對比T-7(也就是上一個週六)在投廣告主數量,你會發現數據並沒有發生顯著變化。

假設我們已經定義清楚了問題,那麼接下來就是找到引起問題的因素,而這則需要數據指標按維度的拆解。

02 翻譯問題:維度與指標

工作當中,無論是剛入職場的新手,還是已經在職場打磨十幾年的老兵,面對數據分析時,最常犯的錯誤是混淆維度與指標。

維度是針對對象的描述性特徵或者屬性,比如城市的分級、性別、行業等;指標是用戶衡量對象的單位或者方法。維度與指標一般成對出現,共同構成一組數據。

例如,我們要分析北京、上海、廣州和深圳4個城市2019年的GDP,那麼城市就是維度,GDP就是指標。

再舉一個例子:最近疫情發展牽動著很多人的心,我每天早上醒來除了睜眼,第一件事情就是查看昨天全球新增患病人數,特別是每個國家的新增患病人數。在這裡,維度就是國家/地區,指標就是昨日新增患病人數。

數據提取時,我們還需要定義的是“篩選條件”。嚴格意義上,它只是維度或者指標的二次使用,與維度、指標並不在同一個邏輯層面。

現實業務中,我們的數據表中存儲著多個主體的多個指標數據,但是不是所有的維度和指標是需要我們關注的。因此,我們通常會通過維度或者指標,對將要提取的數據進行限制,避免數據量級過大,同時也避免我們的注意力分散。

還是以本次疫情中每個國家新患病人數為例。假設我只關心那些已經出現新冠肺炎病例的國家,因此篩選條件為截至到昨日,累計感染新冠肺炎病例數(指標)>0的國家和地區;那些還未出現感染患者的國家和地區暫時就不用考慮。

當然,如果只希望關注亞洲國家的疫情進展情況,那麼在國家這個維度中,只需將國家限定為中國、日本、韓國、伊朗等亞洲國家。

在我們正式進入後面的內容之前,請記住:維度、指標與篩選條件,是我們進行數據分析的基石。

儘管我們每天都會遇到各種各樣的數據分析需求,然而,數據本身是不會說話的,不會直接告訴你答案,你需要做的是把問題轉譯成維度和指標,然後提取數據,之後才是分析。

所以,收到數據分析的需求,不要急著寫SQL或者打開Excel,先明確下問題是什麼,以及希望達到什麼樣的目標。

怎麼樣才能準確翻譯成維度和指標呢?不要著急,我們一步步來。

假設,某一天我們被問到這樣一個問題:為什麼2019年我們公司拳頭產品——洗面奶的GMV下降了?

步驟1:明確分析的主體-限定篩選條件

公司的產品線非常豐富,從洗面奶、面膜、面霜、BB霜等,護膚類和彩妝類產品線基本都覆蓋。

好了,現在很明確,我們需要分析的數據是洗面奶,其他的產品如面霜、口紅等產品,暫時不需要我們操心。

聰明的你,肯定會記得,我們需要在篩選條件中,將產品種類這個維度限定為洗面奶。同時!!!時間維度限定為2019年,但是為了對比(參見上一篇),我們也需要提取2018年洗面奶的GMV數據。

步驟2:觀察數值——明確指標

我們拿到的問題是:為什麼2019年洗面奶的GMV下降了。

假設GMV在我們的業務範疇為複合型指標,也即是由2個基礎指標計算而來的,比如我們規定GMV=銷量*售價。

為了簡化問題,我們假設2019年洗面奶售價與2018年持平。也也就是說,2019年相比2018年,GMV下降的本質是銷量下滑。

步驟3:大膽建設提出原因——拆解維度

分析洗面奶銷量下降的原因,本質上就是找到在哪個維度上下降。

洗面奶銷量下降,我們猜測可能的原因有如下:

① 時間維度:2019年雙11促銷活動複雜,用戶參與度低;

② 渠道維度:2019年小紅書下架,導致洗面奶在小紅書上的銷量下降;

③ 消費者維度:2019年,30歲以下消費者購買洗面奶的人數減少;

……

  • 針對第一個猜想,我們只需按月(時間維度)提取2018-2019年24個月的銷量數據,比對2019年雙11與2018年雙11期間的銷量情況;
  • 針對第二個猜想,我們需要按照渠道(小紅書、天貓、京東、唯品會、KA賣場等渠道維度)提取銷量數據,分析小紅書渠道的銷量相對於2018年的增幅;
  • 針對第三個猜想,我們只需分析每一個年齡層級購買洗面奶的消費者數量即可。

03 歸因問題:維度與溯源

可能你已經發現了:我們一般依賴指標的“異常”來定義問題,然後通過維度拆解指標來定位和歸因問題。

還是以洗面奶銷量下滑原因拆解為例。通過多個維度的拆解,我們發現洗面奶在小紅書渠道銷量下滑,是導致洗面奶銷量下滑的“罪魁禍首”。

為了驗證你的觀點,你可能還需要在維度間交叉驗證:如,洗面奶銷量下滑的時間,是不是也剛好是小紅書被下架的時間?

事實上,維度非常多,如果我們只是粗淺地觀察數據趨勢,有可能得出的結論與真相大相徑庭。當然,我們經常遇到的另外一個問題則是:導致銷量下滑的原因多種多樣,多個維度都可以解釋銷量下滑,我們只需關注主要的維度即可;否認這如果我們不停地進行維度下鑽,或者維度間的交叉分析,只會陷入“維度災”。·

接下來就是怎麼做,讓數據指標恢復到“正常”——由上面的成因,導出你的執行策略。

04 解決問題:針對維度,影響指標

假設我們已經成功定位到問題了,即定位到維度了,接下來就是輸出策略的時刻。

其實,這是一個需要case by case討論的話題,畢竟業務場景不同、資源條件不同,方案也會不一樣。

這裡,只強調一點:你的方案,必須能強有力地影響指標

咋看起來是廢話,但是真實的工作中,你會發現很多方案與想要達成的目標經常南轅北轍。我們經常會忽視的一點是任何行為都會導致你可能意想不到的後果,感慨“原來這樣也可以”:

一個經典的案例是考古學家期望收購更多龜殼以拯救甲骨文,結果發現很多人都把龜殼砸碎了來賣,因為是按塊數付給他們費用,導致很多人把完整的龜殼敲成一塊塊的,以獲取更高價值。

實際上,很多活動也是如此:一個明明以GMV為導向的活動,愣是把活動路徑設計地非常長,造成用戶跳轉到其他頻道流失。

好了,以上就是我的一些思考,我叫餘子申,關注B端產品和營銷,歡迎大家多多交流。

題圖來自Unsplash,基於CC0協議


分享到:


相關文章: