神策數據徐美玲:如何挖好數據這座礦?(可下載PPT)

神策數據徐美玲:如何挖好數據這座礦?(可下載PPT)

本文根據神策數據業務諮詢專家徐美玲在神策 2019 數據驅動大會上發表的《如何挖好數據這座礦》主題演講整理而成。本文將為你重點介紹數據驅動的挖礦模式進階法和數據基礎建設的真相,包含以下內容:

  • 看數據——如何正確的看數據?
  • 分析數據——有哪些典型的分析場景?各場景下的分析要點是什麼?
  • 應用數據——應用數據的場景差異有哪些?千人千面、精準營銷、精細化運營如何實現?
  • 有數據——如何進行數據體系建設?

數據是一個蘊藏無限價值的礦已是大家的共識,問題在於礦在哪?是什麼樣的礦?如何挖掘礦中真正有價值的鑽石,來釋放數據真正的價值?從業務角度來看,數據的整體重要性毋庸置疑,但是對於業務人員來說,他們要的是真正稱之為鑽石的部分。

近段時間我一直在做諮詢項目,在給客戶規劃其整個業務體系以及如何從 0 到 1 落地的相關思考,這些思考對於大家在公司內部與業務方溝通,尤其是對於數據部門跟業務部門的互相理解,可能也會有比較大的幫助。

挖礦這件事情,其實從業務的角度上來講,可抽象為三個不同階段的層面,我將其歸納為挖礦模式進階法,如下圖:

神策數據徐美玲:如何挖好數據這座礦?(可下載PPT)

具體來說,真正在數據分析應用時的區分,我認為包含三個層次:

1.看數據,其實很多時候大家看數據,只知道數據是什麼樣子的,但是對業務產生不了價值,很多數據驅動的業務進行從 0 到 1 的搭建時,其往往最初的階段是先要把看數據這個體系建立起來。但是,我接觸的很多企業其看數據還沒有達到一個理想狀態,之後我會介紹需要達到什麼狀態,才說明其把數據看好了。

2.分析數據,從分析階段來講,其真實目的是企業知道為什麼,並且在該過程中,找到解決方案的提示和方向,這是分析層面能夠帶來的價值。

我在做售前交流時,經常會有一些技術團隊的領導會問,神策數據為什麼不能做成只要把數據輸入,就可以自動跑出數據的情況總結,然後告訴業務應該幹什麼。這個問題我想了下,其實我理解他的思路,做技術的人會希望工作流自動化,例如在 APM 的監控體系裡,一般數據的整個流量與運營有一個慣常的模式,並不需要考慮上層的業務運作,只需瞭解流量本身有無大的異常,以及流量的結構對於現在 CPU 的佔用是否達到峰值,在該階段,其確實可通過程序化策略直接定位原因。

但是,數據分析很難這樣做,核心原因是在業務環境裡,一個數據哪怕出現同樣的變動狀態,也可能是很多不同的原因導致,而這種可能的原因判斷,往往取決於業務分析的人本身對業務的敏感度,以及數據採集的豐富度,才能真正做出明確的定位,然後才是給出解決方案。

哪怕同樣的數據趨勢,既可能是內部的原因導致,也可能是外部的大環境導致。如同樣是 GMV 的大幅下跌,有可能是運營活動的激勵機制失效導致無法正常運作,也可能是外部的一個熱點,如淘寶雙十一活動,對小平臺的整個成交量有了較大的衝擊。

所以,若對數據產生影響的因子本身具備不可預測性和場景的複雜度,加上業務場景和模式差異太大,所以被完全自動化的難度非常大,這種情況下便需要引入人為判斷,這也是分析師的核心價值。

3.應用數據,指的是常說的千人千面、精準營銷、精細化運營意味著什麼,從產品和技術上有無對接的系統和系統本身實現的邏輯原理可挖掘。對於大多數做業務的人,能否正確的與技術和向數據團隊提需求很重要。我在神策數據工作之前,主要接觸的是產品與數據分析,較少了解 AI 或算法這一層本身與日常的業務統計規則類的分析之間的差別,現在我有了一些認知,也想階段性就這個主題跟大家分享一下其本質的一些差別,幫助大家在一個齊平的水平線上,正確的向技術提需求,其實對於大多數技術人,只要提需求的姿勢和態度正確,配合效果會顯著提高。

以上三個點更強調應用,在這個體系上 ,我還是要強調下數據基礎建設本身的重要性。數據本身是數據應用的底盤,如果底盤不穩,其上面的建築根本無法搭建。這點在上午呂厚昌的演講中也提及——只有從事大數據領域的人,真正做過實際的 case,才會逐漸萌芽這些意識,區別在於其數據意識的深刻度如何,如其在一個從有數據到看數據到分析數據再到應用數據逐步進階的體系中,如何將其變為小步快跑的方式,支持快速將業務的價值在有限的數據下釋放出來,然後再逐步完善數據體系,構建一個螺旋式上升的完善機制很重要,下面我將展開介紹。

一、看數據

就看數據而言,我認為本質上可拆分為兩個問題,第一個是看什麼數據,第二個是怎麼看數據。

1.看什麼數據?

神策數據徐美玲:如何挖好數據這座礦?(可下載PPT)

如上圖,首先是目標 KPI。比方說從業務角度來看,基本上由本身的業務模式與業務發展階段所決定,包括 KPI 考核,為什麼同樣是電商的成交業務,有時老闆考核指標為 DAU,有時是 GMV。

就電商的商業模式來說,其本質上最核心的目標一定是 GMV 或淨利潤率,但大部分都會關注規模,及不同的階段評估何種核心指標。

其與常提到的第一核心目標或北極星指標一致,但在有目標 KPI 的情況下,大部分的目標 KPI 是一個綜合性的數據,如 DAU,其可拆解成新客戶拉新、老客戶活躍、流失用戶的迴流等。

第二步是將目標 KPI 細分為業務場景。一般企業會按照一定的邏輯進行業務場景的細分。如對於老客戶拉新客戶的業務場景,企業會設計一個運營策略,考慮如何讓更多人知道老邀新機制,並使其更具吸引力、信任感等,使其點擊之後,還需要考慮如何促進下一步的註冊、轉化等。

本質上,各個業務場景均具備其運作的業務流,在該流中會存在影響這個業務流運作好壞的一些因子或因素。

第三步是將業務場景進一步細分到指標體系。很多企業只在看大盤數據,或進一步看結構數據,但這些數據均無法告知企業的深層次原因及下一步動作。因此,企業需要按照新的模式,從業務場景拆到指標體系,使其與產品、運營、市場等實際業務建立強相關的業務邏輯,該邏輯與企業的業務架構是強相關的。

2.怎麼看?

看數據事實上存在一定的技巧。與常見的彙報數據不同,看數據需要多維深入全面的看,如下圖:

神策數據徐美玲:如何挖好數據這座礦?(可下載PPT)

其一,看量級,這一點基本上企業均瞭解,在此不贅述;其二看趨勢,其意味著企業業務的健康度走向,若往下,企業便需要提高警惕;其三看異常,這要求看數據的人不斷提高異常敏感度;其四看結構,企業需瞭解其數據的組成、組成佔比、優先級等;其五看細分,如企業看 DAU 時,需瞭解 DAU 中安卓和 iOS 操作系統的佔比分別為多少,其中往往隱藏著用戶的特徵或偏好,如使用華為手機的商務人士佔比較高,而使用 OPPO、VIVO 系列手機的大多數為娛樂發燒友等。因此,用戶屬性特徵數據本身能輔助企業解讀和挖掘一些有價值的信息,這也是數據的價值所在。

下面我舉一個例子——某 APP 的月活,怎麼看?

神策數據徐美玲:如何挖好數據這座礦?(可下載PPT)

假如某 APP 的月活量級是 100 萬,首先企業需考量 100 萬意味著什麼,對於教育或電商業務來說,100 萬月活只能稱為一般,若其中新增為 30 萬,企業還需要進一步看其黏性,尤其是 DAU 佔 MAU 的比例為多少,同樣也需要結合行業來看,如對於互聯網+企業 MAU 達到 100 萬,新增用戶為 30 萬,活躍用戶持續活躍用戶數為 60 萬,迴流用戶為 10 萬,意味著在企業的整個用戶盤的結構處於良好,但也需結合具體業務重點分析。

再者,企業需考慮 iOS 與 Android 的佔比,如市場上的 iOS 與 Android 佔比的平均趨勢為 3:7,如某業務的 iOS 的佔比更高且達到 45%,說明企業用戶與整個中國大盤的市場結構不一致,此時企業需進一步思考是否該行業的用戶本身也具備該特徵,來評斷企業的特徵結構與行業大盤的用戶特徵結構有無差異。

然後,每月訪問僅 1 天的用戶佔比 45%,即表示該 APP 中低頻用戶的佔比非常高,也意味著用戶可帶給該業務線的黏性與價值是不一樣的。因此,企業需關注月活中的天數分佈數據,其很大程度上表明瞭用戶對你產品的黏性價值有多高。

另外,我們再看趨勢,此時不僅看態勢還需看趨勢對比,如對比去年它的上升態勢,排除季節性因素影響,再比如分析是否存在月度規律數據,變化是否受到月度差異的影響,如有差異,再進一步下鑽分析。

綜上所述,若企業的指標體系構建的足夠完善,哪怕只看數據,也能看到有意思的信息,實現一些獨特的發現與洞察,企業需結合自身的行業、業務、發展階段等來綜合定位和解決問題。

此外,從整個數據體系來看,企業存在一定的數據體系差異基礎,一般可從兩個維度分析,如下圖:

神策數據徐美玲:如何挖好數據這座礦?(可下載PPT)

第一,指標的科學性,即企業本身指標體系的設計,是否具備科學性和系統體系。

第二,數據完善性,數據的基礎建設呈現何種狀態。

綜合這兩個維度,企業可判斷自身的薄弱處及自身所處階段,一般來說企業可做好這兩個維度,其數據化建設不會差。

在神策數據,我們經常回訪客戶,一般當客戶不是很牴觸,我們均會建議看一下他們的後臺進行評估與建議:

第一,企業的源數據結構如何,是否具備一個合理、有結構、有秩序的源數據體系,以及源數據本身的管理,有沒有持續更新迭代;

第二,概覽體系建設如何,是否已建成一個相對有邏輯體系的概覽,該概覽是否能幫助企業看大盤數據和看實時數據;

第三,各業務線的數據看板建設如何,如產品、運營、市場各個不同的職能線是否有相應的數據看板,甚至不同業務線的子團隊,有無對應看板。

第四,數據權限的體系建設如何,是否明確,是否科學和安全等。

以上四點如果企業建設的均不錯,則這家公司的數據應用應該不會特別差。神策數據在服務客戶的過程中不止聽對接人的反饋,還會通過數據後臺的建設情況直觀評估其是否達到比較理想的運作機制和問題所在,並給出相應的解決方案。

在服務的過程中,我們遇到有因企業技術支持薄弱或業務分析薄弱的各種情況,但更常見的是兩種都薄弱,對此,神策數據現在的售後服務體系中有增加了重新對接交付的環節,我們會重新幫該客戶梳理需求,輔助他們把數據和應用的整個體系重新搭建起來。就像之前講的一個概念,錯的數據其實比沒有數據更糟糕,因為當你有錯的數據時,你可以告訴並安慰自己說有數據,但問題是該數據對決策與應用毫無幫助,僅會麻痺地告知你有數據,但不起任何作用,甚至比處於沒有數據並急迫著建數據的團隊的情況更糟糕。

其實這也是神策數據交付團隊今年在業務探索上的一個比較核心的思路,即數據採集完成不是終點,如果要扶客戶上馬,最小最小的終點是幫其把源數據和概覽體系建設到對於各個業務部門均適宜,基本上達到開箱即用的狀態,助其輕鬆上馬。

二、分析數據

關於分析數據,我認為其核心關鍵是數據與業務的聯繫,不關心業務的數據分析師,大部分不是一個好分析師,因為數據本身會顯露一些特點,但如果分析師不回到業務場景中分析,會很難解釋其真正的情況及原因。事實上,就數據分析而言,數據和分析能力只是其中的一個小環,而對業務的理解與判斷能力對分析價值的貢獻和影響佔比更多。

神策數據徐美玲:如何挖好數據這座礦?(可下載PPT)

從分析的角度來說,首先分析者明確知道原因,其次提出一些可行建議,更進一步,分析者可將優化措施常態化為一個常規運作機制,並使該機制自動化與流程化。

從建設概覽的角度上來講,做數據分析的人應該幫業務的人建報表,建報表的目的從某種意義上就是將其機制化,並評估機制化的水平,如分析者是隻能幫業務機制化到看一個大的數據結構和趨勢是什麼,還是能夠把一些核心的維度與場景幫其提煉出來,做成一個關聯的主題,幫助業務人員更快更有效地看懂數據。

對於分析師來說,其工作的價值也是做完整的分析與結構的梳理,並將結構機制化,繼而再進行推廣,讓更多的人能夠自主做這件事,而不用每次都依賴分析師出常規的數據分析報告。

對於分析數據,基本上可概括為 3 個較常見的場景:1.場景一:異常情況找原因

我將其分為兩個分析方向:有頭緒和沒頭緒。

(1)有頭緒——驗證式

神策數據徐美玲:如何挖好數據這座礦?(可下載PPT)

有頭緒的找原因一般帶有經驗,數據的下降很容易關聯 2-3 種原因假設,這幾種原因又對應著一定的數據表現特徵,然後再定向的查看和分析這些特徵的數據表現維度,評估其趨勢結構與預設的是否一致,如果一致,則基本驗證了假設。

如果不一致,則需要考慮另一種假設,該方式比較高效,一般情況下,出現異常主要由 1 個核心影響因素導致,可能該因素導致數據下降或上升的影響佔 70%-80%。因此,分析者依靠業務和分析經驗的的驗證式策略極其有效。

舉個關於分析 GMV 掉了的原因的例子,運營發現數據出現異常時,經常會找產品和技術問是否有 bug,接下來就會來回排查,使事情變得非常低效。我踩過幾次坑後,發現大多數業務是強利益導向的,一旦活動在產品中看不到一些顯性的精細化營銷策略,或當這個策略失效後,數據將會較明顯的下降。

因此,我在數據採集體系裡增加了一個採集字段——在一次成交的訂單中是否用券,並專門做了一個報表,分析 GMV 掉了如何定位原因。其第一個維度是用券的 GMV 結構,是同步上升,還是異步的一個上升另一個下降。如果是同步下降的意味著不是活動的影響,但如果 GMV 是整體下降,且其中用券的結構大幅下降,其沒有用券的成交結構反而是小幅上升或是一個穩定狀態,便意味著肯定是活動的影響。通過這個分解策略,那個運營再也沒來冒昧地找產品或技術排查問題。

神策數據徐美玲:如何挖好數據這座礦?(可下載PPT)

這件事情教會我大多數分析師應具備產品敏銳度,包括敏銳度怎麼轉化到數據採集方向上的結構性解決方案,及數據指標看版的結構性探索。以上是在異常分析中依賴經驗的一種非常快速的驗證式方案。

(2)沒頭緒——探索式

若該數據結構沒有什麼頭緒,就需要像技術排查一樣做窮舉,只不過分析者可通過數據做驗證窮舉,而不需要技術去排查代碼,依次驗證場景有無異常。

此時,當發現數據下降時,需先尋找可細分的維度有哪些,這些細分的維度本身有沒有出現差異化的趨勢,並且這個趨勢裡面主要影響的維度跟因素有可能是哪些。這變成了一個探索式分析,這種探索式分析取決於企業數據採集的完備性,因為如果某一個核心的維度並未採集數據,企業便很難驗證對錯,因此,這對數據採集本身的要求很高。

神策數據徐美玲:如何挖好數據這座礦?(可下載PPT)

同樣是 GMV 掉了的場景,假如我是一個對該業務場景不熟悉的分析師,並無可靠的假設,則需要遍歷所有維度,尤其是重點影響維度,當發現維度內表現有差異即很有可能為影響因素,當維度內走勢都相似,則需向前追溯。

神策數據徐美玲:如何挖好數據這座礦?(可下載PPT)

整體來看,這種分析方式是比較低效的,因此分析者需要與業務合作,逐漸熟悉業務,並積累自己的分析經驗,提高自身判斷力,儘量使用驗證式方法。

2.場景二:業務迭代評估效果好不好

業務迭代評估的業務場景相對固定,其基本上為了解業務原先狀態,採取的改動措施,並在這個過程中採用了哪些指標、取了哪些時間段的數據,然後用哪些維度與分析邏輯驗證迭代或變動措施是否正確。下面介紹業務迭代評估效果的三個評估診斷原則:

其一,指標準確全面,這點很容易理解;

其二,可比基準較高,企業對比的數據基準本身具有可比性,否則將無意義,就是大多數 A/B 測試的基本實現原理,其要保證兩組分析的數據本身具備可比較性,並屏蔽它的外部影響因素和其它可能的干預措施對於分析結果的影響,儘量保證兩組數據之間唯一的干預因子為實驗方案。

其三,分析邏輯清晰。舉個例子,互金行業存在新增難,羊毛客戶多的問題,我還在互金行業時,針對這個問題,我們決定更改企業的新增方案,評估在新增方案下面能否實現更好的用戶和資金的留存。

神策數據徐美玲:如何挖好數據這座礦?(可下載PPT)

圖中包含兩期它的原本方案和一個新的測試方案,在測試方案中的主要修改點有四個:利率結構調整;限額調整;用戶到期續持,優惠調整。最後的優惠調整主要是為提高用戶後續的二次投資,促進用戶從首投到新增轉化,避免薅完羊毛之後就直接斷點。

當時,關於持有天數的設計有不同的看法,推廣人員擔心天數加長影響新客轉化,運營會考慮引流用戶的質量等。

神策數據徐美玲:如何挖好數據這座礦?(可下載PPT)

但是,從產品的角度上來講,我認為主要是一個效率思維,在做產品約 2 年的時間中,我最大的感觸是,對於產品來說,量只是它的一個舞臺,而產品的實質好壞,很大程度上取決於產品轉化能力。

比方說,同樣是 100 萬用戶,產品的轉化能力有多高才是產品真正實力的體現,而 100 萬用戶與 1000 萬用戶,只能說明產品舞臺不一樣,實際發揮的價值也不一樣。

神策數據徐美玲:如何挖好數據這座礦?(可下載PPT)

上圖中是推廣人員當時給出的數據結果,對比方案一、方案二、方案三的數據,方案三的日均註冊人數與日均首投金額均有下降,甚至客單價出現了下降。所以,推廣人員的第一反應是要回滾整個新客轉化的運營方案,但我看到該數據時是存疑的,因為直觀上從產品的角度上來講,尤其是從投資用戶的角度上來講,我認為真實用戶的比例結構肯定是上升的,長期的健康度價值來看一定是更好的。

後來,我花了 2 天時間,重新整理了新的推廣方案上線後的數據,如下圖:

神策數據徐美玲:如何挖好數據這座礦?(可下載PPT)

呈現該數據的核心原因是大部分的新客轉化有一個統計窗口期的概念,每個時間段引進來的新用戶,其轉化邏輯有差異,所以不能只看統計窗口期當天的註冊轉化。因此,我重新按照用戶從統計窗口期進來的結構來看有多少激活、註冊、充值、投資以及普通標(普通標代表用戶二次投資轉化的能力)。

從圖中,大家可以看到激活的整個轉化率結構,實際上新方案從投資激活轉化能力上來看是有所提高的,尤其我不只看用戶的首次投資,還分析首日投資的客單價與均價,整體來看方案三的表現更好。

該方案從產品設計的邏輯上阻絕了大多數羊毛黨的短期套利空間,對於長期用戶價值是更有利的。因此,我便使用該數據進行第二次彙報,該數據與上次數據的最大差別是整個數據彙報思路是從現階段分析的,該階段很大程度上取決於激活量本身,其最終真正轉化的有效投資,尤其是用戶的二次投資能力更強,因此後續採用的是第三種方案,後續該方案至少應用了約半年。

通過這個案例,我發現整個公司的數據應用思路與邏輯具備很大的差異和可提升空間。

3.場景三:尋找業務增長突破點

從整個數據驅動角度上來看,基本上企業的思路要從前往後走,首先企業提升增長的目標究竟是什麼,然後圍繞這個目標做診斷分析,再從診斷分析裡提出一些解決方案或思路,最後在解決方案與思路的方向上形成一個閉環的運作機制,如下圖:

神策數據徐美玲:如何挖好數據這座礦?(可下載PPT)

企業需要做整個開發測量的閉環反饋機制,現在大部分做增長也按照這樣的思路,在相對早期未採用 A/B 測試時,在整個機制的情況下,大多數數據驅動做的比較好的公司用的是這套機制,區別在於同時的測試數及測試速度,甚至在業界相對較傑出的人也基本上是按照這套機制做產品迭代和增長。

我認為,尋找增長點的核心在於第一指標,可從兩個維度來分析:

其一,業務模式。一般考量產品或業務真正為用戶提供的價值是什麼,價值如果被量化,量化的指標是什麼,以及業務在頻率與價格上呈現什麼樣的特徵,這些特徵很大程度上決定了數據運作的上限。

比如,關於提升留存,留存有一個明顯的價值天花板,如果企業本身產品的使用頻次,與其能夠為用戶提供的價值受到限制,不管企業如何努力,也很難把真正的長期留存做出來。因此,數據表現由業務模式決定,不同的業務模式存在不同的天花板。

其二,AARRR,即在業務模式既定的情況下,各環節的數據表現與其承接的結構能力,是企業判定第一指標或增長目標的核心點。

第二步為構建增長模型,用第一指標做拆解,可搭建出相應的增長模型,如常見的 GMV 的拆分,當在增長模型中定位了增長點,繼而可關聯幾個核心的業務場景。

第三步為業務場景,企業可從幾個關聯的業務場景出發設定具體動作方案提升業務場景的數據表現,最終提升增長模型中的核心槓桿點,從而促進第一指標的提升。

這是個基本思路模式(如下圖),只是每個人的理解或思考深度會有一定的差異。

神策數據徐美玲:如何挖好數據這座礦?(可下載PPT)

下面我們再談談如何尋找解決方案?因無法公開具體案例的相關數據,我和大家分享下解決方案的思路。

在業務場景的分析閉環中,企業需首先進行業務場景的定義,如現在經常會遇到的場景邏輯是把整個新用戶的轉換路徑拉長,尋找不同節點的里程碑,而里程碑中的激勵策略如何,表現出的業務轉化率如何便需要進行其指標體系的設計,來評估整個環節的效果。

從指標體系來說,可大體分為四類(下將以金融行業舉例說明):

第一,量級指標。就金融來說,需查看每天帶來的投資金額多少,投資人數多少等。

第二,效率指標。大部分指標都是看轉化率,從一個環節到下一個環節,或整個鏈條的轉化率是多少。

第三,結構指標。如每日投資金額裡,投資新手專項包、日常活動包的佔比結構如何,在該結構中投 30 天或 90 天的比例是多少,如測試數據顯示基本上約 90% 的人只投 30 天,那麼從產品設計的邏輯上來講,企業可直接刪除 90 天的選擇,簡化用戶在這個環節的選擇跟停留。因此,其結構和細分維度非常關鍵,往往深層次原因和關鍵點就藏在其中。

在指標體系完善後,企業需進一步做特徵挖掘,這是分析中比較重點的環節,因為找趨勢或找特徵這件事,需看數據全局,從各個細分維度分析可先把有異常或較特殊的數據高亮出來,再繼續做原因分析和得出最終的解決方案(如下圖)。

神策數據徐美玲:如何挖好數據這座礦?(可下載PPT)

就個人經驗來看,我接觸的分析師一般可做到第三層,第四層、第五層只是一筆代過,將最後一層做好需極強的業務思維,需把自己當成這條業務線的 owner 進行分析,如此其提出的解決方案才可具備極強的可行性與價值。我曾經做了一年的用戶研究與數據體系,當時整個產品研發部的數據體系和運營分析,包括某些版本能不能上線的決策都是由我這裡的數據決定,後面為了效果和效率甚至整個業務線的迭代全部由我負責,包括數據、研發、測試、產品等。

因此,在業務閉環的最後,一定是經驗或能力發揮更大的價值,並且一定要做到閉環,不管因這個閉環職能可再往前走一步,還是往交叉線再多走一步。因此,業務人員具備數據分析能力很重要。如果要為其階段性定一個目標,我認為可做兩件事:第一,看懂數據;第二,會提需求。

三、應用數據

關於應用數據,我們先看一下數據應用全景圖,如下:

神策數據徐美玲:如何挖好數據這座礦?(可下載PPT)

首先我們可從通道和粒度兩個維度進行分析:

其一為粒度,指可具體到群體還是精準化個人,一般有兩種大策略,其策略力度基本上決定了一個因子是用規則類的分層,還是精細到個人的推薦算法;其二為通道,通道在產品內,還是產品外,決定了其對應的應用場景是什麼。產品內是大家常見的一些資源,比如廣告資源位/item 欄目列表等;產品外的通道如短信、push、電銷、廣告等。

另外,時效性是數據應用的一個關鍵,包含數據本身和數據分析的時效性等,特別是個性化推薦策略更需要實時在線、個性化的千人千面展示。下面我介紹下具體應用:

1.差異化展示:基於分發效率提升體驗和業績

很多產品,如神策智能運營、神策用戶畫像、神策智能推薦從真正應用場景來講,其邏輯基本上通過業務屬性、用戶屬性或行為特徵數據進行篩選人群分組,再得到分組的結構標籤,精準定義人群,再根據人群分組標籤匹配對應的方案或內容庫,繼而根據規則進行是否展示和展示順序的兩個判斷。

整體最終的目的包括提升體驗、分發效率、業績等,其差別只在於實現這套體系時的內容供給類型與時效性,其很大程度決定了實現需求本身的成本大小。其整體邏輯如下圖:

神策數據徐美玲:如何挖好數據這座礦?(可下載PPT)

對應我前面提到的概念,如何正確的給開發提需求,每一個產品或每一個運營都希望擁有實時性的業務上線規則,甚至脫離研發排期,實現創意與落地的快速打通。

2.個性化展示:產品內個性化推薦實現原理

這也是神策智能運營可實現的一個子場景,即產品內的差異化分發,而神策智能推薦會再多出來一層,其本身會搭一個數據集市,並做特徵工程,在這個工程後面會做索引構建與模型訓練,繼而再做推薦服務。因此其整個產品的運作機制會比以上描述的體系複雜很多,其力度也會做的更細,這種場景下其實現的基本是實時的推薦服務,因為推薦服務本身會對接到客戶業務後端和用戶端。

在這兩個體系裡均會實現埋點收集和業務執行反饋,然後再回收效果數據和業務運作的實際數據。因此,這套系統的搭建會複雜很多,神策智能推薦的報價也比神策智能運營的報價更高,在提需求時大概可以思考實現的成本與實現效果,究竟要落到哪個通道,哪個力度,以及什麼樣的時效性,在這三個維度上掌握好再給技術提需求,技術才知道業務究竟要幹嘛,這是給做業務的人正確提需求的一個參考指南。

神策數據徐美玲:如何挖好數據這座礦?(可下載PPT)

3.差異化觸達營銷:精準名單輸出,對接營銷渠道和手段,推動目標達成

營銷的邏輯與第一個場景的整體實現邏輯有點像,差別在於分群名單對接的是通道或營銷系統,實現的是通過哪些通道,推送哪些內容,以及是否要發優惠券,這是產品外的一種營銷機制,其最終的結果是目標轉化,如下圖:

神策數據徐美玲:如何挖好數據這座礦?(可下載PPT)

相比產品場景,該對接的系統與邏輯存在差異會有時效性的問題,如其是可支持準實時,還是最多可支持 T+1。舉個例子,某些場景下實際上並不需要時效性,如有很多相對低頻的業務,其更新時間可做到 T+30 便已很好。這是因為如果企業的業務本身極其低頻,若提一個高頻的需求則不適用,如某些業務一個月並未累計幾條數據,這幾條數據從算法或規則策略運行上來說,其數據質量很差,根本達不到決定策略更新的層級,所以策略與時效性本身也與業務場景強相關,提需求時需考量在內。

事實上,我一直覺得做好數據不是一件容易的事,如很多公司花較高的成本招聘算法策略工程師,但其真正用來做算法調參的時間可能只佔他工作時間的 20%,剩下的 70%、80% 天天在洗數據、撈數據,並每天查看數據本身是否異常,是否需要做數據歸一化或特色化的工程處理,這實際上與高端的算法毫無關係,只是在做挖礦的活。下面我展開介紹下價值實現和資源投入的矛盾,如下圖:

神策數據徐美玲:如何挖好數據這座礦?(可下載PPT)

從整個價值感知上來說,大多數老闆認為應用數據非常高大上,雖然對大多數業務來說確實如此,但當有部分業務非常低頻,其用戶差異度並不大時,其應用數據的的價值也相對較弱。

再看分析數據,我之所以把它畫成梯型,是因為我認為在這個領域裡面能夠真正做好的分析師太少,導致實際產生的價值並不多。但真正做好數據分析的團隊,產生的分析數據的價值其實應該更大。而看數據之所以放大來看,是因為看數據是一家公司做好數據驅動的第一步,這一步非常難,並且其做好的前提是先實現下面的數據生產整合,因此看數據的整體成本相比分析數據會更高一點。當然對價值實現和資源投入有以上認知的老闆已經很好,有的老闆會認為這是你該做的事,甚至還會因為將其整體搭建起來成本太高而認為沒價值。

從資源投入的角度來看,假如企業的數據基礎資源建設做好是一個非常大的投入,再往上看數據和分析數據的成本會逐漸降低。但是,再往上因為應用數據其實是重新又建了一套完整運作的體系,它其實是需要被產品化與平臺化的,其成本會變的更高。

現在我們與客戶溝通時,從神策數據的服務角度切入,往往會推薦其先做數據生產整合和看數據,分析數據需要企業進行數據分析的培養或通過神策數據的解決方案學習一些分析的模式、策略再進行實際應用,在數據基礎具備及具備數據分析人才與能力後可進行應用數據體系的建設,這是我比較推薦的階段性規劃。

四、有數據——基礎建設

數據本身的類型和它可實現的價值本身就擁有很大的彈性和可發揮空間,需要根據自身業務實際情況做優先級與邏輯考慮。以神策數據為例,神策在數據採集層面考慮的核心問題是 ID-Mapping,之後採集端內的通用採集和主流程數據採集,收集核心關聯的用戶屬性數據,之後將業務數據中更細力度或更多豐富維度的數據採集,將行為數據、業務數據、用戶數據形成一個可運轉的機制,去擴大數據本身的協同效應。

神策數據徐美玲:如何挖好數據這座礦?(可下載PPT)

神策數據徐美玲:如何挖好數據這座礦?(可下載PPT)

在數據基礎進行建設時,可通過人力、能力、權利形成缺一不可的鐵三角,保證數據基礎建設的順利進行。首先,在人力層面,保證數據採集和迭代各環節的資源投入;其次,在能力層面,需熟悉和掌握採集的方法與要求;最後,在權利方面,需要資源投入管控和質量管理的抓手。三方共同協作,形成閉環,推進數據基礎的建設。

提到數據基礎建設,就不得不引入“埋點”的相關內容。簡而言之,埋點其實是為了滿足快捷、高效、豐富的數據應用而做的行為過程及結果的數據上報,從 ID 識別、時間戳、具體內容、位置環境場景、維度特徵五個方面組成事件埋點。數據分析師、研發工程師等相關人員從產生需求、整理需求、Review 需求、事件設計、埋點開發、應用交付等具體步驟,完成數據從生產到應用的全流程。

神策數據徐美玲:如何挖好數據這座礦?(可下載PPT)

從核心崗位的資源投入而言,根據實際經驗,平均單挑業務線需要 1.5 個人力。在業務線中,企業指定頂層業務規範建設及程序迭代,促進各業務線規範和流程培訓、推廣及經驗共享,數據產品/分析師及技術對接人確保業務線/項目組數據接入符合規範,保證數據質量。

神策數據徐美玲:如何挖好數據這座礦?(可下載PPT)

站在業務線數據體系和數據應用負責人的角度,並不僅僅是完成數據分析的工作,需要從埋點實施與迭代、文檔規整維護、系統更新維護、應用交付和支持四大方面整體貫穿並掌控。

神策數據徐美玲:如何挖好數據這座礦?(可下載PPT)

所以,當我們需要規劃公司整個內部數據驅動落地時,可參考上述思路,用一種輕量級的思維去逐漸體現數據的價值,之後不斷獲得更大的資源。

結合我們的創始人&CEO 桑文鋒提出的數據組織建設(DO)的概念,其實不難理解數據驅動本身不只是數據,就算數據團隊清楚的知道要做什麼,若業務團隊和公司的投入以及組織架構本身上無法支持,基本上便很難落地。

因此,DO 的概念在於建設整個數據體系,其對於整個組織結構,或這個業務流本身的組織架構和關聯人的資源投入具備一定的要求,若具備一個好的運作模式對整個公司來講,即使體系中並未劃分一個虛擬數據驅動團隊,其整個業務運作的邏輯流也將非常順暢。神策數據的大部分優質客戶,基本上會具備該特徵或存在類似的機構組織。

事實上,從我接觸的很多企業來看,企業中有專門做數據採集和數據可視化的數據產品或類似職能的人還是其他人兼職來做是企業能否做好的核心原因。兼職做數據驅動的人很容易出現無法確定自身定位和角色認知,或相應組織的結構授權沒有達到理想態的問題,導致其做數據驅動這件事很受限,無法讓整個機制運轉起來。

綜上所述,企業要做好數據建設,需道與術全面兼備才可更高速地挖掘出礦中的鑽石,釋放價值。

以上為神策數據業務諮詢專家徐美玲在神策 2019 數據驅動大會上發表的《如何挖好數據這座礦》主題演講,關注公眾號可下載原版 PPT 資料。

六大城市聯動時間預告

上海 ☞2019 年 11 月 8日(週五)

深圳 ☞2019 年 11 月 8 日(週五)

成都 ☞2019 年 11 月 15 日(週五)

杭州 ☞2019 年 11 月 15 日(週五)

合肥 ☞2019 年 11 月 22 日(週五)

更多互聯網乾貨和案例,可關注【神策數據】公眾號瞭解,回覆關鍵詞還能進交流群、獲得報告、行業案例等福利哦~


分享到:


相關文章: