從小白到大神,數據科學家的進階之路(上)

如何與數據跳舞?

從小白到大神,數據科學家的進階之路(上)

前方高能預警,以下很可能是各種互聯網公司的日常:

  • 市場小白:APP在多個渠道投放廣告,哪個渠道的客戶轉化率更高?
  • 遊戲小白:哪個或哪類裝備最受遊戲中氪金大佬的青睞?
  • 電商小白:618、雙十一,哪個促銷活動的客戶留存率更好?
  • 產品經理:功能改版,舊版vs新版,哪個用戶表現更好?
  • 公司CEO:面臨下一輪融資,投資人想了解企業APP的日活、月活、付費轉化率等關鍵指標如何呈現?

上面這些問題是產品經理或老闆拍腦袋決定?還是提出一個擁有數據支撐的解決方案?答案顯而易見。這就是數據與商業智能發揮作用的地方。

商業智能想要解決的終極目標,就是為構建一個支持決策的優化模型需要做出關於決策變量的決策。

數據大神、妙盈數據科學專家Gu Jiang

來為我們講講數據分析與商業智能那些事。如何與數據跳舞?怎麼實現商業智能?一名數據科學家的日常工作包括哪些?如何實現從數據分析師到數據科學家的進階?

從小白到大神,數據科學家的進階之路(上)

什麼是商業智能?如何實現商業智能?

Gu Jiang: 簡單來說,商業智能的作用就是用"數據"解答問題,讓企業的決策有數據依據,減少盲目性,提供智能參考。

通常互聯網公司內部的商業智能包括以下幾個部分:

數據分析挖掘:配合數據挖掘工具,關聯業務數據,分析業務。通過可視化工具,提供分析結果和交互式查詢;

數據預警:數據指標實時呈現,關鍵指標預警。產品層面例如日活、留存率、金融風控等等。企業內部包括人員流動率、財務指標等;

數據服務:數據輸出,提供各部門的自助式查詢。元數據和權限管理,形成數據中臺,支撐其他產品的數據需求。


作為一名數據科學家,你的日常工作包括哪些?

首先要解決數據從哪裡來的問題。

據不完全統計, 一個數據領域的工作者70%的時間花在取得數據上。根據不同的業務需求和產品形態,我們需要從不同的數據源獲取原始數據。

內部業務數據。例如頭部電商統計商品品類的訂單量分佈,外賣行業統計外送訂單量每日時間分佈,在線打車軟件統計平均每單路程等等。這些數據都直接保存在產品數據庫中,分析的時候,需要同步工具定時或者實時地同步到可供分析的數據平臺或者工具上。

用戶產生數據。用戶在產品中的行為軌跡往往對產品決策有直觀的反饋。比如某新聞客戶端統計推送熱點文章閱讀量,或者用戶在網頁上點擊熱力圖。我們需要記錄用戶在產品中的特定行為,並且保存下來,用戶在使用的過程中彷彿留下了一串串“腳印”。

我們一般可以通過前端打點,後端日誌等方式獲取用戶行為,因此需要精確地定位關鍵的步驟,也就是插好”相機“,準確地記錄用戶行為。例如,用戶在付費過程中,從提交訂單到付款成功的每一步,在哪一步最容易跳出,從而流失付費機會。根據用戶的行為習慣,形成用戶畫像,做到”千人千面”。

接入其他企業的數據。一些數據可能由其他數據提供商提供,如廣告點擊數據等。另外當我們內部的數據分析具備了輸出能力,就可以接入其他不具備自主分析能力的企業,替他們完成分析工作。此時,也需要通過定時或實時地同步彙總起來,完成分析工作。

(在下期,數據大神將繼續為我們講述與數據跳舞那些事。)


分享到:


相關文章: