從小白到大神,數據科學家的進階之路(下)

從小白到大神,數據科學家的進階之路(下)

從小白到大神,數據科學家的進階之路(上)

作為一名數據科學家,你的日常工作包括哪些?


接下來,要解決分析數據的事情。當我們獲得了分析必備的數據之後,經過數據預處理、模型構建、入庫進入到統一的數據倉庫之後,如何面向我們的業務完成分析工作?

分析現狀,確定關鍵指標。企業內部的不同部門通常都有各自關心的指標,市場部門更關心渠道轉化率, 銷售更關心回款率,人事更關心入職成功率、人員流失率等等。我們的第一步就是著力於提供關鍵指標,清晰地反應企業內部或者產品的當前現狀, 並及時呈現給決策者。

追蹤鏈路。知道當前的指標狀況,仍並不足以為改進和提高指標提供有意義的參考,我們還需要知道為什麼會形成目前的狀況

分析人員需要和決策者一起回顧整個流程,構建數據的生命週期,知道為什麼會形成目前的狀況。

比如,人事入職成功率比較低, 那我們就需要回顧招聘的整個流程,分別對簡歷篩選、電話、面試、入職等各個環節進行數據漏斗統計。如果簡歷篩選的通過率比較高,但是電話面試成功率較低,那麼很有可能簡歷的篩選過於寬鬆,我們就能向人事提供這樣的Insights。

再比如對於用戶產品留存率,如果觀察30天留存率比較低,用戶流失嚴重,那麼可以觀察用戶7天,周度,月度活躍和留存,如果用戶7天流失已經比較大,有必要在相對應的時間節點進行“喚醒”,提高產品的活躍用戶。

預測未來。數據分析可以回首過去,還應預測未來。根據歷史記錄,我們還需要預測出可能的趨勢,這樣我們才能估計可能發生的結果早做準備。這就需要分析人員利用統計學方法、機器學習等複雜算法,學習歷史數據,得出預估數據。

比如預估每年天貓雙11的成交量,預測客戶欺詐行為,預測可能流失客戶提前回訪。預測未來,幫助決策者提前瞭解風險,抓住機會,得到最好的結果。

最後一步,如何能更高效地查看數據?

數據分析的交付物通常是彙總於數據表單裡的統計結果。在MioTech AMI中,我們的目標是直觀地從多個維度展現數據特點,既要能夠呈現宏觀數據統計(overview),又要能夠在某個維度上向上或者向下鑽取(drill down)。

MioTech AMI提供了多種展示數據的方式,比如下面柱狀圖直觀地描述了BAT三家自2009-2019年十年期間的投資分佈,可以一定程度上反應趨勢,同時還能向下更細節地查看具體公司的所屬行業,在更精準的維度上查看問題。

從小白到大神,數據科學家的進階之路(下)

MioTech AMI中的數據可視化展現——BAT自2009-2019年的投資分佈

如何從小白進階成為大神,成為一名數據科學家?

大企業的確在招聘時區分數據分析師與數據科學家,但是在創業公司,我們往往身兼數職,其實這兩者的邊界也比較模糊。這兩者反映了數據分析從傳統企業內部服務轉向大數據時代精耕細作的轉變。

先看下成為一名數據科學家需要掌握的技能。

從小白到大神,數據科學家的進階之路(下)

對於傳統的數據分析師來說,通常我們會比較關注他的行業知識、商業知識以及分析能力。他需要有比較豐富的行業經驗,能夠快速根據部門的需求快速定位所需要的指標,熟練的使用工具產出相應的圖表或者Insight。

在大數據時代,在宏觀上數據的量級發生了指數級的提升,數據類型也變得紛繁複雜。這就要求數據工作者能夠使用大數據工具,完整地實現從多數據源抓取數據,消費海量數據,並且保證穩定的輸出。

對於每條數據,我們都希望儘可能地榨取其中的信息。因此我們不滿足於只統計商品評論的數量,而需要做情感分析、關鍵詞提取等,從而瞭解用戶反饋。我們不滿足於基於當前的統計,所以不僅僅要知道用戶以前最喜歡什麼,更要推測用戶以後可能會喜歡什麼。而且我們不滿足於只分析結構化數據,新聞、圖片、圖像、音頻、地理衛星數據都將成為分析的對象。

這也對數據工作者提出了更多的技能要求,學習技術技能是一個相對容易的過程,尤其是在大數據時代各種自動化工具的出現,更方便了我們數據處理。但是對於數據的敏感度、行業的瞭解、產品的理解,是需要時間去消化和沉澱的,

這是相對於技能更加彌足珍貴的能力。


分享到:


相關文章: