未來三年最火的數據分析師,你還沒聽過嗎?

成為一名數據分析師絕對不是你想象中那麼容易。

在正式開始之前,你可以先看看自己處於哪種狀態:

1. 沒有數據基礎,但是對於數據行業非常感興趣
2. 有數據基礎,未來希望踏入數據行業

事實上,無論有沒有數據基礎,如果你想未來從事數據分析師這一行業的話,都需要了解以下內容:


一. 什麼是數據分析師?


數據分析師(Data Analyst)是數據師(Datician)的一種,指的是在不同行業中,專門從事行業數據蒐集、整理、分析,並依據數據做出行業研究、評估和預測的專業人員。

數據分析最主要的結論是利用數據去解決一些商業性的問題,那數據分析師的職責,一定是收集數據,分析數據,對於商業的問題做出一些指導性的意見。

那作為一名專業的數據分析師,需要怎樣的思路?

一名數據分析師,必須具有數據思維的思路,必須瞭解你所負責的項目的商業背景,當你非常瞭解這些背景之後,才能給出具有指導意義的建議。

舉個例子來看,不同品類的復購週期,消費頻次等,是需要深入瞭解之後才能知道背景信息,然後去進行更多的分析的。這是數據分析師都必須具備的商業知識和思維。

如果大家想要成為數據分析師的話,刺蝟建議你應該先了解一下數據分析師每天都在做什麼。

二. 數據分析師每天都在做什麼?


1. 60%的時間——規整data


大家可能會以為數據分析師大多數的時間都在研究數據公式或者代碼,其實不是,他們只是在處理一些不規則的data。

這些不規則的data來源於不同的地方,像是互聯網的data會比較規範一些,他們有自己的數據庫,但是中間會有一些奇怪的data,雖然很少,但是也是需要去處理的。

如果不是互聯網的行業,很多甲方的資料都是不規整的,每個部門都有自己的規範,有些是存在數據庫,有些是Excel。

那其實當數據分析師做數據分析的時候,甲方是直接把這些data丟過來的,他們不會關心自己的data有沒有規範。

那麼整理數據的整個步驟就是數據分析師的工作,所以數據分析師花費的時間是在規整這些資料,他們把這些data處理成可用語言工具去處理的資料或格式。

規整這些資料就佔了他們60%的時間,其他的時間才會去進行一些分析或建模,找尋數據之間的一些規律。

這樣看來,大家之前認為數據分析師會建立算法,探索數據,並進行預測分析,其實這些都不是他們花大部分時間做的事情。


2. 數據分析師工作時間的分配


那數據分析師們到底把他們的時間花在了什麼地方?刺蝟帶大家來看看:

  • Building training sets:3%
  • Cleaning and organizing data:60%
  • Collecting data sets:19%
  • Mining data for pattern:9%
  • Refining algorithms:4%
  • Other:5%


未來三年最火的數據分析師,你還沒聽過嗎?


數據分析師一般是這樣處理的:

  • 問題識別:當這個項目進來後,他們需要去了解背景,知道甲方需要解決什麼樣的問題,這是一個項目的核心;
  • 數據檢查:數據導入後需要去了解這些數據;
  • 數據清理和操作:利用這些數據去計算以及創造出新的變量,以供以後做後續的分析,去處理數據的異常值;
  • 建模及數據可視化。


未來三年最火的數據分析師,你還沒聽過嗎?


當數據規整後,數據分析師們會進行一些描述性的統計,但你可能對描述型統計還不太瞭解。

給大家舉個例子,我們要統計一/二/三四線城市一個年齡階段,男女生的消費情況,得出一些結論。(例如是男生消費更多還是女生消費更多?是哪些城市的消費支出會更高?)

那這個結論怎麼得出來的呢,作為數據分析師,是不可能直覺性的知道一線城市的女生/男生消費支出更高。

但他們需要朝著這個目標去分析,一定是先把這個數據拉出來,男生、女生、一二三四線的數據比列全部拉出來進行分析才會發現規律,然後再把各個維度都拿去做檢查以及計算。

其實描述性的統計並不難,加減乘除就能完成,但是在其中最重要的是,是需要去了解和找尋數據中間的規律和新的發現,去解決問題。

當數據清理完畢後,就會進行建模/機器學習,做出可視化的效果。

這裡,刺蝟簡單地給大家看幾個常見的模型:

未來三年最火的數據分析師,你還沒聽過嗎?

未來三年最火的數據分析師,你還沒聽過嗎?

當數據分析師得到的整體數據都是比較散亂的時候,就會利用算法進行聚類,分析哪一些可以被計算為一個群體。

同時,他們也可以利用數據分析去判斷和辨別假冒偽劣產品/金融詐騙,以及去分析網絡的評論。舉個例子,當一個歌手在微博上發新歌的時候,就會進行網絡評論的數據分析,分析新歌的走向等等。

未來三年最火的數據分析師,你還沒聽過嗎?

未來三年最火的數據分析師,你還沒聽過嗎?

3. 數據分析師的工作內容


  • Leader會告訴數據分析師去看一下data是怎麼樣的,你需要去清理data;
  • 會進行一些描述性的統計,類似簡單的數學去找其中的規律;
  • 建模,解決一些描述性統計沒有辦法解決的部分。


三. 數據分析師應該具備的技能


那如果你是數據分析小白,應該如何提升數據能力呢?

1. 必須學習好基礎能力

  • 統計知識
  • 建模
  • 語言:R、Excel、SQL、Python

2. 實戰經歷

未來三年最火的數據分析師,你還沒聽過嗎?

未來三年最火的數據分析師,你還沒聽過嗎?

角色:收集、處理、進行統計數據分析

思維:弄清楚直觀數據的結論

語言:R,Python,HTML,Java,C/C+,SQL

技能:

  • 電子表格工具(Excel)
  • 數據庫系統(SQL and NO SQL based)
  • 溝通&可視化
  • 數學&統計學&機器學習

在技能方面,最基本的一定是Excel,很多數據分析師會想說:我會了Python就不用學習Excel了。

其實不是這樣的,Excel存在了這麼長的時間還是現在使用頻率非常高的工具,這是有原因的。在處理小數據上,Excel絕對佔優勢,畢竟很多工作最後的呈現方式是PPT or Excel。

所以對於數據分析師來說,Excel絕對是必備的工具,你必須非常瞭解Excel裡的一些功能,比如公式、函數等。

在語言方面;如果所在的公司是有自己的數據庫,那你必須得會SQL,SQL是一個從數據庫裡面拉數的一個語言,所以SQL一定是具備的,當我們的的數據拉出來後,我們就會用到像Python這樣的語言工具,它的作用是可以把數據進行可視化,呈現在大家面前。

成為一名高級數據分析師沒有那麼容易,但也沒有想象中的難。只要你用心學習,並且抽出時間、找對方法,從小白進階為高級數據分析師,你也可以!

刺蝟大學,成就青年人的職業夢想。更多精彩內容,請關注頭條號“刺蝟大學”,定期分享職場乾貨、技能學習、能力提升相關內容。


分享到:


相關文章: