我們來分析一下原因~
其實學習數據分析的過程是一個很辛苦的過程。 它包括應用數學,統計學,經濟學方面的知識 ,這些聽起來就不是很容易。通常數據分析這個行業在現代的社會發展過程中就業情況是非常良好,而且工資薪酬也是相當高的。我們就拿我們平時用的各種搜索來說,這些背後的大數據是怎麼來的,就是一群群在那學習數據分析的人結合用戶的訪問情況、瀏覽情況、評論情況等等這些所做出的一系列應用邏輯分析能力得到的結果。而且現在是大數據時代,你擁有數據,你就擁有資本,你就擁有實力,你也就擁有了好未來。
(一)數據分析師的職場之路
圖1:數據分析職位分類
數據分析的職位分類按照數據處理的不同階段分為數據採集、數據分析、與數據挖掘三種。其中數據採集的概念是對企業來說的,,包括原始數據源的採集和地理信息數據的採集。
下面主要說下數據分析和數據挖掘的職位:
大家要記住一句話:數據分析的職位分為業務方向與技術方向兩個方向,這兩個方向決定了兩條不同的職業規劃和晉升途徑,包括下面章節要說的數據分析的學習規劃也跟這兩個方向緊密相關。
1、業務方向
大家在招聘網站中搜索數據分析的職位,大概分為兩類:輔助業務的數據分析職位和數據分析師職位。
1)輔助業務的數據分析:一般在零售業裡職位設置較多,該職位一定要對業務爛熟於心,對業務有長時間的積澱和理解,用數據發現業務流程中的問題,並提出合理化的解決方案,分析數據是為整個商業邏輯去做支撐。細分職位包括:市場調查、行業分析和經營分析三類。
2)數據分析師:業務方向的數據分析師,該職位招聘時一定前面有一個限定詞,什麼數據分析師,歸結起來分為三類:產品數據分析師,運營數據分析師和銷售數據分析師。
2、技術方向
技術方向主要指數據挖掘方向,分為三類:數據挖掘工程師(機器學習)、數據倉庫工程師(構架師)和數據開發工程師。在互聯網和金融行業崗位設置較多
普遍來說:技術方向的基礎崗的工資薪酬要比業務崗的薪酬高一個等級,但是做到管理崗的話,在中國,業務崗的薪酬比技術崗的薪酬要高。
(二)數據分析從業者需具備的核心能力
數據分析從業者要具備四種核心能力:
1、基礎科學的能力;
2、使用分析工具的能力;
3、掌握編程語言的能力;
4、邏輯思維的能力
圖2:數據分析核心能力體系
1、基礎科學的能力
可以說,在數據決策的時代,數據分析幾乎滲透到企業的每個業務環節中,行業數據分析報告更是淋漓滿目,發佈報告的有的是世界500強企業,有的是知名的數據洞察諮詢公司大多數的數據分析報告:邏輯不見了,故事線沒有了,統計學支撐沒有了,金在其外,敗絮其中。統計學,數學,邏輯學是數據分析的基礎,是數據分析師的內功,內功不紮實,學再多都是徒勞。
掌握統計學,我們才能知道每一種數據分析的模型,什麼樣的輸入,什麼樣的輸出,有什麼樣的作用,開始我們並不一定要把每個算法都弄懂。如果我們要做數據挖掘師,數據能力是我們吃飯的飯碗。如果你沒有數學能力,用現成的模型也好,模塊也好,也能做,但一定會影響你的技術提升,當然更影響你的職位晉升。
2、使用分析工具的能力
數據分析工具:SQL、SPSS、SAS、R、EXCEL等等吧,都必須掌握並且會應用,畢竟企業需要的不是學者而是應用型人才。
3、掌握編程語言的能力
會Python、會R,是數據分析的基礎。
4、邏輯思維的能力
邏輯思維對於數據分析來說特別重要,不單單是數理邏輯這塊,還要有邏輯學的知識。反映商業數據裡,大家可以理解為去搭建商業框架或者說是故事線,有邏輯的推進,結果才會另人信服。下面為一般分析流程,僅供參考。
1)提出假設
2)驗證假設(統計方法)
3)取數(SQL / Hive / Spark)
4)清洗和整理數據(R / Python Pandas / PySpark)
5)可視化(Excel / R ggplot2 / Python matplotlib)
6)展示給非技術人員(PowerPoint / Tableau / iPython Notebook/ R Markdown)
(三)2018數據分析學習規劃
任何一門技術或學科都有其內部規律,需要有計劃,有先後,循序漸進來學。
下圖:橙色區域代表數據採集板塊,藍色區域代表數據分析板塊,綠色區域代表數據挖掘板塊。
圖3:數據分析學習規劃
1、統計學(業務方向)與SQL(技術方向):首要必會技
任何數據分析師從事業務方向的工作都必須會統計學,統計學的學習最好輔助SPSS或其他SAS來學,做到數據分析基本功紮實,兼顧實戰性。
任何數據分析師從事技術方向的工作都必會SQL,不單是數據分析師,每一個運營、產品經理、尤其是互聯網行業,一定要會SQL,基本知名互聯網公司的產品經理都能寫SQL。學習中,要掌握SQL的基礎語法、中級語法和常用函數,結合關係數據庫系統(Oracle Database、SQL Server、DB2等)來學習SQL語句,找好方法,真的不難。
2、Python與R:不分伯仲,都要掌握
Python主要掌握基礎語法,pandas操作、numpy操作、sklearn建模,學會用python編寫網絡爬蟲爬取數據,等等。R語言就是為了統計而存在的語言,我們要掌握R語言的基礎語法、數據管理、數據挖掘建模與評估等。
3、數據可視化
有了Python、和R的基礎,我們可以就可以學習數據可視化了。運營和產品都需要學習可視化,可視化說白了,就是畫圖,但做為數據分析師來說,我們不能用EXCEL 來實現可視化,因為它的侷限性太大了。這裡也不建議花太多時間學習給非專業人士展示的Tableau,有1個小時學會Tableau足夠。
Python中可視化的工具有matplotlib,seaborn,ploltly;
R中可視化工具有plot基礎庫、ggplot2
4、數據挖掘
這裡知道要掌握基本概念,知道數據挖掘時做什麼的,知道它與數據分析相比有什麼不同
5、監督學習、非監督學習、模型評估
Model建模,知道模型建好後應該怎樣去評估,掌握怎樣用一些定量的指標,數據,數值來衡量模型建好後到底有多準確,或者說到底有多錯誤。模型評估的指標或計算方式選擇正確與否,能夠直接影響到整個項目獲模型是否有效。
結尾
最後多說一句,小編是一名python開發工程師,這裡有我自己整理了一套最新的python系統學習教程,包括從基礎的python腳本到web開發、爬蟲、數據分析、數據可視化、機器學習等。想要這些資料的可以關注小編,並在後臺私信小編:“01”即可領取。
閱讀更多 小劉程序員 的文章