數據分析入門學習指南,零基礎小白都能輕鬆看懂

數據分析在如今的求職場上越來越重要。然而,讓很多朋友困惑的是,我是沒有編程基礎的小白,能學會數據分析麼?該如何學習數據分析呢?

其實,如果你打算成為一名數據分析師,如何出身並不重要,數據科學是一門應用學科,你需要系統提升數據獲取、數據分析、數據可視化、機器學習的水平。下面我就簡單提供一個數據分析入門的路徑。

第一階段:Excel數據分析

每一位數據分析師都脫離不開Excel。

它是日常工作中最常用的工具,如果不考慮性能和數據量,它可以應付絕大部分分析工作。雖然現在機器學習滿地走,Excel依舊是無可爭議的第一工具。

對於沒有經驗的你,Excel是一款必須熟練的工具。它是日常工作中最常用的工具,如果不考慮性能和數據量,它可以應付絕大部分分析工作。

數據分析入門學習指南,零基礎小白都能輕鬆看懂

第二階段:SQL數據庫語言

作為數據分析人員,我們首先要知道如何去獲取數據,其中最常見的就是從關係型數據庫中取數,因此你可以不會R,不會python,但是你不能不會SQL。

DT時代,數據正在呈指數級增長。Excel對十萬條以內的數據處理起來沒有問題,但是往小處說,但凡產品有一點規模,數據都是百萬起。這時候就需要學習數據庫。

會在招聘條件中,越來越多的產品和運營崗位,將會SQL作為優先的加分項。SQL是數據分析的核心技能之一,從Excel到SQL是數據處理效率的一大進步。

主要了解數據庫查詢語言,where,group by,orderby,having,like,count,sum,min,max,distinct,if,join,left join,limit,and和or的邏輯,時間轉換函數等。

學習SQL最快的方法是能自己下載數據庫管理工具,找些數據練習。客戶端這裡推薦MYSQL。

推薦書籍:《MYSQL必知必會》

第三階段:數據可視化&商業智能

數據可視化能力已經越來越成為各崗位的基礎技能。領英的數據報告顯示,數據可視化技能在歷年年中國最熱門技能中排名第一。

數據分析入門學習指南,零基礎小白都能輕鬆看懂

可視化工作幾乎是你正式進行數據分析的第一步,通過SQL拿到數據之後,我們需要使用可視化方法探索和發現數據中的模式規律。

數據分析界有一句經典名言,字不如表,表不如圖。實際上除掉數據挖掘這類高級分析,不少數據分析就是監控數據和觀察數據。

除此此外,數據分析的大多時候都是要兜售自己的觀點和結論的,而兜售的最好方式就是做出觀點清晰數據詳實的PPT和報表給老闆看。

可視化的工具有很多,這裡我推薦Tableau或者FineBI。這兩款都不要編程功底,實現起來簡單,功能強大。下圖是Excel製作銷售管理分析儀案例:

數據分析入門學習指南,零基礎小白都能輕鬆看懂

Tableau製作股票分析儀:

數據分析入門學習指南,零基礎小白都能輕鬆看懂

FineBI可視化分析:

數據分析入門學習指南,零基礎小白都能輕鬆看懂

推薦書籍:《用圖表說話》-麥肯錫

第四階段:數理統計學

統計學是數據分析最重要的基礎之一,是數據分析的基石和方法論。

統計知識會要求我們以另一個角度看待數據。當你知道AB兩組的差異用平均值看是多傻的事情,你的分析技巧也會顯著提高。

這裡我們需要從基礎的統計理論(描述性統計、區間估計、假設檢驗等)出發,到基本的統計分析(T 檢驗、方差分析等),最後到商業常用的模型(迴歸分析、方差分析等),學習數據分析背後的邏輯,掌握實用統計學的概念和會利用統計的思維去思考問題。

推薦書籍:《從零進階 數據分析的統計基礎》-曹正鳳;《統計學》-賈俊平

第五階段:數據分析與軟件應用

SPSS是統計分析入門軟件,如果你想快速入門而又不想學習編程,我推薦使用SPSS。

數據分析入門學習指南,零基礎小白都能輕鬆看懂

SPSS軟件是世界三大統計分析軟件之一,以其易於操作、易於入門,結果易於閱讀的優點,一直備受數據分析人員的青睞,一般經過短期學習即可用SPSS 做簡單的數據分析,包括繪製圖表、簡單迴歸、相關分析等等。

學習SPSS的重點並不在於軟件本身,而是相關的統計學知識,這也是在前面建議大家鋪墊的,也就是你要學會怎樣去分析“輸入數據後,軟件給你呈現的結果”。

推薦書籍

《如虎添翼 數據處理的SPSS/SAS EG實現》-徐筱剛

《胸有成竹 數據分析的SPSS/SAS EG進階》-常國珍

《SPSS統計分析基礎教程+高級教程》-張文彤

第六階段:數據挖掘與軟件應用

數據挖掘,英文是Data Mining 也叫作數據勘探,類似於採礦,但是數據是貧礦。我們需要結合行業課題,利用數據挖掘工具,建置數據挖掘模型,發掘規律和商業價值。另外數據挖掘是交叉學科,涉及統計學、計算機、機器學習、運籌學等多門學科,是一個運用廣泛和富有前景的學科領域。

學習算法模型包括線性迴歸、邏輯迴歸、主成分分析、因子分析、聚類、關聯規則、決策樹、隨機森林、支持向量機、貝葉斯、神經網絡等。

對於工具,這一階段,建議選擇一門編程語言來學習。

Python或者R語言,這一點是必備項也是加分項,在數據挖掘方向是必備項,語言相比較工具更加靈活也更加實用。

對於R和Python,我們應該使用哪種語言,已經爭論很多年了,至今沒有定論...... 事實大概是Python的主要功能是編程,除了單純的數據分析,在很多領域還有廣泛利用,所以就業市場上對Python的需求是遠大於R。

R主要側重統計功能,在統計方面顯示出了很多的優勢,用R做單純的數據分析還是妥妥的穩穩的。但是往數據科學方向走的話,R就有點頂不住了,輪到Python揚眉吐氣了......

是否具備編程能力,是初級數據分析和高級數據分析的風水嶺。數據挖掘、BI、爬蟲、可視化報表都需要用到編程。以下以python介紹語言學習的路徑:

數據分析入門學習指南,零基礎小白都能輕鬆看懂

Python則是萬能的膠水語言,適用性強,可以將分析的過程腳本化。Pandas、Numpy、SKLearn等包也是非常豐富。Python學習導圖:

推薦書籍:

《笨方法學Python》《像計算機科學家一樣思考》

《Python數據科學手冊》《利用Python進行數據分析》《數據科學入門》

《機器學習實戰:基於Scikit-Learn和TensorFlow》

《數據挖掘實戰》

《Python深度學習》

第七階段:數據分析行業應用和數據分析思維

對於數據分析師來說,業務的瞭解比數據方法論更重要。當然很遺憾,業務學習沒有捷徑。

推薦書籍:《增長黑客》;《精益數據分析》

以上就是商業數據分析師的完整進階路線,如果你沿著此路線學習,相信你在數據分析道路上有所收穫。

最後送個福利

關於上面提到的分析工具FineBI的免費版,大家感興趣的可以私信回覆我“數據分析”獲得!

"


分享到:


相關文章: