一個月從小白到數據分析師,都是靠著這份書單!

如何快速成為數據分析師?是很多想轉行數據分析的人經常問的問題,數據分析設計多個領域的知識,內容繁雜,很多人沒有基礎的人自學起來,感覺摸不著頭腦,今天就圍繞數據分析師的成長路徑為大家整理了一個相對完整的從入門到進階的學習書單,內容較多,建議大家採取階段性學習。

數據分析基礎-統計學

統計學是數據分析方法論中的核心基礎,在數據分析的方法模型中,很大程度上都來源於統計學的方法,所以掌握統計原理是必須的。

1、《數學之美》吳軍 著

此書名為數學之美,實為信息技術(自然語言處理)中的數學原理(統計語言模型)之美。

更深刻地理解大學所學的線性代數、概率論與數理統計和應該學而沒學的隨機過程、圖論、機器學習的應用意義。

書中將高深的數學原理講得更加通俗易懂,讓非專業讀者也能領略數學的魅力。

讀者說,讀了“數學之美”,才發現大學時學的數學知識,原來都如此親切,並且栩栩如生,才發現自然語言和信息處理這麼有趣。

一個月從小白到數據分析師,都是靠著這份書單!

2、《深入淺出統計學》Dawn Griffiths 著 李芳 譯

《深入淺出統計學》具有“深入淺出”系列的一貫特色,提供符合直覺的理解方式,讓統計理論的學習既有趣又自然。

從應對考試到解決實際問題,無論你是學生還是數據分析師,都能從中受益。


一個月從小白到數據分析師,都是靠著這份書單!

3、《統計學習方法》李航 著

這本書系統地介紹了統計學習的主要方法,特別是監督學習方法,包括感知機、k近鄰法、樸素貝葉斯法、決策樹、邏輯斯諦迴歸與最大熵模型、支持向量機、提升方法、EM算法、隱馬爾可夫模型和條件隨機場等。

這些是之後可以直接應用到你的數據分析項目中去的一些方法。從統計向機器學習深入和過渡,對目前目前的統計學習方法有全面的介紹。

一個月從小白到數據分析師,都是靠著這份書單!


數據分析入門

瞭解一部分統計學的基礎知識之後,接下來就可以正式上手學習較為基礎的數據分析知識了。

這一部分主要是瞭解數據分析和數據挖掘的方法、工具等理論上的東西,是為後續的數據分析實戰打好基礎。

1、《深入淺出數據分析》Michael Milton 著 李芳 譯

這本書算是數據分析入門的經典書籍了,基本上被推爛了。這本書最大的優點就是非常的簡明易懂,還給你填了很多統計方面的坑,讓沒有統計知識的你不至於一臉懵逼。

數據分析基本步驟、實驗方法、最優化方法、假設檢驗方法、誤差處理、相關數據庫、數據整理技巧等相關知識都有介紹。

一個月從小白到數據分析師,都是靠著這份書單!

2、《數據挖掘導論》Pang-Ning Tan,Michael Steinbach 範明 範宏建 譯

這絕對是你進入數據分析和數據挖掘領域的核心書籍,也是數據挖掘的入門經典。書中對數據、分類、關聯分析、聚類和異常檢測作出了細緻入微的闡述。還有一些常用的數據挖掘算法和偽代碼,可以作為延伸學習。

當然數據挖掘的東西更多的是要去理解,而不是記憶,理解理論背後的原理會讓你在後續的實戰中能夠更加得心應手。

一個月從小白到數據分析師,都是靠著這份書單!

03《數據挖掘概念與技術》Jiawei Han,Micheline Kamber 著 範明 孟小峰 譯

這本書的定位和《數據挖掘導論》的定位比較相似,都是在數據挖掘、分析技術的問題上的探討。

這本書雖然名為data mining,但其實思想都是機器學習的東西,這也可以是一個瞭解機器學習的不錯的切入點。

一個月從小白到數據分析師,都是靠著這份書單!

實戰-數據技術

經過前面對於數據分析和數據挖掘知識的積累,相信你已經形成了最基本的數據分析知識體系,也對數據分析的方法和流程有了較為全面的瞭解。那麼接下來就需要上手實踐了,做數據分析的工具有很多,比如大家常見的excel,還有python、R等編程語言,這裡首推python。

1、《利用python進行數據分析》Wes McKinney 著 唐學韜 譯

此書絕對是計算科學和數據分析經典中的經典,強大的地方在於,書中不僅建立了一個完善的python分析方法論體系,還有大量具體的實踐建議,以及大量綜合應用方法。

將學會如何利用各種Python庫(包括NumPy、pandas、matplotlib以及IPython等)高效地解決各式各樣的數據分析問題,所以這將是你真正意義上數據分析實戰的開始。


一個月從小白到數據分析師,都是靠著這份書單!

2、《python核心編程(第二版)》Wesley J. Chun 著 CPUG 譯

要用python進行數據分析,學習python這門語言是必須的了,這本書就是python編程的經典。

尤其是每一小節後面的核心筆記,講解了一些有用的編程技巧和知識,知識點非常細緻,你可以學到很多以前不知道的編程知識。

當然這本書用來掃盲可能有一定的難度,可能更適合進階,讓你打紮實python 的基礎。


一個月從小白到數據分析師,都是靠著這份書單!

3、《python數據分析與挖掘實戰》張良均 王路 等 著

從數據挖掘的應用出發,以電力、航空、醫療、互聯網、生產製造以及公共服務等行業真實案例為主線,深入淺出介紹Python數據挖掘建模過程,實踐性極強。

通過這本書,你完全可以閱讀過程中,充分利用隨書配套的案例建模數據,藉助相關的數據挖掘建模工具,通過自己進行上機實戰掌握Python的數據分析。


一個月從小白到數據分析師,都是靠著這份書單!

補充-數據庫

在涉及到大量的數據之後,數據的存儲可能會成為你要考慮的問題,所以關於SQL方面的知識作為一個數據分析師應該有所儲備。好在這部分難度並不是很大,並且不要要特別深入的研究。

1、《深入淺出SQL》貝里 著

非常淺顯易懂, 圖表間的註釋是本書精華所在。細緻到幾近囉嗦,小白都可以輕鬆看懂,可能是因為數據庫技術本身難度並不是特別大。

作為入門的書相當的不錯,有輔助理解的講解和例子,同時有有練習題加深記憶。但書的內容略多,如果你是需要快速學習的話,在你已經理解之後就不必過度扣細節,畢竟你可能需要更多在實戰中應用。

一個月從小白到數據分析師,都是靠著這份書單!


2、《高性能mysql》Baron Schwartz 等 著

分享MySQL實用經驗的圖書,它不但可以幫助MySQL初學者提高使用技巧,更為有經驗的MySQL DBA指出了開發高性能MySQL應用的途徑。

書中的知識點非常全面,但可能學習成本略高,並非全要掌握,作為遇到困難時的詞典查閱也不錯。

一個月從小白到數據分析師,都是靠著這份書單!

高手進階-機器學習

學完上面的書,你基本上已經能夠進行簡單的數據分析,並且能夠較為完善地操作一些簡單的數據了。

那麼機器學習這部分一定是提升你整個思維方式和數據分析水平的殺器。你將會有目的地去選擇合適的方法應用在不同的場景,分析水平得以提升。

1、《機器學習》周志華 著

簡明而深刻,厚積薄發的評註非常開拓思維,多是遊刃有餘之後才可得出的見解。

這確實是機器學習裡優秀的中文書籍了,大牛周志華將機器學習中的模型方法,應用場景、理論推導、優化過程、算法等進行了全面而細緻的講解,堆積初級的宏觀學習機器學習分析方法可以說是既簡潔而又實用。


一個月從小白到數據分析師,都是靠著這份書單!

2、《機器學習實戰》Peter Harrington 著

這本書會讓你意識到那些被吹捧得出神入化的分類算法,竟然實現起來如此簡單;那些看似高深的數學理論,其實一句話就能道明其本質;一切複雜的事物,出發點都是非常簡單的想法。


一個月從小白到數據分析師,都是靠著這份書單!

3、《集體智慧編程》TOBY SEGARAN 著

以機器學習與計算統計為主題背景,述如何挖掘和分析Web上的數據和資源,如何分析用戶體驗、市場營銷、個人品味等諸多信息,並得出有用的結論。

想把 paper 上的公式轉變為可以運行的代碼,這是件考驗功力的事情這本書就是是修煉此種功力的武林秘笈之一。

最顯著的特點是,實戰性極強!針對每個算法,他從頭到尾演示了一個完整的實現過程:從獲取數據,組織存儲,到算法實現,加載運算,再到最後的結果的分析利用。


一個月從小白到數據分析師,都是靠著這份書單!

應用-商業數據分析

經過上面的技能學習,我相信你已經具備了一名數據分析師的核心技能,接下來,你就需要在專業的領域進行深耕,不斷積累技術經驗和強化業務能力。

此時許多小夥伴可能已經開始從事數據分析師的工作,而數據分析這項技能所能進入的行業範圍廣,涉及的領域也非常多,你可以根據自己的業務方向來進行書籍的選擇,下面推薦的則是比較通用的。

1、《精益數據分析》Alistair Croll 等 著 韓知白 王鶴達 譯

這本書裡講解了創業公司該如何確定指標體系,如何用數據指導產品和運營。本書還針對電商、媒體、SaaS、雙邊市場、UGC等,列舉了要關注的指標,並有豐富的案例。

整個書的內容比較散,但依舊是講互聯網產品數據分析方面非常好的書了,對於想就職互聯網數據分析的人來說非常實用。

一個月從小白到數據分析師,都是靠著這份書單!

2、《網站數據挖掘與分析》宋天龍 著

本書是目前網站數據挖掘與分析領域最具系統性、深度和商業實踐指導價值的著作,由來自在線數據分析領域巨擘Webtrekk的官方資深數據分析專家撰寫。

本書從認知、技術、應用、管理和工具5個維度對網站數據分析進行了全面的講解。具體內容包括: 科學地認識網站的數據分析 ; 從零開始建立企業數據體系 ; 網站數據採集和配置等。

一個月從小白到數據分析師,都是靠著這份書單!


3、《數據分析:企業的賢內助》陳哲 著

本書章節邏輯清晰,從企業的一個個具體的需求出發,使讀者對數據分析的瞭解循序漸進,將複雜的數據分析知識體系串成有機的整體。

以企業經營中的案例為依託,將複雜的數據分析知識巧妙地融入其中,完整呈現數據分析項目的流程,系統闡述數據分析的專業思路、方法和技能!

一個月從小白到數據分析師,都是靠著這份書單!


這一套推薦下來,需要讀的書並不少,不要覺得頭大,其實根據推薦的步驟已經給出了一條明確的學習路徑,即“統計學基礎-常用模型理論-編程語言和數據庫技術-機器學習方法”。

這些書不必一一啃下來,以所列出的技能為目標學習即可。已經學過的知識也不必回爐重造,比如你之前就有統計的基礎,那麼統計學部分的書你就沒必要看了。

但更重要的是,不要只看書,要儘快讓自己步入實踐階段。數據分析作為一門技術,只有在不斷地操作當中才能掌握真正的技巧和方法,將知識學以致用。

最後,希望大家在成為數據分析師的路上越走越遠~

(附:詳細推薦書單目錄)


一個月從小白到數據分析師,都是靠著這份書單!

本文中部分書籍,可轉發文章並在後臺私信我“書籍”領取!

文源:DC黑板報


分享到:


相關文章: