从入门到精通:互联网数据分析的书籍清单?

笑搞

如果不喜欢看视频学习,看书籍也是一个很好的选择。毕竟纸质感的书籍允许我们在上面写写画画,做读书笔记和归纳总结。

但是做读书笔记的时候要注意,不要在第一遍的时候归纳知识点,因为第一遍的时候什么都不会就很容易变成抄书了。

回归正题,推荐几本经典的数据分析书籍,这几本书都不会很深奥,但对学习数据分析一定有帮助。


1.《深入浅出数据分析》


这本书非常浅显易懂,以类似“章回小说”的活泼形式向读者展现优秀的数据分析人员应知应会的技术:数据分析基本步骤、实验方法、最优化方法、假设检验方法、贝叶斯统计方法、主观概率法、启发法、直方图法、回归法、误差处理、相关数据库、数据整理技巧;

其中统计知识如果不会可以跳过,这个需要有部分统计学基础,建议从头开始系统性的学习。


2.《利用Python进行数据分析》

大家都知道Python的应用领域非常广泛,不仅可以爬虫,在数据可视化、以及数据分析还有人工智能库领域应用也比较多。像我就是用Python做的数据分析,这本书里面有大量具体的实践建议,以及大量综合应用方法,可以说是Python领域中技术计算的权威指南。


看这本书籍需要掌握Python的基础知识,建议还要学习一些Python爬虫。


3.《精益数据分析》

这本书更侧重于商业的数据分析和数据模型,他展示了如何用数据分析验证自己的设想、找到真正的客户、打造能赚钱的产品,以及提升企业知名度。里面有30多个案例分析,说白了就是如何实现用数据驱动增长。


这本书学习的不是知识和技术,我们需要从中学习的是他们数据分析的思维模式以及其中的商业模型。更简易偏向金融类数据分析领域的数据分析人员学习。


路人甲M

  热诚推荐看过的几本经典。

  一、数据分析入门:

  《Head First Data Analysis》

  电子工业出版社的经典书目系列,从数据分析基本步骤开始、实验方法、最优化方法、假设检验方法、贝叶斯统计方法、主观概率法、启发法、直方图法、回归法、误差处理、相关数据库、数据整理技巧一一讲到。图比较多,适合入门。

  《Head First Statistics》

  推荐理由同上,适合入门者的经典教材。

  《R in Action-Data Analysis and Graphics with R》

  R是属于GNU系统的一个自由、免费、源代码开放的软件,用于统计计算和统计制图。这本书从实用的统计研究角度逐例分析R在数据处理、模型构建、以及图形操作上的由浅入深的结合,堪称经典。

  《数据之魅-基于开源工具的数据分析》

  作者是华盛顿大学理论物理学博士。这本书是数据分析的经典之一,包含大量的R语言模拟过程及结果展示,例举了很多数据分析实例和代码。

  《数据挖掘-市场营销、销售与客户关系管理领域应用》

  作者是Data Miners的创办人,有二十多年的营销和客户关系管理结合数据挖掘的经验。详细介绍了作为一个数据挖掘团队需要的知识体系,包括数据库、SAS使用、统计学、机器学习、数据可视化、如何访问用户收集需求、如何写论文与沟通等等。有条件的建议看英文原版。

  《Data Analytics for Beginners: Basic Guide to Master Data Analytics》

  入门五星推荐。里面很多图表实例,手把手教你如何EXCEL画图,对各种知识点(平均值,模式,中值,方差,标准偏差)的讲解相当的到位,比起大学里的各种课本靠谱。

  先把这些花时间啃啃,数据分析的理论部分就基本入门了,根据实际情况还需要结合你的业务需求来进行系统的学习。

  二、数据分析进阶:

  《Doing Data Scienc》

  作者Cathy O’Neil是哈佛大学的博士,MIT的数据博士后,曾今作为一名Quant在对冲基金D.E. Shaw 工作,目前是一家纽约初创公司的Data scientist 。这本书需要有一定的编程和理论基础,作为入门教材来说有点难,虽然只有400来页,但是涉及的知识点很全面。每一章节的核心内容都附有编程案例,R/Python/Shell三种语言任君挑选。

  《Python for Data Analysis》

  Python数据分析必看,适合入行不久的数据分析师。作者有多年的Python数据分析工作经验,对各种Pyhon包iPython,NumPy,pandas,matpotlib等有着很深的理解。看完这本,敲完代码,Python数据分析就算入行了。

  《Data Science for Business》

  很多牛人为之作序,数据科学如何与商业结合,相信这本书会给你一些启发。

  《Python Data Science Handbook》

  2016年6月出版的,500页保质保量,作者(Jake VanderPlas)是华盛顿大学电子科学研究所的高级数据科学研究员,研究领域包括天文统计学、机器学习和可扩展计算。书的前半部分介绍了用于数据分析和一般的科学计算的基本Python库,后面从实际应用的角度使用Python库scikit-learn开始机器学习实践。适合有一定Python基础人(或者R基础),并且想学习如何使用Python进行数据分析的人。

  《Storytelling with Data》

  作者Cole NussbaumerKnaflic,私募分析师,前Google人力分析团队总监。本书展示了如何高效率展示量化资讯,如何用丰富的资料讲故事。Google内部的数据可视化课程讲师,之前也在Maryland Institute College of Art兼职讲师。如果你想知道如何以图叙事,这边好书不容错过。


分享到:


相關文章: