数据分析系列 19/32

数据分析系列 19/32 | 数据可视化初探

俗话说得好,一图胜千言。数据可视化是数据科学中的一个重要部分。创建可视化很简单,但是创建优秀的可视化很难。数据可视化有两种主要用途:探索数据和交流数据。


数据分析系列 19/32 | 数据可视化初探

PART

01

数据可视化


现在有很多工具都可以用来可视化数据,比如我们常用的Excel,还有数据科学另一门重要的语言R,以及百度的Echarts等可视化工具。

说到这里,说一个经典的可视化案例:俄法战争

数据分析系列 19/32 | 数据可视化初探

1969年,Charles Minard做了一张图表,是1812年拿破仑率军攻占莫斯科的行军图,显示了军队规模的缩减。在顶端较粗的线代表了从波兰到莫斯科的行军规模变化。


下方的细深色线则代表了撤退时的军队规模。线条的宽度代表了军队的规模,从400000大军缩减到了10000。底部线条是温度和时间刻度,而整个图形分布展示了行军距离。


简单来说,数据可视化就是用图形描绘信息。

数据可视化是一种以图形描绘密集和复杂信息的表现形式。数据可视化的视觉效果旨在使数据容易对比,并用它来讲故事,以此来帮助用户做出决策。

数据可视化可以表达不同类型和规模的数据,包括从几个数据点到有大量变量的数据集。

  • 准确的:优先考虑数据的准确性、清晰度和完整性,以不会曲解信息的方式呈现信息。
  • 有助于理解:帮助用户做比较、对比分析等。
  • 扩展性要好:对于不同的用户群体、设备等可调整展示内容和形式。


数据分析系列 19/32 | 数据可视化初探

PART

02

数据可视化的分类


数据可视化可以以不同的形式表达。图表是表达数据的常用方式,因为它们能够展示和对比多种不同的数据。
图表类型的选择主要取决于两点:要表现的数据和表现该数据的用意。本文描述各种类型的图表及其用例。

1. 随时间变化

随时间变化的图表显示一段时间的数据,例如多个类别之间的趋势或比较。

常见用例包括:股价表现、卫生统计、年表。

适合的图表有以下几种:

数据分析系列 19/32 | 数据可视化初探

2. 类别比较

类别比较图表是多个不同类别数据之间的比较。

常见用例包括:不同国家的收入、热门场地时间、团队分配。

数据分析系列 19/32 | 数据可视化初探


3. 排名

排名图表显示项目在有序列表中的位置。

常见用例包括:选举结果、性能统计。

数据分析系列 19/32 | 数据可视化初探


4. 占比

占比类图表显示了局部与整体的关系。

常见用例包括:产品类别的综合收入、预算。

数据分析系列 19/32 | 数据可视化初探


5. 关联

关联类图表显示两个或以上变量之间的关系。

常见用例包括:收入和预期寿命。

数据分析系列 19/32 | 数据可视化初探


6. 分布

分布类图表显示每个值在数据集中出现的频率。

常见用例包括:人口分布、收入分布。

数据分析系列 19/32 | 数据可视化初探


7. 流程

流程类图表显示了多个状态之间的数据移动。

常见用例包括:资金转移、投票计数和选举结果。

数据分析系列 19/32 | 数据可视化初探


8. 关系

关系图表显示多个项目之间的关系。

常见用例包括:社交网络、词图。

数据分析系列 19/32 | 数据可视化初探

面对多种类型的图表,我们该怎么选择和使用呢,后面我们会继续拆分并详细描述。


数据分析系列 19/32 | 数据可视化初探


分享到:


相關文章: