数据可视化指的是通过可视化表示来探索数据,它与数据挖掘紧密相关,而数据挖掘指的是使用代码来探索数据集的规律和关联。

数据科学家使用Python编写了一系列令人印象深刻的可视化和分析工具,其中很多也可供你使用。

最流行的工具之一是matplotlib,它是一个数学绘图库,我们将使用它来制作简单的图表,如折线图和散点图。然后,我们将基于随机漫步概念生成一个更有趣的数据集——根据一系列随机决策生成的图表。

我们还将使用Pygal包,它专注于生成适合在数字设备上显示的图表。通过使用Pygal,可在用户与图表交互时突出元素以及调整其大小,还可轻松地调整整个图表的尺寸,使其适合在微型智能手表或巨型显示器上显示。我们将使用Pygal以各种方式探索掷骰子的结果。

(一)安装 matplotlib

1.1 在 Linux 系统中安装 matplotlib

如果你使用的是系统自带的Python版本,可使用系统的包管理器来安装matplotlib,为此只需执行一行命令:
$ sudo apt-get install python3-matplotlib
如果你使用的是Python 2.7,请执行如下命令:
$ sudo apt-get install python-matplotlib
如果你安装了较新的Python版本,就必须安装matplotlib依赖的一些库:
$ sudo apt-get install python3.5-dev python3.5-tk tk-dev
$ sudo apt-get install libfreetype6-dev g++
再使用pip来安装matplotlib:
$ pip install --user matplotlib

1.2测试 matplotlib

$ python3
>>> import matplotlib
>>>

如果没有出现任何错误消息,就说明你的系统安装了matplotlib。

 

1.3 matplotlib 画廊

要查看使用matplotlib可制作的各种图表,请访问http://matplotlib.org/的示例画廊。单击画廊中的图表,就可查看用于生成图表的代码。

 

 

(二)绘制简单的折线图

下面来使用matplotlib绘制一个简单的折线图,再对其进行定制,以实现信息更丰富的数据可视化。

 

我们将使用平方数序列1、4、9、16和25来绘制这个图表。

 

分类:

技术点:

相关文章: