数据可视化专家Andy Kirk说过,数据可视化分为两类:探索性可视化图表和解释性可视化图表。解释性可视化图表的目标是进行描述——它们是根据对事物表面的关键线索而被仔细构造出来的。
另一方面,探索性可视化图表建立了与数据库或主题事件的互动,它们帮助用户探索数据,让他们发掘自己的观点:发现他们自己认为相关的或者感兴趣的事物。
通常,探索性可视化图表是交互式的。尽管现在有许多Python绘图库,但只有少数可以创建能够使你在线嵌入和发布的交互图表。今天与大家分享五个我们最喜爱的Python绘图库。
mpld3
Mpld3 将Phython的核心绘图库matplotlib和备受欢迎的JavaScript图表库D3结合在一起,创建了与浏览器兼容的可视化图形。你可以在matplotlib中绘制一张图表,运用Phython和JavaScript插件增加交互功能,然后用D3渲染。
Mpld3包含缩放、平移和增加提示工具条(当鼠标悬浮于某一数据点上,出现提示信息)等内置插件。然而,Mpld3的真正亮点在于它齐全的API,允许让你创造自定义插件。如果你熟悉D3和JavaScript,就可以创造无穷尽的各种图形。
当你准备发布图形的时候,在最后添加一行额外的代码,把你的图形转换成HTML和JavaScript字符,就可以嵌入到任何网页中。
Mpld3 最适用于小型或中型数据库。带有成千上万数据点的图形会降低浏览器处理速度。
pygal
Pygal是制作漂亮的即用图表的优选绘图库,它只需要编写很少的代码。每种表格都被打包成一个类函数(如:pygal.Histogram()制作柱状图, pygal.Box() 制作箱型图),并且它有各种色彩默认风格。如果想要更多掌控,你可以配置各种图表元素——包括大小、标题、标签和渲染。
图表默认显示工具提示栏,但是目前不能放大、缩小或者平移图表。
你可以通过SVGs的形式导出图表,并且把它们加载到带有嵌入标记的网页中,或在HTML中直接插入代码。像mpld3一样,pygal适合更小型的数据库。
Bokeh
Bokeh受到《The Grammar of Graphics》中概述的概念启发。 你可以把各个组件逐个叠加在一起来创建最终的图表——例如,你可以以坐标轴为起点,添加点、线、标签等。
图表可以输出为JSON对象、HTML文件或者交互式网络应用。Bokeh在允许用户在浏览器中操作数据方面做得尤为突出,用户可以通过滑动和下拉菜单进行筛选。与mpld3一样,你可以在其中缩放和平移操作图表,但是也可以关注通过框或套索选中的一组数据点上。
Holo Views
HoloView实际上并不是一个绘图库。相反,它让你构建有助于可视化的数据结构。当你把数据移入HoloView 容器对象(Container object)中,比如用于多变量分析的网格矩阵(GridMatrix)或用于显示相邻成份的布局(Layout)时,你可以直观地探索数据。在matplotlib或Bokeh后端中绘图是分开进行的,因此,你能够专注于数据,而非编写绘图代码。
HoloViews提供的主要交互功能是滑动条,因此,人们能够通过一个变量来观察它的影响。当使用Boken后端时,你可以结合滑块和Bokeh的工具探索图形,例如对它进行缩放和平移。
HoloViews融合了Seaborn和pandas,扩大了pandas数据帧和Seaborn的统计图表的功能。
plotly
从简单的条形图表到复杂的3D网格图形,Plotly拥有广泛的具有出版物品质的图表类型。
Plotly是一个默认基于网络的服务,但是你可以在Python中使用离线库,并且上传图表到Plotly免费公共服务器或付费私人服务器。从那里,你可以把图表嵌入到网页中。
所有的Plotly图表包含工具提示,一旦利用Plotly的JavaScript API把图表嵌入后,你就可以在其顶部设置自定义控件(如滑块和筛选)。
另一种在Plotly中操作和分享图形的方式是在Mode中进行操作。你可以用SQL拖入数据,在Phthon Notebook中,利用Plotly离线库绘制查询的结果,之后把交互式图表添加到报告中。这份报告以可分享的URL在线,也可以嵌入其他页面,例如下图中展示的,从1950年开始,乐高积木套装尺寸是如何改变的:
本文作者:冯琛
来源:51CTO