导读:前几篇Tableau文章中,分别介绍了折线图、条形图、地图和饼图的几种用法,今天本文简单介绍其他几种常用的可视化图表类型。
01 散点图
散点图是一种常见的可视化图表,常用于描述大量样本的分布情况,一般是两个度量数据间的分布。例如,仍以Tableau自带超市数据集为例,探究销售额和利润间的分布关系为:
在散点图的基础上,可以通过添加趋势线实现快速回归分析,探究两个度量间的变化关系。主要的回归模型包括5种:
以线性回归为例,得到利润随销售额的线性回归方程为:
除了回归分析,还可以快速进行聚类,以期更为深入细致的分析。
k=5的聚类分析
02 直方图直方图是另一种常用描述样本分布的图表,与散点图常用于描述两个度量间分布关系不同,直方图常用于描述单个度量的分布情况,在Tableau中常常通过设置数据桶来实现直方图绘制。
一般来说,由于常常存在少数样本远远偏离大多数的样本分布区间,简单调节数据桶的大小往往难以保证直方图效果:
对大量样本直接构建直方图效果一般
此时可以通过设置截断来保证直方图效果,例如实现一个对销售额的简单截尾函数后,再用于直方图分析效果会好得多:
对样本截尾后的直方图
03 树状图vs热力图
描述某个维度下度量的大小分布情况,除了应用折线图和条形图外,还可以考虑树状图和热力图。二者都是由基本的矩形元素构成,不同的是树状图中主要通过矩形面积大小来反映度量大小(也可设置颜色属性),而热力图则仅仅是通过颜色深浅来加以区分。
例如,描述超市数据集中各省市的销售额大小对比,则:
树状图
热力图
04 气泡图vs词云
同样是用来描述超市数据集中各省市销售额的大小,还可以考虑气泡图和词云。二者本质上属于相同的图表形式,区别在于前者通过圆的面积来区分度量大小,后者则是通过字体大小。
气泡图
词云图
05 总结
本文介绍了Tableau中几种常用的基本可视化图表,包括:
- 描述两个度量间分布:散点图
- 描述单个度量分布:直方图
- 描述单个度量随维度变化:树状图、热力图、气泡图、词云
至此,Tableau中基本可视化图表制作系列基本完成,共计5篇文章。后续将会围绕一些高级图表的制作和技巧分享。