数据分析报告中如何选择合适的统计图表

简介:

由于不同的数据分析工具收集到的数据千差万别,基于这些数据生成展示的统计图表也不尽相同;而且数据分析师制作各种报告时,也常常纠结于如何选择合适的图表表达数据诉求,因此我们有必要去理解一些常用数据分析统计图表的特点、使用方法以及注意点。数据分析中主要使用以下几种图表。

折线图:按照时间序列分析数据的变化趋势时使用

柱 图:指定一个分析轴进行数据大小的比较时使用

饼 图:指定一个分析轴进行所占比例的比较时使用

仪表图:单独关注一个指标的绩效表现时使用

(版权归数码林网站分析博客所有,欢迎转载,但转载请注明出处。)

1.折线图

       折线图主要是在按照时间序列分析指标值变化趋势的情况下使用。通常情况下X轴设定为时间,Y轴设定为其他指标值。分析页面浏览数,访问者数,转化数(率)等指标整体变化趋势时多用折线图。这些指标值用折线图表示之后,可以明确每小时段、天、周、月或年的变化趋势,得到类似“平时工作日的访问比较多,周末的访问比较少”,“这个月转化数较上个月下降了近10%”等分析结论。

       那么接下来就让我们去见识一下网站分析所使用的几组折线图(X轴都设定为时间)。

       首先,Y轴设定为页面浏览数的折线图。表示成折线图之后页面浏览数的增减就一目了然了。

       (※折线图 ↓

维析Dashboard折线图


       下图表示了同时涵盖“初次访问”和“再访问”的页面浏览数。在相同单位下这些指标值都可以统合在一个图表中显示。

       (※细分折线图 

维析Dashboard细分折线图


       这样一来就可以细化分析一些趋势变化的原因。在上图中,可以发现:8月16日的流量短暂峰值主要来自于初访者

       接下来看下图。是【今年8月】和【去年8月】每一天的页面浏览数同比数据。可以看出今年不仅总体流量有所提升,而且有效缓解了每逢周末流量减少的现象。

       (※对比折线图 ↓)

维析Dashboard对比折线图


       ■做折线图时的注意事项

       在做成折线图时请注意以下几点。

1. 图表中的指标要明示(即Y轴数值代表的指标)。

2. 当X轴有多于5个项目时推荐使用折线图,当不足5个项目时可以使用柱图。

3. 在一组折线图中如果折线超过了4条,由于折线之间有重复的部分所以会看不清楚。这种情况下,可以拆分成两组折线图去表现。

(版权归数码林网站分析博客所有,欢迎转载,但转载请注明出处。)

2.柱图

       柱图主要是以特定的轴线来比较指标值的大小的情况下使用。柱图是网站分析中最常使用的一种图表。柱图可分为竖柱图横柱图和累积竖柱图等。下面说明一下这几种柱图的特点。

       首先是【横柱图】。横柱图也叫条形图,一般用来表示一类项目的横向对比,例如按访问量对网页的排名、按转化率大小对广告媒体的排名等。横柱图的X轴通常代表确定数值大小的刻度尺。下图是按访问量大小对网站页面的排名图:

       (※横柱图 ↓)

维析Dashboard横柱图


       其次是【竖柱图】。竖柱图和折线图用法类似,常用来表示时间序列的指标数值变化情况。不同的是,如果X轴上的时间点不多(例如低于5个)可以选择使用竖柱图;或者根据数据的性质和图表想要表达的侧重点来选择:竖柱图偏向于表现数量,而折线图偏向于表现趋势

       讲到这里还可以看出【竖柱图】表现的是数据随时间变化的关系,而【横柱图】所表示的项目对比指在某一时间点或时间段内的数据。也许有人会问“横柱图的数据不一样可以通过竖柱图表现出来吗?”,理论上可以,但通常横柱图中的项目名称(例如上例中的网页标题)都偏长,如果通过竖柱图表现很难在一行内展现,可能会出现折行的现象。

       下图就是表现访问次数随时间变化的竖柱图。

       (※竖柱图 ↓)

维析Dashboard竖柱图

       柱图中还有一种叫做【累积竖柱图】。当我们想确认某一个数值的详细内容时使用累积竖柱图就很方便了。下图是对访问次数按网站的访问来源(广告进入、直接访问进入、搜索引擎进入)细分做成图表,这样可以很容易的判断网站进入方式的详细情况。

       (※累积竖柱图 ↓)

维析Dashboard累积竖柱图

       

       ■做成柱图的注意事项

       在做成柱图的时候请注意以下几点。

1. 注意竖柱图和横柱图的区分使用

2. 柱的数量过多导致柱间空隙很小时,可以选择使用折线图

3. 【数量】和【比例】最好做成不同的柱图

(版权归数码林网站分析博客所有,欢迎转载,但转载请注明出处。)

3. 饼图

       饼图主要是在分析整体指标值中的成分比例时使用的。特点就是能够一眼分辨出哪一个项目所占的比例最大。下图中很容易的就能发现网站的进入页主要是“数码林的博客”页,比例将近达到了40%。

     (※饼图 ↓)

维析Dashboard饼图


       ■做成饼图时的注意事项

       在做成饼图时请注意以下几点

1. 由于饼图是为了确认比例而不是数量,所以饼图上表示的是比例,如果想要表现总数值的话,可以添加一行n=XXXX这样的描述。

2. 饼图中的构成元素是按照百分比降序排列的(【其他】除外)

3. 由于人们习惯顺时针看东西,所以最好把最重要的内容放在12点位置附近

4. 当饼图中的构成元素有10种以上时,排在后面的数据总结在一起用【其他】来表示。

(版权归数码林网站分析博客所有,欢迎转载,但转载请注明出处。)

4.仪表图

       仪表图是为了关注单独一个指标的表现时使用。特点是能给出指标的安全范围和警戒范围。

       例如将跳出率的表现以25%、50%为界限分为三个绩效区域,并分别以绿色、黄色和红色来区分三个绩效区域,其中红色表示警戒区域。从下图可以一眼看出9月的跳出率已经超过50%进入警戒区域,需要引起重视了。

       (※仪表图 ↓)

维析Dashboard仪表图


       ■做成仪表图时的注意事项

       在做成仪表图时请注意以下几点。

1. 注意绩效表现区域的划分,一般利用两个边缘值分为三个区域

2. 红色警戒区域出现在左侧还是右侧和指标的业务属性相关,例如跳出率越高越接近警戒区域,所以红色区域在右侧。

       最后援引麦肯锡的《用图表说话》中一段话来总结一下关于图表的选择:

(1)图表是语言的一种形式,它的存在是为了比表格更快更好的表达你想要表达的内容

(2)决定图表的不是数据也不是尺寸,而是你想说明的主题

(3)图表贵精不贵多,只有当图表能帮你表达主题时才使用

(4)图表是直观教具,但它不能取代书写和讲述,在帮你传达主题时,它能起到重要作用

 (注:以上所有统计图截图来自于网站分析工具 – 维析Dashboard)

目录
相关文章
|
2月前
|
机器学习/深度学习 人工智能 搜索推荐
某A保险公司的 数据图表和数据分析
某A保险公司的 数据图表和数据分析
64 0
某A保险公司的 数据图表和数据分析
|
6月前
|
文字识别 算法 数据挖掘
视觉智能开放平台产品使用合集之对于统计研究和数据分析,有哪些比较好的工具推荐
视觉智能开放平台是指提供一系列基于视觉识别技术的API和服务的平台,这些服务通常包括图像识别、人脸识别、物体检测、文字识别、场景理解等。企业或开发者可以通过调用这些API,快速将视觉智能功能集成到自己的应用或服务中,而无需从零开始研发相关算法和技术。以下是一些常见的视觉智能开放平台产品及其应用场景的概览。
|
7月前
|
数据可视化 前端开发 数据挖掘
R语言对综合社会调查GSS数据进行自举法bootstrap统计推断、假设检验、探索性数据分析可视化|数据分享(上)
R语言对综合社会调查GSS数据进行自举法bootstrap统计推断、假设检验、探索性数据分析可视化|数据分享
seaborn常用的10种数据分析图表
seaborn常用的10种数据分析图表
|
4月前
|
数据可视化 数据挖掘 Python
数据可视化不再难!Matplotlib带你轻松绘制精美图表,让数据分析焕发光彩!
【8月更文挑战第22天】今天分享如何用Python的Matplotlib库绘制多样图表。Matplotlib是数据可视化的强大工具,对数据分析至关重要。本文分六部分:首先介绍环境准备,包括安装和配置;随后通过四个案例演示折线图、柱状图、饼图及散点图的绘制方法;最后总结并鼓励大家进一步探索Matplotlib的丰富功能。跟着示例操作,你将学会基本图表的制作,提升数据展示技能。
46 0
|
5月前
|
数据采集 机器学习/深度学习 数据可视化
了解数据科学面试中的Python数据分析重点,包括Pandas(DataFrame)、NumPy(ndarray)和Matplotlib(图表绘制)。
【7月更文挑战第5天】了解数据科学面试中的Python数据分析重点,包括Pandas(DataFrame)、NumPy(ndarray)和Matplotlib(图表绘制)。数据预处理涉及缺失值(dropna(), fillna())和异常值处理。使用describe()进行统计分析,通过Matplotlib和Seaborn绘图。回归和分类分析用到Scikit-learn,如LinearRegression和RandomForestClassifier。
105 3
|
6月前
|
机器学习/深度学习 数据可视化 算法
探索MATLAB世界:掌握基础知识与实用技能(1. MATLAB环境与基本操作 2. 数据类型与变量 3. 条件与循环,1. 数据分析与统计 2. 图像处理与计算机视觉 3. 信号处理与控制系统)
探索MATLAB世界:掌握基础知识与实用技能(1. MATLAB环境与基本操作 2. 数据类型与变量 3. 条件与循环,1. 数据分析与统计 2. 图像处理与计算机视觉 3. 信号处理与控制系统)
57 0
|
7月前
|
机器学习/深度学习 数据采集 数据可视化
机器学习 —— 数据分析与图表绘制
机器学习 —— 数据分析与图表绘制
|
7月前
|
Python
Python 的科学计算和数据分析: 如何使用 Matplotlib 绘制图表?
Matplotlib是Python的绘图库,用于创建图表。基本步骤包括:导入库(`import matplotlib.pyplot as plt`),准备数据(如`x = [1, 2, 3, 4, 5]`, `y = [2, 4, 6, 8, 10]`),创建图表对象(`fig, ax = plt.subplots()`),绘制图表(`ax.plot(x, y)`),设置标题和标签(`ax.set_title()`, `ax.set_xlabel()`, `ax.set_ylabel()`),最后显示图表(`plt.show()`)。完整示例代码展示了如何绘制一个简单的折线图。
63 5
|
7月前
|
机器学习/深度学习 数据可视化 数据挖掘
用Python进行健康数据分析:挖掘医疗统计中的信息
【4月更文挑战第12天】Python在医疗健康数据分析中扮演重要角色,具备数据处理、机器学习、可视化及丰富生态的优势。基本流程包括数据获取、预处理、探索、模型选择与训练、评估优化及结果可视化。应用案例包括疾病预测、药物效果分析和医疗资源优化,例如使用RandomForestClassifier进行疾病预测,Logit模型分析药物效果,以及linprog优化医疗资源配置。
780 1