AntV 是由蚂蚁集团产出的开源企业级数据可视化解决方案,包含对统计数据、关系数据、地理数据的前端可视化技术产品和设计标准。AVA 是 AntV 品牌下的智能可视分析框架。本套白皮书基于 AVA 及相关团队在 BI 增强分析领域数年的调研和实践积累,旨在分享经验与思考。
本篇是《增强分析白皮书》的“洞察展现”篇,专门介绍在数据分析类应用中展现数据洞察和分析结论时的注意要点、设计规范和技术方案。
回复 “白皮书” 关键字下载《增强分析白皮书》的洞察展现 pbf 版
本文中涉及的具体业务案例、场景、数据,皆为模拟和示例。
Vol.1 洞察展现的概念
如今,图表在各类业务中已经很常见了,制作图表的工具也越来越丰富。但是,随着大家对数据的重视和应用程度越来越高,对于图表也提出了更多要求。比如,光能看到数据的大致情况已经不够了,还需要能清晰地呈现洞察结论,甚至能启发读者对数据背后的问题的思考。
让我们来举一个例子。分析销量的变化情况是大多数商业业务上都有的需求。当一个商家想看今日的营业情况时,他通常看到的图表是这样的:
在这张图表上,商家能获得什么信息呢?当然,可以知道近期有多少笔订单,也可以看出这个数字相比之前是下降了。但是,下降了多少?下降原因是什么?这种下降是否正常?是否需要采取什么措施?这些问题,需要进一步查看才能得到答案。
假设商家有一定的数据分析技能,经过一番详细分析后,可以将发现的数据现象和原因标注在图表上,得到了下面的图表。通过这张图表可以看到订单的变化和促销等活动的关联。可以推测:哪些措施可能比较有利,之后还可以考虑哪些促销活动。
但是,制作上面这张图表需要非常专业的数据分析师和可视化工具经过数小时甚至数天的数据分析、制图过程才能完成,不仅耗时耗力,还可能耽误了调整策略的时间。怎么能使这个效率得到提升呢?
我们希望能总结出一套设计规范和对应的技术工具,来提供标准化的洞察展现解决方案,让图表的洞察触手可及。
✨ 1.1 什么是洞察展现
数据分析的核心目的就是从数据中发掘洞察来支撑决策。综合大量对数据可视化的定义会发现其主要目的就是辅助洞察获取[1,2,3]。数据可视化技术可以最大化地调用人的视觉系统,帮助人进行思考,揭开深度的和不易预想到的洞察,从而助力问题的解决。
一个完整的洞察,应该包含以下成分:
- 背景:简洁地描述上下文,确定洞察观点的范围(比如:洞察只在特定月份)
- 矛盾:引人注意的状态,常被称为洞察类型(比如:峰值、离群点、相关性)
- 归因:对矛盾原因的理解和陈述,可来源于统计或业务信息
- 建议:根据归因给出的行动建议,常常隐含在归因中
洞察展现,就是指通过图形、文字等方法,将洞察的背景、矛盾、归因、建议等成分精确地展示给读者。
✨ 1.2 洞察展现的几种形式
✨ 1.3 为什么制定洞察展现标准如此重要
- Purchase, H. C., Andrienko, N., Jankun-Kelly, T. J., & Ward, M. (2008). Theoretical foundations of information visualization. In A. Kerren et al. (Eds.), Information visualization: Human-centered issues and perspectives (Vol. 4950, pp. 46–64). Berlin/New York: Springer.
- McCormick, B. H., DeFanti, T. A., & Brown, M. D. (Eds.). (1987). Visualization in scientific computing. In ACM SIGGRAPH Computer Graphics, New York, Vol. 21, p. 6.
- Earnshaw, R. A., & Wiseman, N. (1992). An introduction to scientific visualization. In K. W. Brodlie et al. (Eds.), Scientific visualization, techniques and applications. Berlin/New York: Springer.
Vol.2 设计规范
数据可视化的本质是通过可视化技术来提高人们获取洞见的效率,而数据洞察相关解决方案能够帮助用户加速这一过程。场景化的、以用户为中心的洞察解决方案,能够让用户便捷的、自然地在阅读到分析的整个过程中获取到数据洞察。
在业务与产品中提供数据洞察相关解决方案,需要团队中多种角色的协同合作。这其中,在用户呈现侧,其核心又依赖于设计与前端所联合提供的系统性展现和交互方案,我们称之为 AntV 洞察解决方案。
在本章节中,我们将集中为大家介绍 AntV 里数据洞察解决方案的相关设计规范。
✨ 2.1 洞察解读设计的四个层次
设计在系统中所起到的作用、所承担的角色如下图所示,下图是我们对整个洞察解决方案在用户侧的用户诉求、产品场景、解决方案和底层能力的一个系统性的架构图。
用户诉求决定了产品场景,产品场景驱使我们提供对应的解决方案。由于产品场景的多样性,我们所提供的解决方案需要具备完善的基础能力与高度的系统灵活度,能够通过直接应用或简单定制去匹配不同业务场景的诉求。为了能够达到此目的,我们对底层能力的建设就尤其重要。
✨ 2.1.1 用户诉求
数据可视化的本质是通过可视化技术来提高人们获取洞见的效率,而数据洞察相关解决方案能够帮助用户加速这一过程。这个过程从用户视角而言,又可以进一步细分为四大流程:看数、分析、洞见、执行。我们的洞察解决方案,最主要的作用流程集中于:从分析到洞见。
✨ 2.1.2 产品场景
在具体的消费场景里,从消费粒度角度,从微观到宏观我们细分为四大场景:
- 数据点洞察
- 图表级洞察
- 报表级洞察
- 洞察报告
场景 1 和场景 2 依附于原始图表数据派生出来,洞察观点与原始数据呈现一种实时性的、紧密的联动关系。场景 3 和场景 4 独立于原始图表数据生长出来,但并不意味着洞察观点脱离原始数据,根据实际需求,其洞察观点可以是原始图表数据的静态切片数据的解读,也可以是高度实时相关的数据解读。
✨ 2.1.3 解决方案
从产品场景中可以看到,场景 1 和场景 2 所需要的解决方案与场景 3 与场景 4 所需要的解决方案相对独立,我们对其抽象定义为两大解决方案:
- 图表增强表达
- 独立观点表达
在图表增强表达方面,主要目的是在图表规律本身派生出系列可视化后的信息。对于派生的手段,有三种方式:强调图形、辅助线、标注说明。
在独立观点表达方面,主要目的是承载独立的洞察结论。对于承载的场景和手段,也有三种方式:解读文本可视化、行内迷你可视化、洞察观点卡片。
✨ 2.1.4 底层能力
这些解决方案依赖于我们设计和技术长久以来的业务实践与沉淀,在用户呈现侧,其核心又依赖于设计与前端所提供的系统性展现和交互方案。在设计侧我们沉淀为详尽的规范材料,在接下来的小节中,我们将为大家一一介绍。
✨ 2.2 图表增强表达
✨ 2.2.1 增强表达类型
业务场景中,一个普通的图表仅能呈现数据现象,观点和洞见需要每个看数用户自行挖掘和解读,为了能够帮助用户一眼看懂数据,通过文献参考[1,2]及结合业务实践,总结出几种常用技巧,可以帮助你的图表突出洞察。
✨ 2.2.2 打造视觉反差
通过视觉反差突出重要信息,弱化次要信息,帮助用户快速看到焦点数据。色板中常见两种,一种是强调色,常用于重要与次要的分类数据,将关注的数据着以高饱和度明亮的颜色,用于对比的其他分类数据着以低饱和度颜色;另一种是反差色,常用户同类的连续数据,比如时间、月份、年度等,常见案例比如今昨天的数据对比,将今天的数据着以有色相颜色,昨天的数据着以无色相颜色,更多规范详见《色板》。
✨ 2.2.3 绘制神奇的线
绘制可供业务对比参考、业务趋势判断、异动区间参考的线。常见辅助线有三大类:基础统计如均值、最大、最小、中位等;业务经验类如目标值、预警值、自定义常量;系统预测类如预测线、趋势线、波动线等。因为均属于辅助线,所以在设计原则上,样式层级表达上均低于图表原本的数据,更多规范详见《辅助线》。
更多延伸结构线/划分参考区间/添加统计标签规范敬请期待...
✨ 2.3 独立观点表达
「独立观点表达」指的是由系统智能给出的或用户输入的洞察观点,以一种独立于图表的呈现形态给出。由于洞察观点信息量的差异与媒体内容的差异,通常我们以卡片容器去承载这样的洞察观点,以确保其良好的扩展性及和当前报表的兼容性,由此构成的具象实体,我们称之为「洞察观点卡片」。
一个完整的洞察观点卡片,从细粒度到粗粒度包含如下三方面元素:
- 解读文本可视化组件:用于表达洞察观点的文本态
- 行内 mini 图组件:用于表达洞察观点的图表态
- 观点卡片组件:用于表达综合的观点态
粒度越粗,越接近真实的使用场景,越“开箱即用”。在行业内,大多数对前两者有过定义,但对观点卡片组件未曾有过定义。
本节将初步分享上述三类独立观点表达的组件的设计规范和技术细节。
✨ 2.3.1 解读文本可视化
当解读文本较多的时候,同样用户将需要消耗更多的注意力去完成对观点的获取。因此,通过对文本进行样式映射,可以让文本中的信息更易读。
更进一步,通过文本和图形的交互,可以让洞察信息的传达更加准确。
针对解读文本的词汇构成,我们总体将文本信息分为如下几类:
信息类型 |
解释 |
|
数据类型 |
指标名称 |
如题 |
指标值 |
如题 |
|
同环比-正 |
如题 |
|
同环比-负 |
如题 |
|
维度 |
如题 |
|
维值 |
如题 |
|
官方描述 |
关键结论词汇 |
由系统给出的观点 |
常规描述性文本 |
由系统给出的围绕观点的描述用语 |
|
其它文本 |
常规文本 |
用来将上述信息组织成一个完整的句子的其它文本 |
解读文本可视化规划,即针对上述信息一一进行视觉要素的编码,使其“可视化”。在解读文本可视化设计方面,我们提出下列三个原则:
- 少即是多:由于文本信息类别的多样性,如果将所有信息都映射不同的视觉元素,将会出现“过了头”的文本可视化情况,违背了了原本为了让解读文本更易读的目标。因此我们需要克制的对相关元素进行编码,尽可能只编码用户最为关注的几类信息。原则上建议使用的不同的视觉元素不超过 7 个。
- 动静分离:解读文本除了满足用户阅读的场景,在部分可视分析场景中,用户还希望能快速的针对某些条件进行筛选,因此部分文本组件将以可交互状态出现。为了避免可交互状态的视觉样式与静态文本的视觉样式混为一谈,我们采用不同的视觉元素分别进行编码。如静态文本可用颜色编码,直接作用于文字实体,而可交互文本可用下划线或背景色编码,不直接作用于文字实体。
- 匹配注意力原则:如上述信息分类表格所示,我们需要对 9 小类文本信息进行可视化编码。在整体编码思路上,我们应该对信息作优先级分层梳理,为用户最为关注的信息类别赋予最为突出的视觉样式,而用户最不关注的信息类别赋予最为淡化的视觉样式,如此的解读文本在实际被用户消费的过程中,有效的引导用户的注意力,让其更快的获取更关注的信息。
基于上述原则,我们提供了默认的白色主题的规范样式表,见下图。
同时,我们也提供了暗黑主题的规范样式表供大家使用。
我们强烈建议在设计文本可视化时,为自己的产品中关于「增强分析」的功能和能力预留一个品牌主色,使它反复出现,在用户心中固化心智。在我们的业务当中,我们使用了紫色这一品牌主色,它既鲜明,又不会与常规的报表当中的可视化用户冲突。
如果你需要自定义文本样式,我们建议你基于上述设计原则基础上进行定制。
✨ 2.3.2 行内迷你可视化图表
在洞察观点中,诸如趋势、分布的等数据信息可以借助行内迷你可视化图表的方式,即将微型的可视化图表内嵌倒文本中,为用户提供更加直观的观点获取。行内迷你图表相较于常规尺寸的可视化图表,并没有本质的区别,通常将信息映射到各种视觉属性(如颜色、大小、形状)来进行可视化呈现。
行内迷你可视化图表作为外部记忆辅助工具,它们有助于用户进行感知推理、发现异常值、估计趋势和比较大小,并且能够帮助他们完成更高层次的观点洞察。
需要注意的是,行内迷你图的设计受限于界面尺寸的限制,因此在设计的时候,应更加注重对关键信息的表达,而非所有信息的百分百精确表现。
在解读文本可视化设计方面,我们提出下列三个原则:
- 去细节:行内迷你图尺寸有限,因此在图表结构上,除了传递数据规律的图表实体本身,其它常规图表拥有的诸如轴、图例等标签将不再保留。
- 弱交互:行内迷你图最重要的作用是进一步加速关键洞察信息的传递,我们不希望在设计上为行内迷你图赋予过多的交互,因为那样会遇到“胖手指”难题。如果一定要为其添加交互,尽量将整个迷你图实体作为交互热区。
- 单一特征表达:行内迷你图更多的目的不在于为用户提供精确的各个数据点位的信息,如此目的建议可以直接用常规尺寸的图表去承载。其存在更多是为了表达某一关键的数据特征,如趋势、占比,因此在设计上,我们应专注传递单一特征的信息。
目前,在行内迷你图方面,我们也处于起步阶段,目前仅针对常用的迷你折、柱、饼进行限定,可查阅下列规范表:
以下是迷你图的使用场景举例:
✨ 2.3.3 观点卡片
在上述两节中,我们介绍了文本和迷你图在洞察解读当中的设计要点和使用规范,但这二者都只是构成洞察解读的原子要素,如果要在产品中为用户提供完整的洞察解读服务,我们需要将二者合理的组织与承载起来,才能达到如此目的。
由于洞察观点信息量的差异与媒体内容的差异,通常我们以卡片容器去承载这样的洞察观点,以确保其良好的扩展性及和当前报表的兼容性,由此构成的具象实体,我们称之为「洞察观点卡片」。
卡片拥有良好的扩张性和场景适应性,能非常好的匹配增强分析无处不再的使用特性。
- 可扩展性:由于在实际的分析场景中,用户同一时刻获取到的洞察观点可能不止一个,且观点的内部构成结构复杂多样,因此卡片的规范定义方面需要考虑对不同观点的接纳和扩展。
- 可兼容性:洞察观点贯彻在分析过程中的每时每刻,这意味着观点卡片需要去适应不同的消费场景,既不能喧宾夺主,抢夺用户对原始报表的注意力,也能在某一时刻为用户提供相对沉浸的阅读观点的氛围,因此需要对卡片提供适当的差异性状态,以保证其扩展性。
在可扩展性方面,我们提供了纯文本观点、图文混排观点,以及多图观点的方案。此外还提供了单观点卡片和多观点卡片两种方案:
在兼容性方面,我们提供了适用于 4 大场景的 4 种卡片状态,基本涵盖了可视分析的各种应用场景:
除了基本使用的限定,还有一些边缘场景的规范限定,如空状态等,就不再此赘述。
- 《乐见数据》
- 《Graphical Overlays: Using Layered Elements to Aid Chart Reading》
Vol.3 技术方案
从为了使上述的设计规范能应用到实际业务场景中,我们需要一套技术侧的工具来保障实际业务中能灵活、准确、高效地实现数据洞察的增强展现。对应于设计规范,前端侧也提供图表增强表达和独立观点表达两部分的解决方案。
在工程实现中,主要考虑两部分:
- 规范性:在规范性方面,我们将提供一套基于图形语法和自动化洞察的解决方案,包含符合设计规范的图表增强标记(Mark)和用于独立观点表达的增强展现组件。这些组件将具有高度的可复用性、一致性和灵活性,以确保设计规范的正确应用,并提高开发效率。
- 可扩展性:为贴合不同产品用户的使用习惯和日常看数、分析的流程,业务中通常需要对设计规范进行复合自己业务系统的定制和应用。我们需要考虑如何支持用户自定义的洞察展现。因此我们将提供一套灵活的插件机制,使用户可以自由地扩展和定制展现组件,同时保证插件与设计规范的兼容性。
✨ 3.1 图表增强表达
图表增强表达,指的是在原有可视化的基础上,通过添加一系列不同的标注,强调数据的趋势、异常值和特征等洞察,从而达到「增强原图表」的目的。
在图表增强表达方面,设计规范中提供了打造视觉反差、辅助线、注解、参考区间、统计标签几种手段和相应规范。在工程实践上,曾遇到这样的一些问题:
- 图表组件的配置项没有提供灵活的标注配置,导致添加标注需要通过 hack 的方式进行
- 图表上添加的标注,常缺少添加 legend 、tooltip 等能力,导致标注的表达力不够强
为了解决这些问题,我们在技术上统一了几何元素和标注的设计和底层实现,统一表达为 Mark(标记)。在图表组件的封装中,使用单独的辅助图层对标注进行绘制。这样可以带来下面这些好处:
- 标注作为一等公民,可以获得和图表元素相同的交互能力和定制能力,对标注进行详细的探索
- 对原图表一键增强,能在原有图表上灵活扩展,不侵扰原图表功能,可插拔,方便组装,针对不同业务需求灵活选用
✨ 3.1.1 典型问题与解决思路
本节主要介绍了图表增强表达的技术方案期望解决的核心问题,以及对应的解决思路。
图表看不懂——提供增强标注
左图是一个常见的可视化图表,从图中我们能看出账户量呈现上升,但这个趋势是否正常、是否需要介入处理,图上没有体现。而增加上安全阈值区间、均值线、告警点的标注后,图表信息一目了然,看图表的人能够据此做出下一步需要的行动决策。
一个完整的数据洞察可视化,需要同时包含原始数据的信息、洞察信息、背景信息,在展示层可以分为图表层和增强展现层。增强展现层中,参照 2.1 中的设计规范,结合实际业务中常见的分析意图和对应的洞察类型,可以归纳用于展现洞察信息点的常见标注元素,形成一套可以和原始图表层进行插拔结合使用的标注组件,从而在实践中,灵活根据数据里的洞察信息,对图表进行增强表达,将数据中的洞察准确、高效的传达出来。
以下是我们在业务实践中形成的一套洞察展示标注元素,可供参考:
标注添加成本高——图形语法
使用传统配置式可视化绘制流程,通常会先声明图表类型,调取相应的图表组件,因此绘制的内容会受限于图表的配置项。如果想要根据洞察数据在图表上加上对应的标注,一方面需要图表有配置项支持,另一方面需要开发者手动处理洞察数据到图表配置信息的转换。
而在基于图形语法的可视化绘制系统中,没有图表分类的概念,而是通过一系列视觉元素和可视化组件去描述任意的可视化。这里的视觉元素主要分为两类:几何元素(Geometry)和标注(Annotation),其中几何元素编码原始数据,而标注编码由原始数据衍生得到的洞察信息,比如极值、最大值和趋势等。
因为原始数据和衍生数据的地位不同,所以在之前的设计中,几何元素的能力要强于标注。这导致随着数据模式复杂度和标注丰富度的增加,图表标注的成本也随之升高。为了解决这个问题,我们统一了几何元素和标注的设计和底层实现,把它们称为标记(Mark)。这使得标注得到了如下的能力增强:
- 数据驱动(Data Driven):支持由表格数据驱动,可以更容易地一次性绘制多个标注。
- 转换(Transform):支持对绑定的维度数据进行分组,然后应用聚合、筛选和排序等转换,使得标注可以更轻松地编码更丰富的衍生数据。
- 动画(Animation):支持数据驱动的动画,可以在可视化叙事中强调洞察信息。
- 交互(Interaction):支持响应用户的行为,可以和几何元素一起展示提示信息(Tooltip)等。
除了上诉能力以外,我们同时也提供了一种被称为复合标记(Composite Mark)的编程范式去复用逻辑和视觉展现。复合标记不仅仅使得我们可以对已有的标注添加新的特性,也可以将多个标记组合成一个新的标记。
✨ 3.1.2 实践方案
AntV/G2
可视化绘制库提供了一套声明式的图形语法,可以支持基础图层和增强展现标注信息的灵活组合和插拔。G2
结合 AntV/AVA
的insight
模块的洞察数据及相应增强标注(Augmented Mark)的生成能力,可以方便地实现数据中洞察信息的增强展现,使图表不仅呈现数据信息,更将其中值得关注的信息点清晰揭示出来。下面提供实际案例供参考。
图表分层绘制
G2
提供了 Spec 和自定义 Mark,不再区分 annotation 和 geometry,所有的几何元素都可以是 Mark,都是 “一等公民”。图表 Mark 和增强展现 Mark 能够自由组合。Spec 结构本身也便于存储、流转和复用。通过 insihgt
生成数据洞察和文本解读,组合成下面这种结构。
我们可以快速绘制出一张带有异动信息的增强折线图。
从洞察数据自动生成增强图表
除了灵活自定义组合增强标注元素和图表的方式,我们对常见的洞察类型及其适合的可视化展现形式进行了归纳和总结,通过调用 ava
中的 getInsights
方法,即可完成从数据到自动生成的洞察结论。
目前支持的洞察类型以及每种洞察类型对应的默认可视化展示如下:
✨ 3.2 独立观点表达
独立观点表达,指的是由系统智能给出的或用户输入的洞察观点,以一种独立于图表的呈现形态给出。由于洞察观点可多可少,可图可文,通常我们以卡片容器去承载这样的洞察观点,以确保其良好的扩展性,由此构成的具象实体,我们称之为「洞察观点卡片」。基于独立观点的概念,我们设计并实现了一套技术方案可应用于展示数据描述文本,并且提供扩展性构成「洞察卡片」这一具象实体。本文从特点分析入手提出解决思路,并结合代码案例介绍了该技术的实践。
在独立观点表达方面,设计规范中提供三种方法:1、解读文本可视化;2、行内迷你可视化;3、洞察观点卡片。底层技术方面,类似于图表中的图形语法(G2 Spec),解读文本可视化也相应使用一套 Narrative Visualization Schema (Ntv Spec) 来表达和存储数据解读。在工程侧,提供数据解读组件来支持解读文本可视化、行内迷你可视化,提供洞察观点卡片组件来支持观点的开箱即用。
除此之外,我们还会引入一些统计分析和自然语言生成技术,以提升数据分析和展现的智能化程度。例如,我们会通过机器学习算法来分析数据的特征和趋势,并根据这些分析结果自动选择最佳的数据展现方式;我们也会利用自然语言生成技术来自动生成数据分析解读,方便用户快速了解数据的含义和趋势。
这些技术不仅可以实现高效的洞察展现和交互,还可以提高系统的可扩展性和可定制性,从而为在多样化的业务系统中实现灵活、准确、高效的洞察表达奠定了坚实的基础。
✨ 3.2.1 典型问题与解决思路
本节介绍独立观点表达不同于传统可视化图表展示的特征,并总结了对应的解决思路。
信息密度大——基于可视化映射理论提高可读性
使用文字表达观点时,单位面积内的可描述的数据信息更多,通常一段文字可能是 4-5 张可视化图表的内容,可带入可视化图表不具有的上下文信息。对应设计规范的解决思路包括:
- 通过使用可视化映射原理对数据元素做标记,帮助用户快速识别关键信息,比如字体颜色、背景色、字体粗细、下划线等,该能力基于 CSS 实现;
- 通过过增加行内小图,在感性层面提高用户对数据的感知。通常行内小图数据量不大,可以直接基于 svg 绘图;
- 图文联动的交互技术有利于帮助用户对照图文理解洞察事实,且交互也是可视化中重要的一项能力。要想实现联动交互需要让每个文本短语都可以溯源到源数据信息,即 metadata;
以下是对照设计规范实现的数据文本短语一览,也是该技术最具特色的内容。
内容依赖自动化生成——结构标准化定义
随着数据分析平民化以及 NLP 技术的成熟,越来越多的洞察结论将由机器自动生成。洞察结论文本的自动化乃至智能化生成的基础是数据结构的标准化,做好领域标准结构定义将促进技术合力积累与发展。
标准化定义是智能可视化中重要的概念,参考 AI4VIS[1] 的相关研究 Visualizations themselves have become a data format.可视化本身已经成为一种数据格式,类似于文本和图像等其他数据格式,可视化越来越多地通过人工智能 (AI) 技术创建、存储、共享和(重新)使用。只有用 json 结构描述,将信息静态化之后,才可以被计算机作为一种数据格式进行转换与消费。自动化的前提是标准化,做到标准化结构定义才可以让系统做自动化生成,更是为了未来智能化生成奠定基础。
我们定义了一套解读文本的标准化表述 schema(即 ntv-schema),结构表示如下图。
基于文本继续分析——插件系统自定义扩展
从看数到分析,不管在探索分析应用还是交互式分析报表中,都需要基于分析结果展示进行二次分析做相关交互如筛选、下钻、上卷等,而文本作为分析结果重要的形式也是需要交互辅助分析能力的。
要想实现该能力,需要两个基础,一个是前面提到过的“数据绑定”,还有一个是自定义扩展。解读文本是含有数据绑定信息的,特别是短语作为数据元信息绑定的基础单元可以作为分析交互等触发控件,如基于日期描述做日期切换、基于拆分维度做维值切换等,可以通过自定义扩展实现。
参考当前主流的富文本编辑器架构,基于插件系统的技术方案可以插入任意元素。
✨ 3.2.2 实践方案
数据解读文本的展示模块 AVA/NTV,用于提升文本的阅读和交互体验。NTV 的名字来源于 Narrative(叙述性)+ Text(文本)+ Vis(可视化),即用文本叙述数据事实的可视化方案。
从 @antv/ava-react
引入 <NarrativeTextVis />
这一 react 组件,传入符合 ntv-schema 定义的 JSON Spec ,即可得到符合设计规范的独立观点表达展示。
以文字为主的观点描述
以如下结构为例,即可获得一段文字描述为主的观点表述。
图文结合的洞察卡片
从 @antv/ava-react
引入 <InsightCard />
这一 react 组件,传入洞察数据,即可得到图文并茂的观点卡片。
支持的洞察数据 (insightInfo
) 示例类型如下图所示:
- Wu, A., Wang, Y., Shu, X., Moritz, D., Cui, W., Zhang, H., Zhang, D. and Qu, H., 2021. Ai4vis: Survey on artificial intelligence approaches for data visualization. IEEE Transactions on Visualization and Computer Graphics.
Vol.4 应用案例
洞察的增强表达可以辅助发现业务中值得关注的数据现象,分析数据背后的原因,并提供有效的上下文信息,为消费者提供决策辅助信息。这章将使用案例说明洞察的增强表达如何在业务中常见的分析环节和四大数据应用场景中发挥作用,让图表讲述故事、让决策用数据说话。
- 分析环节: 看数、分析、产生洞见、执行决策
- 四大数据应用场景:
- 数据点洞察:分析和解释数据现象
- 图表级洞察:补充信息,看懂图表
- 报表级洞察:辅助监控数据大盘
- 洞察报告:汇报数据结论,支撑行动决策
以下将用实际生产中使用的案例详述洞察展现在四大数据应用场景中,如何为人们看数、分析、洞见、执行各环节服务的。
✨ 4.1 数据点洞察:分析和解释数据现象
通过将图表的增强表达和解读融入进用户的分析工作流中,可以为用户发现数据现象、探索数据点背后的原因、分享和消费分析结论提供有力帮助。
✨ 4.2 图表级洞察:补充信息,看懂图表
“一图胜千言”的背后,也可能会出现“可视化的欺骗”,而标注和解读可帮助消除对结果的理解偏差。同时,标注和对图表的深度解读,能补充数据上下文信息,结合智能分析算法,可以揭示数据现象背后的原因,减少盯盘和周期性分析任务的人力成本。
✨ 4.3 报表级洞察:辅助监控数据大盘
报表是图表和分析任务的组合,解读和标注扮演“课代表”的角色,揭示一系列分析任务的关键指标和分析结论,提高报表信息传达的效率和准确性。
✨ 4.4 洞察报告:汇报数据结论,支撑行动决策
洞察报告实质上是一种沟通与交流数据的形式,输出分析过程的成果和结论,将可行性建议以及其他价值信息传递给行动和决策人员,让阅读者能对结果做出正确的理解与判断,并可以根据其做出有针对性、操作性、战略性的决策。
回复 “白皮书” 关键字下载《增强分析白皮书》的洞察展现 pbf 版
编委会
- 编委会成员
- 梓义,白弦,羽熙,钟慧,万木,珂甫,阿胥,完白,彼楼
- 主编
- 步茗,羽然(执行主编)
- 特别顾问
- 御术
- 编委单位
- 蚂蚁集团(平台体验技术部,支付宝设计部,数据产品与技术部)
AntV 数据可视化官网
AntV 数据可视化 GitHub
✨ 关注我们,了解更多~