手绘稿如何1秒变身数据大屏?深度学习让人人成为可视化专家

本文涉及的产品
教育场景识别,教育场景识别 200次/月
OCR统一识别,每月200次
票证核验,票证核验 50次/账号
简介: 小叽导读:LADV是DataV内嵌的智能识别设计产品,能够迅速学习和识别手绘草图、信息图表、大屏截图等资料,并在DataV内自动生成可配置的可视化应用。也就是说,LADV的出现,能将过去数据可视化应用搭建过程中痛苦的前端还原图表设计稿的过程压缩为秒级!

作者 | 言顾

1.jpg

有了LADV今后人人都能做可视化专家了!
先来看看LADV的效果:

2.jpg


3.jpg


以上例子中,生成的可视化图表,均可以在DataV的环境下做进一步的样式调优和数据接入,最终发布为一个实时数据驱动展示的页面。

1.LADV解决了什么问题?

简单来说,就是大幅降低数据可视化的设计成本。让用户在制作数据可视化应用时,可以将更多的精力投放在前期需求梳理、指标设计,和后期的数据探索、可视分析这些关键环节上。

纵观数据可视化这个垂直领域,包括DataV在内的很多团队都在尝试降低可视化的实现的工程成本(如下图1, 2)。然而除了工程成本本身,数据可视化的设计效率极大的影响了数据挖掘效率。

工业界可视化先驱如Tableau, Power BI等提出的解决方案是为用户提供不同的模版。但模版不可能完全贴合实际使用场景下的需求,很多用户在使用过程中,只能向可视化设计的高门槛以及冗长的制作时间妥协,选择近似的模版来解决。如何让各种背景的用户真正制作自己中意的数据可视化一直是一个难题。而DataV团队研发的LADV——一个基于深度学习的可视化生成系统,通过机器学习可视化案例的风格而生成数据可视化(如下图3),恰恰就是为了解决这个问题而生的。

4.jpg

2.颠覆可视化设计和搭建流程

2.1 传统流程

数据可视化设计需要多方配合,就DataV举例如下图传统流程,有产品和分析同学进行需求调研,而设计同学会根据所需图表进行高保真设计, 最后会交由前端同学进行还原。这样的流程由于需要多方协同,导致效率变慢。更重要的是,这样的流程致使很多没有设计能力的用户缺少创建属于自己可视化的能力。

5.jpg


2.2 LADV优化流程

通过LADV,我们设计了一种新的可视化创建流程。如上图所示,LADV极大减少了传统的设计流程,新的流程支持通过图片进行原型设计及前端还原,并支持后续的设计微调。

3.技术方案

3.1.1 图表识别模型技术

深度学习技术在近些年来得到飞速发展,在不同领域都取得优异的成绩。包括在数据图表分类领域也取得了很大的进展,如学术界的Revision, ChartSense 等。但大多数的模型仅仅能够进行图片分类,而非物体识别(换句话说,不仅进行图片分类,同时识别该类型图片所在的位置)。

现有的方案中最优的也只是能够通过OCR技术识别文字的位置及内容(如下图),很难做到识别图表及图表的位置,如柱状图,饼图等。更何况物体识别所需的图表在可视化图片中的相对位置等信息,更是让这些数据看起来是不可能完成搜集的。

6.jpg

然而DataV又恰恰拥有数以万计的数据可视化模版数据,所以我们通过DataV的数据训练了可以识别图表位置及类型的物体识别模型,这也是物体识别模型首次应用于数据图表领域。同时,LADV不仅仅能够识别图表的类型及位置,还可以将可视化界面的颜色进行提取。从而将原案例风格中更多的维度迁移到机器生成的数据可视化界面中。

7.jpg


3.1.2 识别结果优化

在得到识别结果的基础上,我们进行了对识别结果的优化。例如我们使用了Grid Design这样的设计规范,来避免由识别导致的布局误差(如上图a,c),并能够将存在布局不规范的原图进行规范。
3.2 颜色识别模型技术

色彩是大屏展示不可或缺的成分之一,在使用颜色时不仅需要考虑美观度和协调性,还需要考虑到可读性。我们将从原始图片中提取颜色并在优化后加以应用。首先,从图片中提取颜色及其相应占比,一般来说在一个大屏中背景色的占比是最大的, 所以使用占比最大的颜色作为背景色。文本颜色将影响大屏的可读性,我们根据WCAG对比度标准计算出使得和背景色对比度达到7:1的文本颜色。接着对提取到的颜色进行过滤,去除背景色相似色和文本色相似色,然后对剩余的颜色进行聚类得到主色。最后使用色板生成方案生成色板并应用于大屏中。

3.3 文字及字体识别模型技术

在即将发布的版本中,LADV可以支持对文字及字体的识别,同时将识别到的文字及字体还原到生成可视化中。在字体识别中,我们使用了ResNet-18 作为识别的模型。从而实现了能够识别案例可视化中的字体,例如包括衬线体及无衬线体等。LADV同时使用了OCR等传统方案对文字进行了识别。

3.4 识别图表映射

从 LADV 生成 DataV 大屏的过程主要分为两步——大屏基本配置生成和大屏配置优化。首先,我们将 LADV 识别得到的图表类型映射为 DataV 中的组件类型,同时结合图表的位置,使用默认的图表样式配置和数据配置,生成一份“JSON”格式的大屏的基本配置。

在这一步中,我们主要解决了大屏内容和布局的生成,使用默认的样式配置和数据在视觉层面还远不能达到我们的需求,因此我们还要针对这两个部分进行优化。我们将 LADV 识别得到色彩信息作为大屏的主题配色,修改大屏相关色彩配置(如背景颜色和文字颜色),并遍历大屏中的每个组件,应用当前的主题配色,这个步骤使得大屏整体的色彩会更加丰富和和谐。这里需要注意的是,由于手绘稿的色彩相对比较单一,所以我们没有直接提取手绘稿的色彩信息,而是应用了一些内置的主题配色,对生成的大屏进行美化。

除了色彩的优化外,我们根据识别得到的文字信息,修改文字类组件的字体、字号等样式配置,并使用识别得到的文字内容,作为文字组件的数据。完成以上步骤后,我们通过 DataV 提供的大屏生成接口,将最终的大屏配置导入到DataV 产品中生成为可交互的可视化大屏,用户可以在此基础上继续优化,完成最终的数据可视化。

3.5 技术框架总结

在LADV的技术中,我们总结了目前LADV的技术框架,如下图。

8.jpg

4.项目实例

4.1 LADV操作演示

我们仅仅需要上传喜欢的数据可视化模版,就可以生成一份已在DataV内编辑好并可交互的可视化界面。同时,我们还可以对该模版进行继续编辑,以达到我们想要的结果。 下图左为选择案例模版页面,同时可以上传图片,并点击右下角上传案例。右侧图片为通过LADV学习而生成的可视化界面,并可在DataV内进行继续编辑。

9.jpg

与此同时,LADV考虑到有些用户更倾向于优先绘制草图,因为草图可以抽象出不同的设计。所以,我们提供了可以快速将用户手绘的数据可视化草图通过识别来生成可视化界面的方法。通过与浙江大学 CAD实验室合作,DataV收集了近2,000张手绘设计稿,并通过物体识别模型进行训练。

10.jpg


4.2 用户反馈

我们在通过谷歌图片搜索,尝试通过搜索3种不同的关键词得到的可视化案例来测试LADV,(1)Power BI, ( 2 ) Tableau, ( 3 ) Dashboard。同时我们还搜集了( 4 ) Tableau Gallery的可视化案例界面 我们发现,除了 Tableau Gallery,用户对所有的图表生成在美观上都给了很高的评价,并且,尽管Tableau Gallery目前美观分数最低(原因为较多infographic案例,不规则图表等),但用户依旧愿意基于LADV生成图去继续搭建,而非从零开始设计可视化的界面。这也意味着,LADV有能力彻底解放我们在可视化设计上的能力。

11.jpg


可见的将来,我们相信在设计可视化界面时,LADV可以参与到各个环节中。我们真诚的希望,LADV不仅能够帮助用户解决可视化的设计问题,同时能够激起用户对可视化设计的兴趣,进而通过可视化设计及图表布局,颜色等展示维度来影响数据的挖掘。

5.未来期待

最后,经过接近一年的努力, LADV通过与国内外学术界不同方式的合作受益良多,如国内可视化先驱浙江大学CAD实验室的陈为教授,并得到了TVCG主编Klaus Mueller教授的合作邀请。

相关实践学习
DataV Board用户界面概览
本实验带领用户熟悉DataV Board这款可视化产品的用户界面
阿里云实时数仓实战 - 项目介绍及架构设计
课程简介 1)学习搭建一个数据仓库的过程,理解数据在整个数仓架构的从采集、存储、计算、输出、展示的整个业务流程。 2)整个数仓体系完全搭建在阿里云架构上,理解并学会运用各个服务组件,了解各个组件之间如何配合联动。 3 )前置知识要求   课程大纲 第一章 了解数据仓库概念 初步了解数据仓库是干什么的 第二章 按照企业开发的标准去搭建一个数据仓库 数据仓库的需求是什么 架构 怎么选型怎么购买服务器 第三章 数据生成模块 用户形成数据的一个准备 按照企业的标准,准备了十一张用户行为表 方便使用 第四章 采集模块的搭建 购买阿里云服务器 安装 JDK 安装 Flume 第五章 用户行为数据仓库 严格按照企业的标准开发 第六章 搭建业务数仓理论基础和对表的分类同步 第七章 业务数仓的搭建  业务行为数仓效果图  
相关文章
|
30天前
|
机器学习/深度学习 数据可视化 Windows
深度学习笔记(七):如何用Mxnet来将神经网络可视化
这篇文章介绍了如何使用Mxnet框架来实现神经网络的可视化,包括环境依赖的安装、具体的代码实现以及运行结果的展示。
49 0
|
30天前
|
机器学习/深度学习 TensorFlow 算法框架/工具
使用Python实现深度学习模型:智能数据隐私保护
使用Python实现深度学习模型:智能数据隐私保护 【10月更文挑战第3天】
95 0
|
2月前
|
机器学习/深度学习 人工智能 自然语言处理
深度学习的魔法:如何用神经网络解锁数据的奥秘
在人工智能的璀璨星空中,深度学习犹如一颗最亮的星,它以其强大的数据处理能力,改变了我们对世界的认知方式。本文将深入浅出地介绍深度学习的核心概念、工作原理及其在不同领域的应用实例,让读者能够理解并欣赏到深度学习技术背后的奇妙和强大之处。
45 3
|
3月前
|
机器学习/深度学习 缓存 数据处理
《零基础实践深度学习》2.3.3 校验数据有效性 基于飞桨Dataset和DataLoader API完成数据处理
这篇文章详细介绍了在深度学习任务中进行数据处理的步骤,包括数据校验、封装数据读取与处理函数、使用飞桨Dataset和DataLoader API完成数据加载,以及数据增强/增广的方法和实践,旨在确保数据的有效性和提高模型训练效果。
|
3月前
|
机器学习/深度学习 传感器 自然语言处理
深度学习的魔法:如何用神经网络解锁数据的秘密
在这个数字信息爆炸的时代,深度学习技术如同一把钥匙,揭开了数据隐藏的层层秘密。本文将深入浅出地探讨深度学习的核心概念、关键技术和实际应用,带领读者领略这一领域的奥秘与魅力。通过生动的比喻和直观的解释,我们将一起走进神经网络的世界,看看这些由数据驱动的“大脑”是如何学习和成长的。无论你是科技爱好者还是行业新手,这篇文章都将为你打开一扇通往未来的大门。
|
2月前
|
机器学习/深度学习 TensorFlow 算法框架/工具
使用Python实现深度学习模型:智能数据隐私保护
使用Python实现深度学习模型:智能数据隐私保护
62 1
|
2月前
|
机器学习/深度学习 数据采集 计算机视觉
深度学习之缺失数据的图像修复
基于深度学习的缺失数据图像修复是一种通过深度学习技术填补图像中缺失或损坏部分的过程。这种技术在图像处理领域具有重要意义,能够改善图像的视觉质量,并在许多实际应用中发挥作用,如图像恢复、视频编辑和图像生成等。
59 4
|
2月前
|
机器学习/深度学习 人工智能 自然语言处理
深度学习与神经网络:探索复杂数据的表示
【9月更文挑战第26天】深度学习作为人工智能领域的明珠,通过神经网络自动从大数据中提取高级特征,实现分类、回归等任务。本文介绍深度学习的基础、张量表示、非线性变换、反向传播及梯度下降算法,并探讨其在计算机视觉、自然语言处理等领域的应用与挑战。未来,深度学习将更加智能化,揭示数据背后的奥秘。
|
1月前
|
机器学习/深度学习 自然语言处理
【绝技揭秘】模型微调与RAG神技合璧——看深度学习高手如何玩转数据,缔造预测传奇!
【10月更文挑战第5天】随着深度学习的发展,预训练模型因泛化能力和高效训练而备受关注。直接应用预训练模型常难达最佳效果,需进行微调以适应特定任务。本文介绍模型微调方法,并通过Hugging Face的Transformers库演示BERT微调过程。同时,文章探讨了检索增强生成(RAG)技术,该技术结合检索和生成模型,在开放域问答中表现出色。通过实际案例展示了RAG的工作原理及优势,提供了微调和RAG应用的深入理解。
42 0
|
3月前
|
机器学习/深度学习 自然语言处理 数据处理
深度学习的数据增强
基于深度学习的数据增强技术旨在通过生成或变换现有数据,来提高模型的泛化能力和鲁棒性。数据增强在图像、文本、语音等各种类型的数据处理中都起着至关重要的作用。
44 1
下一篇
无影云桌面