IEEE2015 可视化会议-机器学习渐呈星火燎原之势

简介:

摘要:机器学习(ML)与数据可视化(Data Visualization)的关系越来越紧密。大多数论文在数据预处理阶段都使用了机器学习技术。本文内容是对时间序列数据的可视化等四个主要应用领域高度强调的机器学习技术的总结。


最近,我参加了在芝加哥举办的IEEE 2015可视化大会,并草草记录了一些有关机器学习的内容。对于那些不了解该会议的人来说,你有必要了解下,这是从业者、学者和研究人员最大的一次年度聚会,它们的研究方向是如何将数据进行可视化并且对我们可用。会议论文主要来自IEEE VIS的三个核心子会议:可视分析科学与技术(Visual Analytics Science and Technology,VAST)、信息可视化(Information Visualization,InfoVis) 、科学可视化(Scientific Visualization,SciVis)。同时举行的还有三大IEEE专题报告会:大数据分析和可视化(Large Data Analysis and Visualization, LDAV)、网络安全可视化(Visualization for Cyber Security, VizSec)以及第一次举行的数据科学可视化专题报告会(VDS)。


今年,与会人员超过1500人,包括来自商业智能和高级分析的领先企业人士,有Bloomberg, Google,IBM,Tableau以及Microsoft。


此次会议给我印象最深的是:机器学习(ML)与数据可视化(Data Visualization)的关系越来越紧密。大多数论文在数据预处理阶段都使用了机器学习技术。例如,VAST会议最好的论文“Reducing Snapshots to Points: A Visual Analytics Approach to Dynamic Network Exploration (离散化Snapshots:一个用于动态网络探索的可视分析方法)”,使用矢量化、标准化以及降维技术将高维动态网络数据映射到二维空间,然后使用两个并列图做为可视化输出:一个展示网络快照(network Snapshot),一个显示网络演变。使用户更容易将异常与正常稳定的状态区分开来。


以下内容是对四个主要应用领域高度强调的机器学习技术的总结:


在网络或空间数据可视化中,聚类和分类已被广泛用于干扰数据的降解和兴趣识别。例如,在“MobilityGraphs: Visual Analysis of Mass Mobility Dynamics via Spatio-Temporal Graphs and Clustering(基于时空图聚类的大量流动数据的可视分析)”一文,对大伦敦地区每小时Twitter用户的移动数据使用的就是空间聚集的区域聚类和颜色编码的时空图聚类。

0?wx_fmt=png

(图像来自达姆施塔特工业大学的交互式图形系统小组.)

对于时间序列数据的可视化,存在一个大的挑战,即在有限的显示空间里展示大数据集,并且做到图形不重叠。一个有效的方法是将数据点汇聚到各个时间段,然后创建一个带有层次感的多焦点放大线形图,如这篇文章:“TimeNotes: A Study on Effective Chart Visualization and Interaction Techniques for Time-Series Data(TimeNotes:基于时间序列数据的高效图表可视化和交互技术研究)”。

0?wx_fmt=png

(图片来自TimeNotes

在文本数据可视化中,实体提取、主题识别和情感分析等文本挖掘技术的可视化逐渐成为必要。在这篇论文“Exploring Evolving Media Discourse Through Event Cueing(基于事件线索的媒体话语变化探索)”中,多个挖掘结果,如Wordle中的实体,随着时间发展的情感得分,相互连接在一起,用以加强媒体话语分析。

0?wx_fmt=png

(图片来自亚利桑那州立大学的VADER实验室

异常检测,虽然它并不是可视化的单独研究领域,但许多的研究小组都已对其已研究多时,利用自动化分析结果协助人们进行判断。例如,在“Visualization and Analysis of Rotating Stall for Transonic Jet Engine Simulation(基于跨音速喷气发动机的旋转失速模拟的可视化和分析)” 一文中,作者使用格鲁布斯检验(Grubbs’ test)来识别叶片通道中异常值,并将其作为涡轮发动机旋转失速的预征兆。同时,在“TargetVue: visual analysis of anomalous user behaviors in online communication systems(TargetVue:基于在线通信系统的用户异常行为的可视分析)”一文中,TLOF(time-adaptive local outlier factor,时间自适应局部异常因子)模型用于识别用户行为的突然变化,模型特征主要从在线通信系统中提取。


VAST的挑战赛则是另一个亮点——该比赛始于2006年,每年举行一次,旨在反映现实世界的当下分析水平,并鼓励研究新颖的数据处理、可视化和交互方法。今年的挑战是分析一个娱乐公园一周内涉及犯罪行为的个人和团体活动。用于数据处理和ML最流行的语言是Python和R,目前Azure机器学习平台对两者都支持。


总之,该会议是一个学习前沿的可视化方法的好地方,同时还可以和该领域的专家进行交流。



原文发布时间为:2015-11-22

本文来自云栖社区合作伙伴“大数据文摘”,了解相关信息可以关注“BigDataDigest”微信公众号

相关文章
|
1月前
|
机器学习/深度学习 数据可视化 算法
机器学习-可解释性机器学习:随机森林与fastshap的可视化模型解析
机器学习-可解释性机器学习:随机森林与fastshap的可视化模型解析
107 1
|
4月前
|
机器学习/深度学习 数据可视化 Python
机器学习之利用线性回归预测波士顿房价和可视化分析影响房价因素实战(python实现 附源码 超详细)
机器学习之利用线性回归预测波士顿房价和可视化分析影响房价因素实战(python实现 附源码 超详细)
93 0
|
6月前
|
机器学习/深度学习 数据可视化 算法
数据分析和机器学习的11个高级可视化图表介绍
可视化是一种强大的工具,用于以直观和可理解的方式传达复杂的数据模式和关系。它们在数据分析中发挥着至关重要的作用,提供了通常难以从原始数据或传统数字表示中辨别出来的见解。
113 0
|
4月前
|
机器学习/深度学习 数据可视化 Python
【Python机器学习】数据可视化讲解及性别、周末与购物间可视化实战(超详细 附源码)
【Python机器学习】数据可视化讲解及性别、周末与购物间可视化实战(超详细 附源码)
38 0
|
6月前
|
机器学习/深度学习 数据可视化 算法
数据分析和机器学习的11个高级可视化图表介绍
数据分析和机器学习的11个高级可视化图表介绍
|
6月前
|
机器学习/深度学习 数据可视化 Python
【Python机器学习】实验01 Numpy以及可视化回顾
【Python机器学习】实验01 Numpy以及可视化回顾
107 2
|
8月前
|
机器学习/深度学习 数据可视化 算法
【机器学习3】鸢尾花数据集可视化,让枯燥的数据颜值爆表!
【机器学习3】鸢尾花数据集可视化,让枯燥的数据颜值爆表!
859 0
|
9月前
|
机器学习/深度学习 存储 数据可视化
机器学习系列5 利用Scikit-learn构建回归模型:准备和可视化数据(保姆级教程)
在本文中,我们以美国南瓜数据为例,观察并整理了需要的数据,挑选及提取了特征变量:如月份,平均价格。并对其进行了数据可视化,我们发现,9月和10月份是南瓜的平均价格最高。
126 0
|
11月前
|
机器学习/深度学习 数据可视化 算法
机器学习模型可视化:基于sklearn和Matplotlib的库​scikit-plot
机器学习模型可视化:基于sklearn和Matplotlib的库​scikit-plot
|
11月前
|
机器学习/深度学习 数据可视化
『机器学习』核心概念的可视化解释
『机器学习』核心概念的可视化解释

热门文章

最新文章