大家应该都看过阿里巴巴最近5年每年“双11”的数据大屏,阿里为什么要做数据大屏呢?这样做能给客户带来什么?怎么做阿里这样的大屏幕?2016云栖大会成都峰会上,阿里云数据事业部产品专家永翎给我们解答了这些问题。
为什么要做数据大屏?
以前对阿里巴巴的印象是一家电商公司,当时数据平台事业部成立的时候,我们认为阿里应该是一家数据公司,所以想到了应该要把数据呈现出来,让大家看到数据,让数据玩起来。做数据大屏的目的可以总结为以下三点:
第一,用数据向外界展示。就像外面的展台一样,我们可以用数据来表现整个公司的发展,展示公司的业务,表现整个业务的形态,这是一个非常直接、直观、简单的原因。比如利用村淘的数据、阿里电商的数据再加上政府本身的数据进行融合去呈现展示整个农村淘宝整个的发展建设情况。我们计划做到让每个村长、县长的屋子里能够有一个大屏,当他对内进行监督、对外进行展示的时候,他也能够通过数据的办法去有效的衡量他的发展情况。再比如,“货车帮”的物流指数案例、浙江电力区的专有云大数据平台。
第二,用数据驱动每个员工。现在,阿里云内部的每个工位旁边经常会摆一台电视,把员工自己的业务情况展示出来。这样,员工每天都能看到自己的业务情况。当我们每天知道自己的哪些接口被调用,被调用了多少次,逐渐的,当我们再去讲如何衡量自己工作的情况和服务提供水平的时候,这些大屏能够起到很好的作用。比如,“网聚宝”可以把全网成交情况、实时成交情况提供给运维人员。再如,直播中点喊红包实时数据监控,可以让主播、编导等可以实时看到红包的数量,调整相应的策略。可视化的报表、端的变化、所放媒介的位置、呈现的方式对员工的整个管理都有一定的帮助。
第三,看到未被挖掘的数据价值。有些内容不画出来是难以去理解的,比如那些针对地理类的东西,类似人在哪里跑步的问题,通过图来表达会很明显。阿里曾帮助贵州交警做了公路立体化治安防控云。在卡口通过摄像头识别车牌,再通过预警的算法,比如说得知哪些车是套牌车的算法,再加入很多的交通规则,这样交通中哪些规则被触发了、违规行为出现的地方等信息可以通过地理可视化和预警的列表呈现给用户。
其实,用户对应用场景的想象空间超出想象,数据大屏可以用于实时营销活动,跨境电商、全球贸易,线下零售分析,远程监控、风控,自然科学分析,IT运维、Dev Ops,电子政务等。
数据大屏的设计思路
数据大屏只是可视化当中很小的一部分。本质来讲,数据大屏和数据分析报表没有任何区别,主要在于媒介上的不同。其实在纵向的屏幕上,比如手机、PC等,其空间对于我们来说是无限延展的,因为它们的屏幕可以上下滚动,在PC上你可以切换很多的Tab去看很多的报表,但是在手机上,我们只是时间会变得有限。数据大屏一般就是放在那里,看的人都是路过看一眼,也不会和大屏进行交互。所以,我们的设计思路需要考虑如何在有限的空间布局当中展示公司整个的业务层次,并且将细碎的业务数据进行抽象的概览总结。数据大屏就放到这里,没人看也没有用,所以抓住他人的注意力很重要。另外,数据实时更新才会吸引大家的关注,所以处理实时数据、流式数据的策略比较重要。
设计口诀1:大小适配、主次分明
最常用的布局就是中间放一个4*4大小的屏幕,两边各放两个2*2大小的屏幕。这样的布局方式考验的是我们的业务板块的划分,比如说如果划成六个板块,上述的布局已经不适用了。布局方法的一个重点是我们应该突出层次结构:每个大业务块在对应到每个业务块再用3-6个小标题来表示。用边框把同类数据放在一起,越优先的越放在中间和上方,优先级越低的放在两侧和下方,相关的接临也要考虑。第二个重点是合理拆解板块:忘记具体展示的手段,先从工作总结报告入手,分出几大业务块,业务块数量要能与拼接屏块数、播放模式相适配。考虑使用柱状图、饼状图、直方图并不是很重要,最重要的是别人看过去的时候能一眼就明白我们的业务的情况,这样板块的划分才成功。
设计口诀2:宏微兼顾、动静结合
这也是保持吸引力的关键。如果我们只是传统报表的话,数据大屏一定要体现出来在明细数据上的处理能力,这样的话你才能在大屏上讲出故事来。我们应该做到KPI都要有细节来解释,给几个大业务块用2-3个KPI来总览,每个小块再用1-2个指标和2-4个解释性的信息来填补,细节也都要有提炼性的数据来表达。
上图是浙江烟草物流运转概况的案例。大家的关注点是物流的整个流程是不是畅通,所以最上方我们用抽象的办法把整个物流的情况展示出来。中间这个板块主要是讲自己的建设情况,主要是物流中心的建设情况,所以我们用地图进行展示。旁边我们再将其展开,左边讲硬件的建设,右边讲软件的建设。在两边我们把实时GPS,把所有的车辆的实时状态体现出来。这样的一个版块划分就看起来非常清晰。
DataV产品介绍
- 多种精美模板:不必从零开始设计,多种场景下的专业的可视化模板供您可以直接套用;
- 多种图表组件:多种图表除针对展示优化过的条、饼、柱、线等传统图表外,还包括2D/3D的地图地球上的轨迹、飞线、散点地理信息,还包括拓扑关系、树图等异形图表供您自由任意搭配;
- 多种数据源接入:包括阿里云RDS, ADS等分析型数据库外,还支持本地文件csv上传和在线API的接入;
- 播控、多屏适配与发布:针对PC/大屏端的各种分辨率适配与拉伸;能够进行播放控制;以及您在在线编辑后,可以选择在线对外发布或是下载到本地进行部署。
实时数据:驱动更实时的运营动作
实时数据对于大屏来说在技术上、在底层会比较麻烦。“双11”的基本架构是这样的:把实时上报的数据写到DateHub中,然后用StreamCompute流计算服务进行数据分析,之后把数据写到RDS关系型数据库,最后再将数据取出来展示到数据大屏上。
有时会遇到比较复杂的情况,比如上图,一个数据进来需要同时进行多种多样的计算,比如需要同时计算实时指标、做多维分析、查询历史数据。DateHub可以实现一路写进来,多路写出去,通过流计算写到各种相关的数据库里。上图的智能故障预测服务,我们把历史数据沉积在ODPS中,然后通过历史学习做了异常检测的模型,并且该模型会定时更新,然后把更新后的模型update到流计算中。这样的架构实际上就是做了离线训练、在线预测去对设备进行实时的故障检测,由于高并发会比较强,所以最后把数据都写在表格存储中,这样前端可以通过API去读取到短信服务器里、设备管控的应用中或者数据大屏中。
本文为阿里云数据事业部产品专家永翎在2016云栖大会成都峰会演讲整理。