“上帝指纹”,让大数据落地

本文涉及的产品
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
简介:

在一个不断释放出新概念的技术世界,大概从2012年到2015年,作为一个术语,“大数据”的炒作周期已实属漫长,人们迫不及待地将它渐次比喻为新时代的石油,金矿和土壤——尽管不同于石油,金矿和土壤,也不同于可穿戴设备,虚拟现实等同样拥有旺盛新鲜度技术的目力所及,以数据库和后台分析为根基的大数据多数时候化于无形,无法让人轻易触碰。所以在不少人看来,对大数据概念的热炒已经进入尾声,从现在开始,作为商业基础设施的数据分析将逐步迎来一个掷地有声的落地阶段。

大体而言,大数据的落地有两片最肥沃的土壤:第一是可被轻易体察的2C市场,无论电商还是社交,阿里和腾讯以数据为利器对于个体中心化的追求即是最好的例子;第二是航空,能源,制造,电信,快消等垂直行业,而相比于洞察个体的轻巧与迅捷,数据价值在行业中的落地无疑要相对沉稳——毕竟,理解一个拥有无数细碎分工的行业总要比理解一个具体的消费者困难些,也正因如此,沉稳之后的爆发才尤为可期。

而谈及大数据与行业的嫁接,全球四大会计师事务所之一的安永与海云数据的联姻则颇具样本意义。去年底,两家体量不同却因数据结缘的公司签订的全球战略合作协议曾在大数据业界引发热议,就在不久前,后者研发的航空大数据可视化产品DIVA正式投入商用,它是海云与安永合作后推出的首款行业级应用产品。透过于此,你会看到当一个行业的数据——或者说行业的知识被可视化之后,会化繁为简,产生逻辑,产生意义,从而产生价值。

在更大的意义上,如果说大数据是以“上帝视角”还原这个世界,那么数据可视化则称得上是“上帝的指纹”。

行业痛点

任何一款产品都从解决行业痛点开始,通常来说,大数据在落地过程中要遭遇三个问题。

首先是数据体量过大且种类繁杂。目前现存数据中,75%都是所谓非结构化数据,包括各种文本,语音,图像,视频,社交关系,空间轨迹等,它们异构且分别独立,如一座座信息孤岛般难以协同工作。而处理和汇总这些多维信息的最好载体无疑是可视化,一个最浅显不过的道理是——人类是视觉动物。

嗯,人类层累式进化而来的大脑更偏爱拥有画面感的信息。右脑对于图像的记忆速度要比左脑记忆抽象文字快100万倍,可视化本身即是强化记忆的手段——它更直抵人心。举个例子,在我刚看完的电影《史蒂夫·乔布斯》最后,乔布斯指着女儿笨拙的随身听说:“我要把500到1000首歌装到你的口袋里。”这就是一个典型的视觉冲击场景,他可没说“我要做个能装1000首歌的机器。”再譬如,IDC研究报告显示2020年预计全球新建和复制的信息量会超40ZB,没啥感觉对吧,不如换个说法,2020年全球生产的数据将是地球上所有沙粒的4倍,你会本能脑补沙粒的画面。

大数据也是如此。知道么,百度百科对大数据有个惨绝人寰的定义,复制给你:大数据“指无法在可承受的时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。”所以说,在实际应用中,与大数据进行视觉对话无疑是聪明之举。

数据体量过大会导致第二个痛点:难以分辨随数据洪流裹挟而至的福音与噪音,从而在具体应用中发现有效数据比较少。阿里巴巴集团副总裁,数据分析师车品觉就写过一个事:“巧遇到谷歌的前数据部门leader,他跟我说了一件他觉得很痛苦的事:提出数据需求的人往往70%的情况又不用提供给他的数据。他为此非常生气,便质问业务方:为什么你们老问我要数据,结果却不用?业务方回答说:是的,因为我用完之后才知道这些数据没有用。对于一个每天都要准备数据的人来说,这好比你是一家餐厅的老板,厨师每天让你准备很多菜却只用一小部分材料一样痛苦。”

嗯,与老旧的饼状和柱状图止于数据展示(先用数据再去做图),形式大于内容不同,从相互关联的过程数据中寻找问题和需求,从而做出动态决策,才是数据可视分析最为重要的技能。

最后,在现实层面,目前在做数据分析的更多是技术人员,离企业业务还有段距离,而至少在现阶段,决策层对数据的态度则多少有些若即若离,忽明忽暗——他们很感兴趣,却远未到离不开的份上。而数据可视化无疑是串联决策层和数据层的最佳桥梁。

双赢样本

上述三个痛点也是海云数据尝试去解决的。而作为这家公司核心底层架构产品,已经发布的图易4.0(一款自助完成数据可视化的在线工具)即摆脱了传统的数据仓库模式,可同时处理结构化数据,非结构化数据和异构数据,能自动对各维度数据生成内部关联,并以友善的视觉特征完成技术数据与业务决策之间的嫁接。图易4.0可应用于航空,金融,制造,政府,医疗,快消等诸多行业,其中具体应用于航空行业的衍生产品即是DIVA。

事实上,作为信息化程度高,且标准相对统一的领域,长久以来航空行业对数据分析有着巨大需求。据介绍,DIVA能让决策层实时了解公司多维度的综合性数据,通过数据间的关联逻辑发掘数据价值,以助公司高层做出合理决策。它能把所有航班的数据,乘客数据,飞机数据,地勤和服务保障车辆数据,甚至每个摄像头数据收集而来并得以应用,目前包括东航,国泰,和马航在内等不少航空企业都与海云有过合作。

如前所述,DIVA是海云数据与安永合作后推出的首款行业级应用产品(众所周知,在全球航空行业,安永握有庞大的客户群),毫无疑问,海云最为看重安永的,是其113年历史积累下来的各个行业的知识,相信DIVA之后,当完成与安永其他领域知识的嫁接,图易4.0也会延伸出更多产品。诚如海云数据CEO冯一村所言:“我们构建了一套全新的生态模型,这套模型也形成了闭环,从数据资源开始衍生到算法模型,依靠算法模型落地到行业,形成行业知识,行业知识又会形成新的数据资源,新的数据资源又会有新的算法模型,又导致新的行业知识。所以会良性地循环起来,变成一个闭环……我们后面要做的就是复制,比如复制到快消行业,金融行业,把这种模式更多地走下去。”

当然,任何合作都是双赢,对安永而言,作为一家老牌事务所,它也需要抓住时代的步点在商业模式上发力,用更有说服力的数据信息为客户作出策略性的管理咨询和财务交易决策。

是的,回溯过去,那些被互联网率先影响的行业(比如电商和娱乐)也都被数据化浪潮率先洗礼,那么接下来,在互联网+的宏大背景下,大数据应用的下一个落脚点无疑是垂直行业的各自突围,而数据可视化分析也许将成为它们的标配。

本文转自d1net(转载)

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
数据采集 人工智能 运维
专访容智信息柴亚团:终极愿景是助力天下企业成为数字化孪生组织
最低调的公司炼出了最易用的RPA,下一步容智要助力天下企业成为数字化孪生组织(DTO)。
196 0
专访容智信息柴亚团:终极愿景是助力天下企业成为数字化孪生组织
|
存储 分布式计算 运维
|
人工智能 安全 大数据
医疗行业正从大数据中汲取回报的六个途径
科技总是源源不断地改变着世界,人工智能和大数据正在结合起来,为人们提供各种好处,其中应用最广泛的可能要数医疗行业了。
|
安全 区块链 数据安全/隐私保护
【观点】加密狗只是开始,区块链+文娱才是大趋势
从最早的极客货币,到巨头公司纷纷跑步进入区块链赛道,all in区块链,与此同时,区块链的技术应用也在不断拓展边界,草根负责吹泡沫,精英负责酿啤酒,历史的规律一直如此。
2079 0
|
数据挖掘 大数据