CIO新任务:让大数据变得像电影一样可视化

本文涉及的产品
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介: 着手写关于数据展示的文章时,我想起了许多年前第一次听到的一句话:机遇钟爱有准备的头脑。我可能是在一项必修科学课上偶然学到的,但更可能是在一本小说中读到的。通过google查询,我知道这句话是路易斯.巴斯德说的,出自他的观察领域的著作《dans les champs de l'observation》的序言。

着手写关于数据展示的文章时,我想起了许多年前第一次听到的一句话:机遇钟爱有准备的头脑。我可能是在一项必修科学课上偶然学到的,但更可能是在一本小说中读到的。通过google查询,我知道这句话是路易斯.巴斯德说的,出自他的观察领域的著作《dans les champs de l'observation》的序言。

  但是现在,几十年过去了,这个充斥着数据的世界却让我渐渐明白,有准备的头脑可能会出现一种消极的倾向——成为洞察力的敌人。我在想一个有准备的头脑可能会因为太有准备,酝酿太久而导致无法产生新鲜的想法。这就是所谓的积习难改,更为严重的是,一旦我们的思维定型了,危险点也许就被我们忽视了。

  CIO们在就如何收集、存储、分析和展示大数据开展工作的同时,还被赋予了应对更加困难的挑战——运用数据作为驱动业务决策的手段的重任。IT组织可以如何利用大数据?经过一年左右与专家和CIO们的试探后,我开始认为这一努力需要CIO们进入一个以往很少有人触及的领域:电影。

  三维方法:数据展示的“未来之路”

  最近汤姆.达文波特带给我一些的思考的震动,他在即将出版的关于分析的书中清晰地阐述了CIO和商业智能(BI)组织的工作不是简单的展示数据,而是要以一种能够影响业务决策的方式进行展示。在他的关于展示数据最佳方式问卷调查中,达文波特印象最深的一组把“一个非常简单的财务报告应用”做成了一个视频。这很可能是未来之路,他说,如果你看看我们是如何说服做其他事情,购买产品,自娱自乐——想想最近大家在YouTube上观看的所有聪明猫的视频——除非我们愿意通过视频来沟通分析的结果,否则它不可能每个都保持长久。

  这个案例对于展示大数据特别有说服力。一个简单的图可以用一个事情绘制另一个——就像我从代数课上学到的。添加颜色也许就能在一个图中获得三个变量。但是大数据,正如从PayPal到金融街的首席科学家们所说,可能包含上百种变量,并且这些变量正随着时间和空间而改变。万能的猫视频!什么样的数据展示才能弄明白这个。

  当然,如果你已经知道自己在寻找什么,感谢你那有准备的头脑,除了留下与少数变量相关的信息,你只是过滤掉了其他的所有信息。但是如果你不知道自己在寻找什么,如果你已经有了上PB的数据,你希望从中能发现新的关系而不是简单的为旧观点提供支撑或反驳的证据,那会怎么样?如果你想看到不带偏见处理大数据分析方式——正如我所知道的,那真是大数据分析的最高目标(the holy grail)——除了逐字逐句的看,根本没有什么其他选择。但是,怎样做呢?

  我想,这就是为什么要有电影,为什么财务业绩通过视频可以给象达文波特这样老练的分析家留下如此深刻的印象。电影呈现出三维空间;它让我们看见时间的流逝。颜色、纹理甚至声音的应用为我们描绘出了更多的变数。我们所熟知的世界就是三维的,有声电影会被人们当作真实的经历。

  现在的CIO们必须让大数据看起来像那个真实的世界。是否所有可用来表现数据分析软件工具都已存在了?当然不是;达文波特的观点是他们还相当不成熟。但是每个我们见到的计算机制作出的动画都向我们展示了一条前进的道路。詹姆斯.卡梅隆在《阿凡达》中使用的软件工具,象Autodesk Maya和Zbrush,都可以找到一种方式进入到CIO的组件中。灯光、摄像、开始!拿我来说,我就期待在电影中的大数据。据我推测企业也是一样在期待。正如另一位哲人所说,观察能让你学会很多。

【了解更多商业智能行业资讯,商业智能解决方案以及商业智能软件下载请访问FineBI商业智能官网www.finebi.com】

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
目录
相关文章
|
3月前
|
SQL 分布式计算 运维
如何对付一个耗时6h+的ODPS任务:慢节点优化实践
本文描述了大数据处理任务(特别是涉及大量JOIN操作的任务)中遇到的性能瓶颈问题及其优化过程。
|
2月前
|
消息中间件 监控 数据可视化
大数据-79 Kafka 集群模式 集群监控方案 JavaAPI获取集群指标 可视化监控集群方案: jconsole、Kafka Eagle
大数据-79 Kafka 集群模式 集群监控方案 JavaAPI获取集群指标 可视化监控集群方案: jconsole、Kafka Eagle
65 2
|
4月前
|
SQL 分布式计算 DataWorks
DataWorks产品使用合集之如何开发ODPS Spark任务
DataWorks作为一站式的数据开发与治理平台,提供了从数据采集、清洗、开发、调度、服务化、质量监控到安全管理的全套解决方案,帮助企业构建高效、规范、安全的大数据处理体系。以下是对DataWorks产品使用合集的概述,涵盖数据处理的各个环节。
|
2月前
|
存储 分布式计算 资源调度
大数据-04-Hadoop集群 集群群起 NameNode/DataNode启动 3台公网云 ResourceManager Yarn HDFS 集群启动 UI可视化查看 YarnUI(一)
大数据-04-Hadoop集群 集群群起 NameNode/DataNode启动 3台公网云 ResourceManager Yarn HDFS 集群启动 UI可视化查看 YarnUI(一)
78 5
|
2月前
|
资源调度 数据可视化 大数据
大数据-04-Hadoop集群 集群群起 NameNode/DataNode启动 3台公网云 ResourceManager Yarn HDFS 集群启动 UI可视化查看 YarnUI(二)
大数据-04-Hadoop集群 集群群起 NameNode/DataNode启动 3台公网云 ResourceManager Yarn HDFS 集群启动 UI可视化查看 YarnUI(二)
36 4
|
2月前
|
资源调度 分布式计算 大数据
大数据-111 Flink 安装部署 YARN部署模式 FlinkYARN模式申请资源、提交任务
大数据-111 Flink 安装部署 YARN部署模式 FlinkYARN模式申请资源、提交任务
107 0
|
4月前
|
数据可视化 大数据
【Echarts大屏】大数据平台可视化大屏
【Echarts大屏】大数据平台可视化大屏
【Echarts大屏】大数据平台可视化大屏
|
4月前
|
SQL 分布式计算 数据可视化
基于Hadoop的大数据可视化方法
【8月更文第28天】在大数据时代,有效地处理和分析海量数据对于企业来说至关重要。Hadoop作为一个强大的分布式数据处理框架,能够处理PB级别的数据量。然而,仅仅完成数据处理还不够,还需要将这些数据转化为易于理解的信息,这就是数据可视化的重要性所在。本文将详细介绍如何使用Hadoop处理后的数据进行有效的可视化分析,并会涉及一些流行的可视化工具如Tableau、Qlik等。
141 0
|
4月前
|
SQL 分布式计算 DataWorks
DataWorks操作报错合集之如何解决datax同步任务时报错ODPS-0410042:Invalid signature value
DataWorks是阿里云提供的一站式大数据开发与治理平台,支持数据集成、数据开发、数据服务、数据质量管理、数据安全管理等全流程数据处理。在使用DataWorks过程中,可能会遇到各种操作报错。以下是一些常见的报错情况及其可能的原因和解决方法。
|
4月前
|
监控 数据可视化 前端开发
【前端】政务服务大数据可视化监控平台(源码+html+css+js)
【前端】政务服务大数据可视化监控平台(源码+html+css+js)