最佳拍档 | 云计算+大数据+DataFlux，轻松发挥数据“原生”力-阿里云开发者社区

最佳拍档 | 云计算+大数据+DataFlux，轻松发挥数据“原生”力

2020-05-13 1372

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介：

大数据概念的提出已经超过十年时间，经过这十几年的快速发展，已经在各个领域广泛应用，而且应用效果显著。大数据大力发展的十几年，也正是云计算增长最快的时期。可以说云计算和大数据是相辅相成，互相成就的一对关系。
timg_1_jpeg
为什么说大数据和云计算是相辅相成，互相成就的？首先从大数据的几个特点来说：

数据量巨大

显而易见，数据不大不能称之为大数据，不仅数据量大，而且增长速度快。

以我们为某高校做的智慧教育项目来说，每个月采集的数据量达到上百 GB，这还是采集高压缩比的InfluxDB时序数据库存储的数据量，如果用传统的结构化数据库来存储的话，每个月的数据量可以达到 TB级别。

数据种类多：

不光文本或数字是数据，图片、音视频等都是数据。

时效性强：

与传统数仓数据挖掘不同的是，数仓是定时采集过期的数据，事后再从数仓中挖掘出有价值的数据。

而大数据是要从巨大的数据中快速的获得有价值的数据，要做到这一点，首先就是要靠强大的计算能力。

上面举例的几点来说，在非云计算的环境下是很难做到的。如上面说的巨大的数据及数据增长量，在云计算环境下，你随时可以从1T 扩展到10T、100T，计算能力不足时，随时可以从16核扩展到32核甚至64核，再不够的话从一台机器扩展到十台百台机器。云计算的高可靠性、高可扩展性、存储与处理的低成本，正好能满足大数据的要求。

以上说了大数据与云计算之间的关系，那么在大数据环境下，企业如何从一个庞大、杂乱的数据堆中获取到有价值的数据的呢？
timg_2_jpeg
上海驻云自研发的大数据统一分析平台DataFlux就可以轻松解决！

DataFlux可以通过对任何来源、类型、规模的实时数据进行监控、分析和处理，释放数据价值。

主要是有以下几个步骤：

1. 数据采集：
丰富的数据采集器，支持几百种数据源数据的采集。

2. 数据传输：
数据采集器采集到的数据，通过数据网关，经过数据网关的数据清洗后，打到中心，先进入消息队列，后面有任务消费数据队列中的数据，写入数据库，保证数据的高可靠性。

3. 数据存储：
就大数据的两大核心特点来说：数据量庞大、实时数据分析能力。就这两个核心点来说，我们使用的InfluxDB的高压缩比存储，超强查询分析能力，它是个不二选择。传统的结构化数据库根本无法满足这两点要求。
_2020_05_12_3_50_03

数据洞察：

对于大数据来说，我们需要的是数据之间的相关性价值，而不是某一个单一数据的价值。比如有一个很有意思的大数据应用例子：沃尔玛的飓风与蛋挞的例子。沃尔玛发现每当飓风来临时，不但飓风用品的销量大增，蛋挞销量也跟着大增。因此沃尔玛经常会在飓风来临时，将蛋挞放在临近飓风用品的位置，从而大大提高了蛋挞的销量。

上面例子中的飓风就是一个关键事件，通过分析各类商品的销售量曲线，发现每次蛋挞销量曲线上涨时都有一个“飓风”的关键事件，就可以得出以上结论。

数据分析预测：

配合DataFlux的函数计算平台内置大量常用的预测、转换、检测函数，可以完成更多的数据分析处理要求。另外也可以很低的入门门槛，编写自己的预测、转换、检测函数，更贴合自己的数据业务场景。

更多DataFlux详情可访问官方网站：DataFlux.cn
_2020_04_23_4_23_08