流计算独享模式正式邀测

本文涉及的产品
实时计算 Flink 版,5000CU*H 3个月
简介: 近期流计算发布了一种新的售卖模式正式邀测中:独享模式。独享模式中,同时开放了一些针对数据湖场景的新功能:ETL - 数据清洗,数据同步;数据分析。

流计算 - 不止于流

572001635db43e168ec86dea191b90facfefc1dd

流计算&独享模式

阿里云流计算(Alibaba Cloud StreamCompute,Powered by Blink)是一个一站式、高性能、稳定、易用的流式大数据处理平台,通过它,您可以快速搭建具有亿级QPS处理能力的流式大数据系统。
近期流计算发布了一种新的售卖模式:独享模式。独享模式中,同时开放了一些针对数据湖场景的新功能:
  • ETL - 数据清洗,数据同步
  • 数据分析

数据湖

Data Lake并不是一个新的概念,早在2011年就被提出,作为数仓的补充。
数据湖是一个中心化的存储,能够存储任意规模的结构化与半结构化数据。数据湖中的数据,不必经过结构化过程,即可进行各种类型的分析,如可视化,大数据处理,实时数据分析和机器学习。

数仓&数据湖

与数仓相比,数据湖中数据有以下几个特点:

56d9b6a6e35125785da5294b601f0861671893c9
在数据湖场景中,流计算有其独特优势,可完美解决数据湖场景下,结构化和半结构化数据的异构数据源计算和ETL等问题。下面以IoT场景举例说明其优势。

适应场景

典型工业化IoT场景,传感器,采集厂房中各地点的温度/湿度/压力等信息,并上传到云端做环境监控及数据分析,整体业务架构如下:
1528537808768-3c0c6a2c-7f34-47ca-b4af-76

场景数据流

IoT场景中,整个系统数据分为几类:
  • IoT Device的运行日志,以文件的形式存储在OSS中
  • IoT Device采集的数据,上传到SLS/MQ/Kafka等各种数据通道类系统
  • MySQL/HBase/Redis等RDBMS/NoSQL中保存的重点监控区域设备白名单

场景业务逻辑

实时链路

1528539281605-fabe0b9d-16bb-479a-80c2-e6

离线链路

DataLake ETL

1528539921993-287173f5-561a-4934-b8af-e4
将IoT采集到的数据经过清洗,上传到数仓中做持久存储及分析

DalaLake分析

1528540179432-ff72c1c8-2ac7-4602-8eef-93

适用场景

实时BI
实时监控(CEP
离线链路

优势

功能丰富:
  • 实时/数据湖场景下ETL/分析/监控等功能集为一体
  • 20+种connector,无缝对接各种类数据源<RDBMS/NoSQL/Queue/Hive...>
  • 异构数据源计算:可使用标准SQL,对异构数据源<RDBMS/NoSQL/Queue/Hive...>直接计算<JOIN/UNION/SELECT...>
节省成本:
  • 开发成本:实时/离线各种场景中,SQL+UDF即可解决所有问题,一套SQL,实时/离线无缝切换
  • 运维成本:全托管模式,保证高SLA情况下,减轻用户运维负担
  • 存储成本:直接分析OSS/RDBMS/NoSQL/Queue/Hive...中结构化/半结构化数据,与传统数仓中,数据集中后才能分析的模式相比,对低频查询类场景,可大大节省存储成本
  • 计算成本:一个产品,支持多种计算能力,降低用户计算成本

阿里云流计算始终致力于为用户提供更丰富的功能,更强大的计算能力。
使用户以更低的成本更灵活的方式更短的时间,发掘所有数据中的价值,真正做到 DIVE INTO THE DATA,INSIGHT INTO THE FUTURE。

相关实践学习
AnalyticDB MySQL海量数据秒级分析体验
快速上手AnalyticDB MySQL,玩转SQL开发等功能!本教程介绍如何在AnalyticDB MySQL中,一键加载内置数据集,并基于自动生成的查询脚本,运行复杂查询语句,秒级生成查询结果。
阿里云云原生数据仓库AnalyticDB MySQL版 使用教程
云原生数据仓库AnalyticDB MySQL版是一种支持高并发低延时查询的新一代云原生数据仓库,高度兼容MySQL协议以及SQL:92、SQL:99、SQL:2003标准,可以对海量数据进行即时的多维分析透视和业务探索,快速构建企业云上数据仓库。 了解产品 https://www.aliyun.com/product/ApsaraDB/ads
相关文章
|
2月前
|
SQL 监控 关系型数据库
实时计算 Flink版产品使用问题之如何查看作业实时流入的带宽大小
实时计算Flink版作为一种强大的流处理和批处理统一的计算框架,广泛应用于各种需要实时数据处理和分析的场景。实时计算Flink版通常结合SQL接口、DataStream API、以及与上下游数据源和存储系统的丰富连接器,提供了一套全面的解决方案,以应对各种实时计算需求。其低延迟、高吞吐、容错性强的特点,使其成为众多企业和组织实时数据处理首选的技术平台。以下是实时计算Flink版的一些典型使用合集。
|
2月前
|
存储 DataWorks 数据库
实时数仓 Hologres产品使用合集之如何计费
实时数仓Hologres是阿里云推出的一款高性能、实时分析的数据库服务,专为大数据分析和复杂查询场景设计。使用Hologres,企业能够打破传统数据仓库的延迟瓶颈,实现数据到决策的无缝衔接,加速业务创新和响应速度。以下是Hologres产品的一些典型使用场景合集。
|
3月前
|
存储 SQL 监控
|
4月前
|
分布式计算 DataWorks 大数据
MaxCompute产品使用问题之计算资源有优先级吗
MaxCompute作为一款全面的大数据处理平台,广泛应用于各类大数据分析、数据挖掘、BI及机器学习场景。掌握其核心功能、熟练操作流程、遵循最佳实践,可以帮助用户高效、安全地管理和利用海量数据。以下是一个关于MaxCompute产品使用的合集,涵盖了其核心功能、应用场景、操作流程以及最佳实践等内容。
|
3月前
|
存储 运维 监控
|
4月前
|
分布式计算 DataWorks 大数据
MaxCompute产品使用问题之很多任务出现延迟,是什么原因
MaxCompute作为一款全面的大数据处理平台,广泛应用于各类大数据分析、数据挖掘、BI及机器学习场景。掌握其核心功能、熟练操作流程、遵循最佳实践,可以帮助用户高效、安全地管理和利用海量数据。以下是一个关于MaxCompute产品使用的合集,涵盖了其核心功能、应用场景、操作流程以及最佳实践等内容。
|
5月前
|
关系型数据库 MySQL OLAP
PolarDB +AnalyticDB Zero-ETL :免费同步数据到ADB,享受数据流通新体验
Zero-ETL是阿里云瑶池数据库提供的服务,旨在简化传统ETL流程的复杂性和成本,提高数据实时性。降低数据同步成本,允许用户快速在AnalyticDB中对PolarDB数据进行分析,降低了30%的数据接入成本,提升了60%的建仓效率。 Zero-ETL特性包括免费的PolarDB MySQL联邦分析和PolarDB-X元数据自动同步,提供一体化的事务处理和数据分析,并能整合多个数据源。用户只需简单配置即可实现数据同步和实时分析。
|
存储 SQL 数据可视化
EMR Serverless StarRocks 5000CU*时免费试用——体验极致性能和全面 OLAP 分析
EMR Serverless StarRocks 5000CU*H 计算资源,48000GB*H存储资源免费试用进行中,提供极致的性能和丰富的 OLAP 场景模型,包括 OLAP 多维分析、数据湖分析、高并发查询以及实时数据分析,快来体验吧!
1482 0
EMR Serverless StarRocks 5000CU*时免费试用——体验极致性能和全面 OLAP 分析
|
存储 SQL 弹性计算
实时数仓Hologres新一代弹性计算组实例技术揭秘
实时数仓Hologres新一代弹性计算组实例技术揭秘
1970 0
实时数仓Hologres新一代弹性计算组实例技术揭秘
|
SQL 存储 分布式计算
数仓架构“瘦身”,Hologres 5000CU时免费试用
Hologres基于创新的HSAP架构,可以将您原先数仓架构中的OLAP系统(Greenplum、Presto、Impala、ClickHouse)、KV数据库/Serving系统(HBase、Redis)统一在一个大数据计算引擎中,并提供快速的离线实时一体化分析能力。
195 0