流计算独享模式正式邀测

简介: 近期流计算发布了一种新的售卖模式正式邀测中:独享模式。独享模式中,同时开放了一些针对数据湖场景的新功能:ETL - 数据清洗,数据同步;数据分析。

流计算 - 不止于流


流计算&独享模式

阿里云流计算(Alibaba Cloud StreamCompute,Powered by Blink)是一个一站式、高性能、稳定、易用的流式大数据处理平台,通过它,您可以快速搭建具有亿级QPS处理能力的流式大数据系统。
近期流计算发布了一种新的售卖模式:独享模式。独享模式中,同时开放了一些针对数据湖场景的新功能:
  • ETL - 数据清洗,数据同步
  • 数据分析

数据湖

Data Lake并不是一个新的概念,早在2011年就被提出,作为数仓的补充。
数据湖是一个中心化的存储,能够存储任意规模的结构化与半结构化数据。数据湖中的数据,不必经过结构化过程,即可进行各种类型的分析,如可视化,大数据处理,实时数据分析和机器学习。

数仓&数据湖

与数仓相比,数据湖中数据有以下几个特点:

在数据湖场景中,流计算有其独特优势,可完美解决数据湖场景下,结构化和半结构化数据的异构数据源计算和ETL等问题。下面以IoT场景举例说明其优势。

适应场景

典型工业化IoT场景,传感器,采集厂房中各地点的温度/湿度/压力等信息,并上传到云端做环境监控及数据分析,整体业务架构如下:

场景数据流

IoT场景中,整个系统数据分为几类:
  • IoT Device的运行日志,以文件的形式存储在OSS中
  • IoT Device采集的数据,上传到SLS/MQ/Kafka等各种数据通道类系统
  • MySQL/HBase/Redis等RDBMS/NoSQL中保存的重点监控区域设备白名单

场景业务逻辑

实时链路

离线链路

DataLake ETL

将IoT采集到的数据经过清洗,上传到数仓中做持久存储及分析

DalaLake分析

适用场景

实时BI
实时监控(CEP
离线链路

优势

功能丰富:
  • 实时/数据湖场景下ETL/分析/监控等功能集为一体
  • 20+种connector,无缝对接各种类数据源<RDBMS/NoSQL/Queue/Hive...>
  • 异构数据源计算:可使用标准SQL,对异构数据源<RDBMS/NoSQL/Queue/Hive...>直接计算<JOIN/UNION/SELECT...>
节省成本:
  • 开发成本:实时/离线各种场景中,SQL+UDF即可解决所有问题,一套SQL,实时/离线无缝切换
  • 运维成本:全托管模式,保证高SLA情况下,减轻用户运维负担
  • 存储成本:直接分析OSS/RDBMS/NoSQL/Queue/Hive...中结构化/半结构化数据,与传统数仓中,数据集中后才能分析的模式相比,对低频查询类场景,可大大节省存储成本
  • 计算成本:一个产品,支持多种计算能力,降低用户计算成本

阿里云流计算始终致力于为用户提供更丰富的功能,更强大的计算能力。
使用户以更低的成本更灵活的方式更短的时间,发掘所有数据中的价值,真正做到 DIVE INTO THE DATA,INSIGHT INTO THE FUTURE。

相关实践学习
阿里云云原生数据仓库AnalyticDB MySQL版 使用教程
云原生数据仓库AnalyticDB MySQL版是一种支持高并发低延时查询的新一代云原生数据仓库,高度兼容MySQL协议以及SQL:92、SQL:99、SQL:2003标准,可以对海量数据进行即时的多维分析透视和业务探索,快速构建企业云上数据仓库。 了解产品 https://www.aliyun.com/product/ApsaraDB/ads
相关文章
|
11月前
|
存储 人工智能 Cloud Native
【发布实录】云原生+AI,助力企业全球化业务创新
本文介绍了阿里云在云原生与AI结合领域的最新产品发布和技术创新。首先,通过弹性智能的一体化架构,阿里云为AI场景提供了开箱即用的云原生能力,助力企业出海。其次,详细解析了云原生如何助力AI应用构建,包括Function AI平台、GPU极速模式、MCP Server开发托管及AI网关等核心功能。
|
数据可视化 Shell Python
如何使用Python实现简单的数据可视化
如何使用Python实现简单的数据可视化
142 0
|
XML JSON JavaScript
【Java 微信公众号】② 接收用户消息;回复用户消息
关于重试的消息排重,推荐使用 msgid(XML 数据包中的内容) 排重 微信服务器在五秒内收不到响应会断掉连接,并重新发起请求,总共重试三次。假如服务器无法保证在五秒内处理并回复,可以直接回复空串,微信服务器不会对空串作任何处理,并且不会发起重试
1122 0
【Java 微信公众号】② 接收用户消息;回复用户消息
|
NoSQL Redis 数据库
【性能优化下】组织结构同步优化二,全量同步/增量同步,断点续传实现方式
这篇文章主要是阐述将临时表中的用户组数据/用户数组,按照既定的步骤同步到我们的正式表,过程中遇到异常中断,可以对我们的正式平台无影响,能够保证下一次同步任务过来仍然可以进行断点续传 首先全量同步和增量同步分别指什么?
417 0
|
Web App开发 测试技术
|
Web App开发 JavaScript 前端开发
Async/Await是这样简化JavaScript代码的
译者按: 在Async/Await替代Promise的6个理由中,我们比较了两种不同的异步编程方法:Async/Await和Promise,这篇博客将通过示例代码介绍Async/Await是如何简化JavaScript代码的。
1150 0
|
21天前
|
人工智能 数据可视化 安全
王炸组合!阿里云 OpenClaw X 飞书 CLI,开启 Agent 基建狂潮!(附带免费使用6个月服务器)
本文详解如何用阿里云Lighthouse一键部署OpenClaw,结合飞书CLI等工具,让AI真正“动手”——自动群发、生成科研日报、整理知识库。核心理念:未来软件应为AI而生,CLI即AI的“手脚”,实现高效、安全、可控的智能自动化。
34907 56
王炸组合!阿里云 OpenClaw X 飞书 CLI,开启 Agent 基建狂潮!(附带免费使用6个月服务器)
|
15天前
|
人工智能 自然语言处理 安全
Claude Code 全攻略:命令大全 + 实战工作流(建议收藏)
本文介绍了Claude Code终端AI助手的使用指南,主要内容包括:1)常用命令如版本查看、项目启动和更新;2)三种工作模式切换及界面说明;3)核心功能指令速查表,包含初始化、压缩对话、清除历史等操作;4)详细解析了/init、/help、/clear、/compact、/memory等关键命令的使用场景和语法。文章通过丰富的界面截图和场景示例,帮助开发者快速掌握如何通过命令行和交互界面高效使用Claude Code进行项目开发,特别强调了CLAUDE.md文件作为项目知识库的核心作用。
14133 43
Claude Code 全攻略:命令大全 + 实战工作流(建议收藏)
|
3天前
|
缓存 人工智能 自然语言处理
我对比了8个Claude API中转站,踩了不少坑,总结给你
本文是个人开发者耗时1周实测的8大Claude中转平台横向评测,聚焦Claude Code真实体验:以加权均价(¥/M token)、内部汇率、缓存支持、模型真实性及稳定性为核心指标。