流计算概念|学习笔记

本文涉及的产品
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介: 快速学习流计算概念

开发者学堂课程【阿里云流计算使用教程流计算概念】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/432/detail/5385


流计算概念


 内容介绍

一、大数据处理流程

二、流式计算与批量计算区别

三、流计算定义

四、流计算业务架构


一、大数据处理流程

大数据处理共有四个流程:

数据发生、数据采集、数据加工、数据消费。

1. 传统处理模型:

存在问题:

(1)时延较高:整个装载数据、数据处理以及数据输出可能是数小时或数天级别,不能满足时效性很高的场景。

(2)处理单一:不支持图像、流式数据等

(3)迁移高昂:数据迁移时会产生高昂费用。

2. 下一代数据模型:

完全解决上一代存在的问题:采集实时化、计算多样化、存储共享化

 

二、流式计算与批量计算区别

1. 流式处理的出现有效的缩短了整体链路的延迟,提供另一套基于流的计算模型。

作为现有的离线批量大数据有效计算补充。

image.png

2. 从图中可以看出离线(批量)计算和流计算的区别,离线计算时批量、高时延、主动发起,流计算时持续、低时延、事件触发。

3. 从下表可以看出计算模型的区别:

 

 

批量计算

流式计算

数据范围

对数据集中的所有或大部分数据进行查询或处理

对时间窗口内的数据或仅对最近的数据记录进行查询或处理

数据大小

大批量数据

单条记录或包含几条记录的小批量数据。

性能

几分钟至几小时的延迟

只需大约几秒或几毫秒的延迟

分析

复杂分析

简单的聚合、统计型分析函数


三、流计算定义

1.流计算作为一类针对流数据的实时计算模型、流计算可有效地缩短全链路数据流时延、实时化计算逻辑、平摊计算成本,最终有效满足实时处理大数据的业务需求。

2.流数据

不同于传统的离线数据,流数据产生源头来自于源源不断的事件流,由数千个数据源持续生成的数据,流数据

通常也数据记录的形式发送,但相较干坚线数据,流数据对干平售,计管售成的时让要求较高。归结下来流数据有以下三大特点:

image.png

3. 流计算时批量计算的有效增强,特别在于对于流数据分析方面,是大数据计算是一个不可或缺的增值服务。

 

四、流计算业务架构:

第三方数据产生,到达数据计算、数据存储、最后到达业务服务。

流计算业务架构主要包括流数据采集、流数据处理、流数据集成以及流数据消费。

目录
打赏
0
0
0
0
55
分享
相关文章
数据无界、湖仓无界,Apache Doris 湖仓一体典型场景实战指南(下篇)
Apache Doris 提出“数据无界”和“湖仓无界”理念,提供高效的数据管理方案。本文聚焦三个典型应用场景:湖仓分析加速、多源联邦分析、湖仓数据处理,深入介绍 Apache Doris 的最佳实践,帮助企业快速响应业务需求,提升数据处理和分析效率
数据无界、湖仓无界,Apache Doris 湖仓一体典型场景实战指南(下篇)
流计算需要框架吗?SPL 可能是更好的选择
流数据源的动态无界特性使得传统数据库技术难以直接处理,而Heron、Samza、Storm、Spark、Flink等计算框架在流计算领域取得了先发优势。然而,这些框架往往侧重于访问能力,计算能力不足,尤其在高级计算如流批混算、复杂计算和高性能计算方面表现欠佳。esProc SPL作为基于JVM的轻量级开源计算类库,专注于提升流计算的计算能力,支持丰富的流数据访问、灵活的集成接口和高效的内外存存储格式,具备强大的高级计算功能,能够简化业务逻辑开发并适应多样的应用场景。SPL通过专业的计算语言和结构化数据处理能力,为流计算提供了更优的解决方案。
|
12月前
|
ForwardedFields:流处理中的重要概念
ForwardedFields:流处理中的重要概念
70 4
什么是流计算?请简要解释其概念和特点。
什么是流计算?请简要解释其概念和特点。
289 0
流计算与批处理的区别是什么?请举例说明。
流计算与批处理的区别是什么?请举例说明。
156 0
大数据Flink流处理相关概念
大数据Flink流处理相关概念
140 0
阿里云StreamCompute流计算架构
阿里云流计算全流程系统架构,主要包含:数据采集,流数据,流计算,数据源,数据消费这些过程。
897 0
阿里云StreamCompute流计算架构
流计算
在过去几年里,已为流计算开发了数百项应用。下面简单介绍了一些应用,着重强调了流计算支持的使用类型。面对日益增长的海量数据,精细化营销的挑战.通常电信行业会面临海量数据,异构数据,实时主动分析等挑战.
578 0
流计算

热门文章

最新文章