实时计算 Flink-博文-第44页-阿里云开发者社区-阿里云

开发者社区> 大数据与机器学习> 实时计算 Flink

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务，基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎，提高作业开发运维效率。

今日

22645

内容

活动

200628

关注

来自：大数据与机器学习

问答

jasonli4

存储 SQL 数据库

博文

Flink SQL 功能解密系列 —— 流式 TopN 挑战与实现

TopN 是统计报表和大屏非常常见的功能，主要用来实时计算排行榜。流式的 TopN 不同于批处理的 TopN，它的特点是持续的在内存中按照某个统计指标（如出现次数）计算 TopN 排行榜，然后当排行榜发生变化时，发出更新后的排行榜。

18866 1 7

阿里云实时计算Flink

SQL API 双11

博文

实时计算 Flink SQL 核心功能解密

Flink SQL 是于2017年7月开始面向集团开放流计算服务的。虽然是一个非常年轻的产品，但是到双11期间已经支撑了数千个作业，在双11期间，Blink 作业的处理峰值达到了5+亿每秒，而其中仅 Flink SQL 作业的处理总峰值就达到了3亿/秒。

20270 1 3

阿里云实时计算Flink

SQL 存储消息中间件

博文

Flink SQL 功能解密系列 —— 阿里云流计算/Blink支持的connectors

Connector 是连接外部数据和blink计算框架的桥梁，也是流计算的入口和出口。目前，blink支持了集团内部绝大多数的上下游（如下图)，详细的接入方法可以见官方文档，本文主要阐述connector设计和使用上需要注意的问题。

7839 1 2

阿里云实时计算Flink

SQL 双11 流计算

博文

Flink SQL 功能解密系列 —— 流计算“撤回(Retraction)”案例分析

通俗讲retract就是传统数据里面的更新操作，也就是说retract是流式计算场景下对数据更新的处理方式。

20582 10 12

阿里云实时计算Flink

SQL 前端开发数据库

博文

Flink SQL 功能解密系列 —— 数据去重的技巧和思考

去重逻辑在业务处理中使用广泛，大致可以分两类：DISTINCT去重和FIRST_VALUE主键去重，两者的区别是DISTINCT去重是对整行数据进行去重，比如tt里面数据可能会有重复，我们要去掉重复的数据；FIRST_VALUE是根据主键进行去重，可以看成是一种业务层面的去重，但是真实的业务场景使用也很普遍，比如一个用户有多次点击，业务上只需要取第一条。

11904 0 1

阿里云实时计算Flink

存储 SQL API

博文

【对话科技】Flink技术介绍和新功能展望

2017年6月22号，由“京城学堂”和阿里巴巴集团技术发展部主办的“对话科技”系列讲座邀请到了Apache Flink项目的PMC成员，来自德国DataArtisans公司的Till Rohrmann，在北京阿里中心为关注实时计算技术的阿里同学做了一场关于Apache Flink技术发展的精彩分享。

7227 0 1

阿里云实时计算Flink

SQL 大数据流计算

博文

Flink SQL 功能解密系列 —— 解决热点问题的大杀器MiniBatch

在Blink的流式任务中，State相关的操作通常都会成为整个任务的性能瓶颈。实时计算部-查询和优化团队开发了MiniBatch功能，大幅降低了State操作的开销，在今年的双11中，几乎所有适用的任务都启用了MiniBatch功能。

6771 0 2

隐林

存储 SQL 运维

博文

流计算StreamCompute

背景每年的双十一除了“折扣”，全世界（特别是阿里人）都关注的另一个焦点是面向媒体直播的“实时大屏”（如下图所示）。包括总成交量在内的各项指标，通过数字维度展现了双十一狂欢节这一是买家，卖家及物流小二一起创造的奇迹！双十一媒体直播大屏这一大屏背后需要实时处理海量的庞大电商系统各个模块产生的

19486 76 77

阿里云实时计算Flink

分布式计算数据处理 API

博文

流计算精品翻译: The Dataflow Model

我们提出了Dataflow模型，并详细地阐述了它的语义，设计的核心原则，以及在实践开发过程中对模型的检验。

20390 1 2

灵杰开发者

存储 Cloud Native 数据处理

博文

从嵌入式状态管理到云原生架构：Apache Flink 的演进与下一代增量计算范式

本文整理自阿里云资深技术专家、Apache Flink PMC 成员梅源在 Flink Forward Asia 新加坡 2025上的分享，深入解析 Flink 状态管理系统的发展历程，从核心设计到 Flink 2.0 存算分离架构，并展望未来基于流批一体的通用增量计算方向。

658 0 0

灵杰开发者

消息中间件存储 Kafka

博文

湖流一体：基于 Fluss+ Paimon 的实时湖仓数据底座

阿里云Fluss是面向分析场景的新一代列式流存储系统，填补“分析型+流处理”空白。它原生支持Schema、实时更新与Changelog，通过Union Read实现湖流一体，与Paimon/Iceberg无缝协同，提供秒级新鲜度、低成本回溯与统一SQL查询能力。

805 0 0

灵杰开发者

存储人工智能 Apache

博文

Apache Paimon多模态数据湖实践：从结构化到非结构化的技术演进

在Streaming Lakehouse Meetup中，Apache Paimon PMC叶俊豪分享了Paimon多模态数据湖创新：首创列分离架构（基于全局Row ID），解决AI场景下结构化特征动态变更难题；引入Blob类型，实现非结构化数据物理分离、跨引擎统一抽象与blob-as-descriptor流式加载；已支撑淘宝日均10PB多模态数据，并规划Deletion Vector、Blob Compaction及全局索引等演进。

1053 0 0