实时计算 Flink-博文-第42页-阿里云开发者社区-阿里云

阿里云实时计算Flink

|

流计算资源调度消息中间件

|

博文

Apache Flink 的迁移之路，2 年处理效果提升 5 倍

在 2017 年上半年以前，TalkingData 的 App Analytics 和 Game Analytics 两个产品，流式框架使用的是自研的 td-etl-framework。该框架降低了开发流式任务的复杂度，对于不同的任务只需要实现一个 changer 链即可，并且支持水平扩展，性能尚可，曾经可以满足业务需求。

10222 2 2

阿里云实时计算Flink

|

流计算网络协议 Apache

|

博文

咱们从头到尾讲一次 Flink 网络流控和反压剖析

文章将从网络流控的概念与背景、TCP的流控机制、Flink TCP-based 反压机制（before V1.5）、Flink Credit-based 反压机制（since V1.5）、总结与思考等几个方面进行分享。

6906 1 3

阿里云实时计算Flink

|

流计算资源调度容器

|

博文

Apache Flink 进阶（六）：Flink 作业执行深度解析

本文根据 Apache Flink 系列直播课程整理而成，由 Apache Flink Contributor、网易云音乐实时计算平台研发工程师岳猛分享。主要分享内容为 Flink Job 执行作业的流程，文章将从两个方面进行分享：一是如何从 Program 到物理执行计划，二是生成物理执行计划后该如何调度和执行。

5229 0 0

阿里云实时计算Flink

|

存储机器学习/深度学习运维

|

博文

Ververica Platform-阿里巴巴全新Flink企业版揭秘

本文主要从Ververica由来开始谈起，着重讲了Ververica Platform的四个核心插件App Manager、Libra Service、Stream Ledger、Gemini，以及阿里巴巴实时计算云原生版本相关特性及典型应用场景。

7303 1 2

阿里云实时计算Flink

|

流计算缓存监控

|

博文

深入了解 Flink 网络栈（二）：监控、指标和处理背压

在之前的文章中，我们从高级抽象到底层细节各个层面全面介绍了 Flink 网络栈的工作机制。作为这一系列的第二篇文章，本文将在第一篇的基础上更进一步，主要探讨如何监视与网络相关的指标，从而识别背压等因素带来的影响，或找出吞吐量和延迟的瓶颈所在。

9175 0 0

阿里云实时计算Flink

|

流计算存储监控

|

博文

日均百亿级日志处理：微博基于 Flink 的实时计算平台建设

传统基于 Hadoop 生态的离线数据存储计算方案已在业界形成统一的默契，但受制于离线计算的时效性制约，越来越多的数据应用场景已从离线转为实时。微博广告实时数据平台以此为背景进行设计与构建，目前该系统已支持日均处理日志数量超过百亿，接入产品线、业务日志类型若干。

8180 1 2

阿里云实时计算Flink

|

流计算 Java Apache

|

博文

Apache Flink 进阶（五）：数据类型和序列化

本文根据 Apache Flink 系列直播整理而成，由 Apache Flink Contributor、360 数据开发高级工程师马庆祥老师分享。文章主要从如何为Flink量身定制的序列化框架、Flink序列化的最佳实践、Flink通信层的序列化以及问答环节四部分分享。

9068 0 0

阿里云实时计算Flink

|

流计算机器学习/深度学习 SQL

|

博文

一文带你了解 Flink Forward 柏林站全部重点内容

阿里巴巴这次共派出了包括笔者在内的3名讲师，总共参加了4场分享和2个问答环节。在这里，我会根据自己参与的议题给大家做一下这次会议整体的一个介绍和个人在这次参会过程里面的感受和思考，希望对感兴趣的同学有所帮助。

3534 0 0

Ververica

|

流计算机器学习/深度学习 SQL

|

博文

一文带你了解 Flink Forward 柏林站全部重点内容

阿里巴巴这次共派出了包括笔者在内的3名讲师，总共参加了4场分享和2个问答环节。在这里，我会根据自己参与的议题给大家做一下这次会议整体的一个介绍和个人在这次参会过程里面的感受和思考，希望对感兴趣的同学有所帮助。

1482 0 1

阿里云实时计算Flink

|

流计算 SQL 监控

|

博文

从 Storm 到 Flink，汽车之家基于 Flink 的实时 SQL 平台设计思路与实践

汽车之家的实时 SQL 平台设计思路与实践，主要从架构及设计思路、基于 Flink SQL 平台的实时数仓的实践及使用案例、后续规划。

8509 3 5

阿里云实时计算Flink

|

索引流计算消息中间件

|

博文

Flink 实时写入数据到 ElasticSearch 性能调优

线上业务反应使用 Flink 消费上游 kafka topic 里的轨迹数据出现 backpressure，数据积压严重。单次 bulk 的写入量为：3000/50mb/30s，并行度为 48。针对该问题，为了避免影响线上业务申请了一个与线上集群配置相同的 ES 集群。

6164 0 0

阿里云实时计算Flink

|

容器流计算资源调度

|

博文

Apache Flink 进阶（四）：Flink on Yarn/K8s 原理剖析及实践

本文主要介绍 Flink on Yarn/K8s 的原理及应用实践，文章将从 Flink 架构、Flink on Yarn 原理及实践、Flink on Kubernetes 原理剖析三部分内容进行分享并对 Flink on Yarn/Kubernetes 中存在的部分问题进行了解答。

5907 1 2

阿里云实时计算Flink

|

消息中间件 Kafka 流计算

|

博文

Flink Kafka Connector 与 Exactly Once 剖析

Flink Kafka Connector 是 Flink 内置的 Kafka 连接器，它包含了从 Kafka Topic 读入数据的 Flink Kafka Consumer 以及向 Kafka Topic 写出数据的 Flink Kafka Producer，除此之外 Flink Kafa Connector 基于 Flink Checkpoint 机制提供了完善的容错能力。

5735 0 0

阿里云实时计算Flink

|

流计算大数据 Apache

|

博文

重磅揭晓！Flink Forward Asia 2019 议程完整出炉

60 年前，人工智能的诞生刷新了人类对技术的期待；过去 10 年，大数据、云计算等核心技术的发展，推动了整个社会的重构与革新；5 年时间，移动互联网从诞生到逐步实现万物互联，数据在现实中的边界正在不断被拓展；技术迭变的进程不断加快，新兴技术的涌现昼夜不停。

10821 12 13

阿里云实时计算Flink

|

流计算 API Scala

|

博文

Flink SQL 系列 | 5 个 TableEnvironment 我该用哪个？

本文为 Flink SQL 系列文章的第二篇，前面对 Flink 1.9 Table 新架构及 Planner 的使用进行了详细说明，本文详细讲解 5 个 TableEnvironment 及其适用场景，并介绍 Flink 社区对 TableEnvironment 的未来规划。

6321 1 2

阿里云实时计算Flink

|

消息中间件 Kafka 流计算

|

博文

如何构建批流一体数据融合平台的一致性语义保证？

本文根据陈肃老师在 Apache Kafka x Flink Meetup 深圳站的分享整理而成，文章首先将从数据融合角度，谈一下 DataPipeline 对批流一体架构的看法，以及如何设计和使用一个基础框架。其次，数据的一致性是进行数据融合时最基础的问题。

5531 0 1

阿里云实时计算Flink

|

大数据分布式计算流计算

|

博文

阿里巴巴高级技术专家章剑锋：大数据发展的 8 个要点

章剑锋（简锋），开源界老兵，Apache Member，曾就职于 Hortonworks，目前在阿里巴巴计算平台事业部任高级技术专家，并同时担任 Apache Tez、Livy 、Zeppelin 三个开源项目的 PMC ，以及 Apache Pig 的 Committer。

8744 0 0

阿里云实时计算Flink

|

流计算资源调度 Java

|

博文

Flink on YARN（下）：常见问题与排查思路

上篇分享了基于 FLIP-6 重构后的资源调度模型介绍 Flink on YARN 应用启动全流程，本文将根据社区大群反馈，解答客户端和 Flink Cluster 的常见问题，分享相关问题的排查思路。

20368 2 5

阿里云实时计算Flink

|

资源调度容器流计算

|

博文

Flink on YARN（上）：一张图轻松掌握基础架构与启动流程

本文基于FLIP-6重构后的资源调度模型介绍Flink on YARN应用启动全流程，解答客户端和Flink Cluster的常见问题，分享相关问题的排查思路。

10557 76 77

付空

|

流计算 NoSQL Redis

|

博文

基于Flink和规则引擎的实时风控解决方案

对一个互联网产品来说，典型的风控场景包括：注册风控、登陆风控、交易风控、活动风控等，而风控的最佳效果是防患于未然，所以事前事中和事后三种实现方案中，又以事前预警和事中控制最好。这要求风控系统一定要有实时性。

14742 155 164

阿里云实时计算Flink

|

流计算存储 Apache

|

博文

Apache Flink 进阶（三）：Checkpoint 原理解析与应用实践

大家好，今天我将跟大家分享一下 Flink 里面的 Checkpoint，共分为四个部分。首先讲一下 Checkpoint 与 state 的关系，然后介绍什么是 state，第三部分介绍如何在 Flink 中使用state，第四部分则介绍 Checkpoint 的执行机制。

10522 2 3

阿里云实时计算Flink

|

流计算 API SQL

|

博文

开篇 | 揭秘 Flink 1.9 新架构，Blink Planner 你会用了吗？

本文为 Apache Flink 新版本重大功能特性解读之 Flink SQL 系列文章的开篇，Flink SQL 系列文章由其核心贡献者们分享，涵盖基础知识、实践、调优、内部实现等各个方面，带你由浅入深地全面了解 Flink SQL。

7895 0 0

小白薇薇

|

流计算容器 Kubernetes

|

博文

实时计算Flink云原生版本正式发布

Why Flink on Kubernetes Apache Flink是Apache社区的顶级开源项目，主攻流计算领域，具备高吞吐，低延时的特点，在流计算领域已经取代了storm/spark streaming，成为了目前流式处理领域的最热门引擎。

3040 0 0

阿里云实时计算Flink

|

SQL 缓存 API

|

博文

Apache Flink 进阶入门（二）：Time 深度解析

Flink 的 API 大体上可以划分为三个层次：处于最底层的 ProcessFunction、中间一层的 DataStream API 和最上层的 SQL/Table API，这三层中的每一层都非常依赖于时间属性。

4997 1 2

阿里云实时计算Flink

|

流计算 Apache 存储

|

博文

Flink Checkpoint 问题排查实用指南

本文会统一聊一聊 Flink 中 Checkpoint 异常的情况（包括失败和慢），以及可能的原因和排查思路。

14358 0 1

阿里云实时计算Flink

|

缓存调度 Apache

|

博文

Apache Flink 进阶（一）：Runtime 核心机制剖析

Flink 的整体架构如图 1 所示。Flink 是可以运行在多种不同的环境中的，例如，它可以通过单进程多线程的方式直接运行，从而提供调试的能力。它也可以运行在 Yarn 或者 K8S 这种资源管理系统上面，也可以在各种云环境中执行。

30337 0 1

阿里云实时计算Flink

|

SQL Apache 算法框架/工具

|

博文

回顾 | Apache Flink Meetup ·上海站（附PPT下载链接）

9 月 7 日，Apache Flink Meetup 上海站，上海的同学再次演绎了站无虚席的爆满场面。现场来自阿里巴巴、intel、趣头条的技术专家们分享了 Zeppelin 中玩转 Flink 与 Hive、趣头条的应用实践、Flink 性能优化、TensorFlow 与 Flink 的应用实践等众多干货内容，并有 Demo 演示环节。

3198 0 0

阿里云实时计算Flink

|

流计算 SQL 监控

|

博文

Apache Flink 在同程艺龙实时计算平台的研发与应用实践

本文主要介绍 Apache Flink 在同程艺龙的应用实践，从当前同程艺龙实时计算平台现状、建设过程、易用性提升、稳定性优化四方面分享了同城艺龙实时计算平台的建设经验，供大家参考。

2163 0 0

阿里云实时计算Flink

|

流计算大数据消息中间件

|

博文

如果你也想做实时数仓…

数据仓库也是公司数据发展到一定规模后必然会提供的一种基础服务，数据仓库的建设也是“数据智能”中必不可少的一环。本文将从数据仓库的简介、经历了怎样的发展、如何建设、架构演变、应用案例以及实时数仓与离线数仓的对比六个方面全面分享关于数仓的详细内容。

2907 0 0

阿里云实时计算Flink

|

流计算调度缓存

|

博文

Apache Flink 进阶（一）：Runtime 核心机制剖析

本文主要介绍 Flink Runtime 的作业执行的核心机制。首先介绍 Flink Runtime 的整体架构以及 Job 的基本执行流程，然后介绍在这个过程，Flink 是怎么进行资源管理、作业调度以及错误恢复的。最后，本文还将简要介绍 Flink Runtime 层当前正在进行的一些工作。

2688 0 1

小白薇薇

|

流计算容器 Kubernetes

|

博文

Flink产品介绍目前实时计算的产品已经有两种模式，即共享模式和独享模式。这两种模式都是全托管方式，这种托管方式下用户不需要关心整个集群的运维。其次，共享模式和独享模式使用的都是Blink引擎。这两种模式为用户提供的主要功能也类似，都提供开发控制台；开发使用的都是Blink SQL，其中独享模式由于进入了用户的VPC，部署在用户的ECS上，因此可以使用很多底层的API，如UDX；都提供一套的开箱即用的metric收集、展示功能；都提供作业监控和报警功能。

5589 0 0

阿里云实时计算Flink

|

Python API 流计算

|

博文

如何在 Apache Flink 中使用 Python API？

为大家介绍 Flink Python API 的现状及未来规划，主要内容包括：Apache Flink Python API 的前世今生和未来发展；Apache Flink Python API 架构及开发环境搭建；Apache Flink Python API 核心算子介绍及应用。

6449 0 0

阿里云实时计算Flink

|

流计算 Apache Python

|

博文

Apache Flink Meetup 北京站，可能有你最想听的技术干货！

9 月 21日，Flink 社区邀请了来自小米、贝壳找房、intel 以及 Apache Flink PMC 相聚北京，解读 Flink 在大型企业应用实践、实时数仓建设、性能优化以及 Flink 1.9 重大新增功能特性。

1619 0 0

阿里云实时计算Flink

|

SQL 流计算消息中间件

|

博文

Flink 1.9 实战：使用 SQL 读取 Kafka 并写入 MySQL

《Flink SQL 1.9.0 技术内幕和最佳实践》，许多小伙伴对演示环节的 Demo 代码非常感兴趣，迫不及待地想尝试下，所以写了这篇文章分享下这份代码。

13910 0 3

阿里云实时计算Flink

|

流计算 Apache 人工智能

|

博文

回顾 | Kafka x Flink Meetup 与世界人工智能大会大数据 AI 专场精彩回顾（附PPT下载）

8 月最后一天，由 Apache Kafka 与 Apache Flink 联合举办的 Meetup 深圳站圆满落幕，现场站无虚席，来自 Confluent 、中国农业银行、虎牙直播、数见科技以及阿里巴巴的五位技术专家带来了丰富精彩的分享，全场干货满满！

14670 0 0

阿里云实时计算Flink

|

消息中间件 Kafka 流计算

|

博文

如何正确使用 Flink Connector？

本文主要分享 Flink connector 相关内容，分为以下三个部分的内容：第一部分会首先介绍一下 Flink Connector 有哪些。第二部分会重点介绍在生产环境中经常使用的 kafka connector 的基本的原理以及使用方法。第三部分答疑，对社区反馈的问题进行答疑。

11986 0 1

阿里云实时计算Flink

|

API SQL 流计算

|

博文

Apache Flink 零基础入门（七）：Table API 编程

本文主要包含三部分：第一部分，主要介绍什么是 Table API，从概念角度进行分析，让大家有一个感性的认识；第二部分，从代码的层面介绍怎么使用 Table API；第三部分，介绍 Table API 近期的动态。

3253 0 0

阿里云实时计算Flink

|

SQL HIVE 流计算

|

博文

如何在 Flink 1.9 中使用 Hive？

Apache Flink 从 1.9.0 版本开始增加了与 Hive 集成的功能，用户可以通过 Flink 来访问 Hive 的元数据，以及读写 Hive 中的表。本文将主要从项目的设计架构、最新进展、使用说明等方面来介绍这一功能。

5882 0 0

阿里云实时计算Flink

|

流计算 API SQL

|

博文

修改代码150万行！与 Blink 合并后的 Apache Flink 1.9.0 究竟有哪些重大变更？

早在今年1月，阿里便宣布将内部过去几年打磨的大数据处理引擎 Blink 进行开源并向 Apache Flink 贡献代码。Flink 1.9.0 版本在结构上有重大变更，修改代码达 150 万行，本文将梳理 Flink 1.9.0 中非常值得关注的重大变更与新增功能特性。

4875 0 1

阿里云实时计算Flink

|

流计算 API SQL

|

博文

Apache Flink 1.9重磅发布！首次合并阿里内部版本Blink重要功能

8月22日，Apache Flink 1.9.0 版本正式发布，本文对此次发版中重要功能特性进行说明，包括批处理作业的批式恢复，以及 Table API 和 SQL 的基于 Blink 的新查询引擎（预览版）State Processor API等等众多社区迫切关注的新特性。

3241 0 0

阿里云实时计算Flink

|

流计算 Apache

|

博文

接着！！Apache Flink 全领域干货合集（持续更新）

Apache Flink 下一代开源大数据计算引擎，可对有限数据流和无限数据流进行有状态计算，可部署在各种集群环境，对各种大小的数据规模进行快速计算。Flink 1.9.0 发布，在批流融合与功能特性上有重大更新，本专题将持续更新新增特性的具体说明及全领域干货。

17123 0 2

阿里云实时计算Flink

|

SQL 容器流计算

|

博文

Apache Flink 零基础入门（八）： SQL 编程实践

本文是 Apache Flink 零基础入门系列文章第八篇，将通过五个实例讲解 Flink SQL 的编程实践。

4427 0 2

阿里云实时计算Flink

|

流计算 SQL Apache

|

博文

超强攻略！看完拿 Apache Flink 极客挑战赛全场最佳「MVP」

垃圾图片分类与 Flink TPC-DS 性能优化两大赛题重要知识点及相关工具解析。

3359 0 0

阿里云实时计算Flink

|

流计算监控微服务

|

博文

监控系统哪家强？eBay 在监控系统上的实践应用！

本文将分享监控系统 Flink 的现状，具体讲述 Flink 在监控系统上的实践和应用，希望给同业人员一些借鉴和启发。

2598 0 1

阿里云实时计算Flink

|

流计算大数据 Apache

|

博文

史上超强阵容！大数据及人工智能领域顶级盛会，Flink Forward Asia 2019 不容错过！

Flink Forward 大数据、人工智能领域的顶级大会，旨在汇集一流人才共同探讨大数据、云计算、人工智能、机器学习等领先技术，2019 Flink Forward Asia 重磅开启，征集议题中！

10391 0 0

阿里云实时计算Flink

|

流计算 Apache 大数据

|

博文

首届！Apache Flink 极客挑战赛强势来袭，重磅奖项等你拿，快来组队报名啦

7 月 24 日，阿里云峰会上海开发者大会开源大数据专场，阿里巴巴集团副总裁、计算平台事业部总裁贾扬清与英特尔高级首席工程师、大数据分析和人工智能创新院院长戴金权共同发布首届 Apache Flink 极客挑战赛。欢迎报名参赛！

2532 0 0

阿里云实时计算Flink

|

流计算 SQL HIVE

|

博文

小红书如何实现高效推荐？解密背后的大数据计算平台架构

小红书作为生活分享类社区，目前有8500万用户，年同比增长为300%，大约每天有30亿条笔记在发现首页进行展示。推荐是小红书非常核心且重要的场景之一，本文主要分享在推荐业务场景中小红书的实时计算应用。

9955 0 0

阿里云实时计算Flink

|

流计算资源调度运维

|

博文

58 集团大规模 Storm 任务平滑迁移至 Flink 的秘密

本文主要讲述 58 实时计算平台如何优化 Flink-Storm 以及基于 Flink-Storm 实现真实场景下大规模 Storm 任务平滑迁移 Flink。

3210 1 1

阿里云实时计算Flink

|

API 流计算存储

|

博文

Apache Flink 零基础入门教程（六）：状态管理及容错机制

本文主要分享内容如下：状态管理的基本概念；状态的类型与使用示例；容错机制与故障恢复；

6580 0 0

阿里云实时计算Flink

|

流计算 API 存储

|

博文

Apache Flink 零基础入门（五）：流处理核心组件 Time&Window 深度解析

为什么要有 Window； Window 中的三个核心组件：WindowAssigner、Trigger 和 Evictor；Window 中怎么处理乱序数据，乱序数据是否允许延迟，以及怎么处理迟到的数据；最后我们梳理了整个 Window 的数据流程，以及 Window 中怎么保证 Exactly

4761 0 0

实时计算 Flink

最新

博文

免费试用

视频

学习

电子书

活动

问答

Apache Flink 的迁移之路，2 年处理效果提升 5 倍

咱们从头到尾讲一次 Flink 网络流控和反压剖析

Apache Flink 进阶（六）：Flink 作业执行深度解析

Ververica Platform-阿里巴巴全新Flink企业版揭秘

深入了解 Flink 网络栈（二）：监控、指标和处理背压

日均百亿级日志处理：微博基于 Flink 的实时计算平台建设

Apache Flink 进阶（五）：数据类型和序列化

一文带你了解 Flink Forward 柏林站全部重点内容

一文带你了解 Flink Forward 柏林站全部重点内容

从 Storm 到 Flink，汽车之家基于 Flink 的实时 SQL 平台设计思路与实践

Flink 实时写入数据到 ElasticSearch 性能调优

Apache Flink 进阶（四）：Flink on Yarn/K8s 原理剖析及实践

Flink Kafka Connector 与 Exactly Once 剖析

重磅揭晓！Flink Forward Asia 2019 议程完整出炉

Flink SQL 系列 | 5 个 TableEnvironment 我该用哪个？

如何构建批流一体数据融合平台的一致性语义保证？

阿里巴巴高级技术专家章剑锋：大数据发展的 8 个要点

Flink on YARN（下）：常见问题与排查思路

Flink on YARN（上）：一张图轻松掌握基础架构与启动流程

基于Flink和规则引擎的实时风控解决方案

Apache Flink 进阶（三）：Checkpoint 原理解析与应用实践

开篇 | 揭秘 Flink 1.9 新架构，Blink Planner 你会用了吗？

实时计算Flink云原生版本正式发布

Apache Flink 进阶入门（二）：Time 深度解析

Flink Checkpoint 问题排查实用指南

Apache Flink 进阶（一）：Runtime 核心机制剖析

回顾 | Apache Flink Meetup ·上海站（附PPT下载链接）

Apache Flink 在同程艺龙实时计算平台的研发与应用实践

如果你也想做实时数仓…

Apache Flink 进阶（一）：Runtime 核心机制剖析

实时计算Flink on Kubernetes产品模式介绍

如何在 Apache Flink 中使用 Python API？

Apache Flink Meetup 北京站，可能有你最想听的技术干货！

Flink 1.9 实战：使用 SQL 读取 Kafka 并写入 MySQL

回顾 | Kafka x Flink Meetup 与世界人工智能大会大数据 AI 专场精彩回顾（附PPT下载）

如何正确使用 Flink Connector？

Apache Flink 零基础入门（七）：Table API 编程

如何在 Flink 1.9 中使用 Hive？

修改代码150万行！与 Blink 合并后的 Apache Flink 1.9.0 究竟有哪些重大变更？

Apache Flink 1.9重磅发布！首次合并阿里内部版本Blink重要功能

接着！！Apache Flink 全领域干货合集（持续更新）

Apache Flink 零基础入门（八）： SQL 编程实践

超强攻略！看完拿 Apache Flink 极客挑战赛全场最佳「MVP」

监控系统哪家强？eBay 在监控系统上的实践应用！

史上超强阵容！大数据及人工智能领域顶级盛会，Flink Forward Asia 2019 不容错过！

首届！Apache Flink 极客挑战赛强势来袭，重磅奖项等你拿，快来组队报名啦

小红书如何实现高效推荐？解密背后的大数据计算平台架构

58 集团大规模 Storm 任务平滑迁移至 Flink 的秘密

Apache Flink 零基础入门教程（六）：状态管理及容错机制

Apache Flink 零基础入门（五）：流处理核心组件 Time&Window 深度解析

活跃用户

相关产品