文档备案控制台

开发者社区大数据与机器学习实时计算 Flink 正文

Netflix 的DBLog 论文中 Chunk 读取算法是什么？

已解决

Netflix 的DBLog 论文中 Chunk 读取算法是什么？

展开

收起

游客cum3jectrqmmy 2022-01-19 15:30:39 4755 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

游客kvzazfncej2yu

推荐回答

Netflix 的 DBLog 论文中 Chunk 读取算法是通过在数据库中维护一张信号表，再通过信号表在 binlog 文件中打点，记录每个 chunk 读取前的 Low Position (低位点) 和读取结束之后 High Position (高位点) ，在低位点和高位点之间去查询该 Chunk 的全量数据。在读取出这一部分 Chunk 的数据之后，再将这 2 个位点之间的 binlog 增量数据合并到 chunk 所属的全量数据，从而得到高位点时刻，该 chunk 对应的全量数据。

资料来源：《Flink CDC：新一代数据集成框架》，下载链接：https://developer.aliyun.com/topic/download?id=8256。

2022-01-20 12:21:55

赞同展开评论

问答分类：

算法实时计算 Flink版

问答标签：

算法论文论文算法算法chunk netflix算法 dblog算法

问答地址：

开发者社区 > 大数据与机器学习 > 实时计算 Flink > 问答

相关问答

实时计算 Flink版

Flink CDC里cdc chunk算法并发读多个chunk之间的low hign点位会有重叠吗？

229

1

0

AI Earth全要素提取的算法实现也是这篇论文里的吗？我想学习一下

568

1

0

AI Earth有没有相关文档或论文介绍平台地物分类、目标提取、变化检测等算法的原理呢？

307

3

0

AI Earth有没有相关文档或论文介绍平台地物分类、目标提取、变化检测算法的原理呢？

238

1

0

# 人脸检测算法retinaface详解【论文篇】

1048

0

0

采用chunk算法同步，如果我的表有一亿条现有数据，那不是的将这一亿条数据都同步到内存中，然后用bi

618

1

0

DBLog - 无锁算法论文在哪里可以了解？

1592

1

0

为什么要学习算法和数据结构？

1131

1

0

数据结构和算法的算法思路有哪些？

990

1

0

数据结构中顺序表的C 语言算法一般都会研究什么呢？

1027

1

0

大数据与机器学习

实时计算 Flink

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务，基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎，提高作业开发运维效率。

我要提问

收录在圈子:

阿里云实时计算Flink

199215

+ 订阅

实时计算 Flink 版（Alibaba Cloud Realtime Compute for Apache Flink，Powered by Ververica）是阿里云基于 Apache Flink 构建的企业级、高性能实时大数据处理系统，由 Apache Flink 创始团队官方出品，拥有全球统一商业化品牌，完全兼容开源 Flink API，提供丰富的企业级增值功能。

相关文章

AI 英语在线考试平台的开发费用

精度再升级！无人机高光谱设备，搞定玉米全生育期长势监测

3个AI工具27篇GEO文章实测：60/40法则与3步补刀流程

测试用例去重率90%：这个用AI“瘦身”的脚本，测试经理求着我要源码

管理系统中的ERP、MES、SCM、SRM、PLM、CRM、QMS、WMS、BI、APS、SCADA、OA怎么用？

热门讨论

热门文章

Flink CDC任务从savepoint/checkpoints状态中恢复作业错误问题

Flink CDC刚刚写了几条数据，但是里面有点问题，其他字段都是正常的。这是咋回事呀？

哪位有编译好的cdc 2.2.0版本能能试用flink 1.14.2的包呀？

Flink cdc sqlserver 希望不同步某些数据行

Flink CDC 能适配达梦不？

flinkcdc在IDEA运行正常，打包就报错

Segment Key主要应用在哪些场景？

Flink CDC中，有哪位大佬有flink 版本和cdc版本的适配统计啊？

Apache Flink未授权访问上传导致的RCE漏洞，这个漏洞目前方案解决吗？

请问：Flink1.13.6版本除了升级flink版本外还有其他解决办法吗？

展开全部

数据仓库介绍与实时数仓案例

独家专访阿里集团副总裁贾扬清：我为什么选择加入阿里巴巴？

实时计算 Flink SQL 核心功能解密

流计算StreamCompute

阿里云实时计算产品案例&解决方案汇总

流计算精品翻译: The Dataflow Model

接着！！Apache Flink 全领域干货合集（持续更新）

回顾 | Kafka x Flink Meetup 与世界人工智能大会大数据 AI 专场精彩回顾（附PPT下载）

Flink SQL 功能解密系列 —— 流式 TopN 挑战与实现

广告场景下的实时计算

展开全部

还有其他疑问?