文档备案控制台

开发者社区大数据与机器学习实时计算 Flink 正文

flinksql写kafka，有时输出数据连续，有时却不连续？？

flinksql写kafka，开启了Checkpoint，并且设置了CheckpointingMode.EXACTLY_ONCE，写入kafka时没有设置kafka事务，为啥有时出现连续写入数据到kafka（如图1），有时又是周期性写入kafka（如图2）（周期性为Checkpoint的时间间隔）？

图1

图2

sink kafka 表是：

create table dwd_spyw_alert_info_stat_kaf_sk(
comb_type string
,period_type string
,user_id STRING
,alert_type STRING
,region_id STRING
,device_code STRING
,shop_id STRING
,alert_time STRING
,insert_time STRING
,primary key(comb_type, period_type, device_code, user_id, region_id, alert_type, shop_id) not enforced
)with(
'connector' = 'upsert-kafka',
'topic' = 'topic-name',
'properties.bootstrap.servers' = 'localhost:9092',
'key.json.ignore-parse-errors' = 'true',
'value.json.fail-on-missing-field' = 'false',
'value.json.ignore-parse-errors' = 'true',
'key.format' = 'json',
'value.format' = 'json',
'sink.buffer-flush.max-rows' = '5000',
'sink.buffer-flush.interval' = '1 s',
'properties.compression.type' = 'gzip',
'properties.compression.codec' = 'gzip',
'properties.linger.ms' = '5'
);

展开

收起

游客glctgieaqedss 2024-09-30 18:01:47 330 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

0 条回答

写回答

取消提交回答

问答分类：

消息中间件 Kafka 云消息队列 Kafka 版实时计算 Flink版

问答标签：

云消息队列 Kafka 版数据 flinksql云消息队列 Kafka 版数据 flinksql云消息队列 Kafka 版

问答地址：

开发者社区 > 大数据与机器学习 > 实时计算 Flink > 问答

相关问答

请教下，kafka2hive采用flinksql同步数据，如果想要回溯历史数据，应该怎么做呢？

436

2

0

请教一个问题 flinksql 中 kafka 关联多个 hbase 之后，有遇到过的吗？

265

1

0

flinksql 怎么使用rebalence？kafka单个分区lag很高 flinksql没法搞？

1600

10

0

读取kafka直接写入starrocks,flinksql提交，有参数把算子分开吗？

261

2

0

Flink CDC这个权限问题的么，场景是从Kafka -> hive ,通过FlinkSQL实现?

316

0

0

flinksql消费kafka然后look up join doris纬表，出现下面问题怎么解决？

289

1

0

在机器学习PAI中，有没有用flinkSQL直接连kafka的？

237

1

0

flinksql cdc 是不是只有从mysql同步到kafka 才能截取到这个字段？

240

1

0

如果用flinksql的方式同步mysql数据到kafka，是类似DTS那样吗？

216

1

0

flinksql 读取kafka数据写入到mysql 按照主键更新会不会导致数据乱序？

244

1

0

大数据与机器学习

实时计算 Flink

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务，基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎，提高作业开发运维效率。

我要提问

相关文章

老城区改造IOC数字孪生平台量化指标与误差控制规范

高速服务区数字孪生监测平台量化指标与误差控制规范

硫化厂数字孪生管理平台量化指标与误差控制规范

自建商城平台交易架构与合规分账路径全流程设计分享

5层通信栈：多Agent集群为什么不能用一种方式通信

相关解决方案

更多

基于数据闪回，快速恢复数据

海量异构数据预处理破局之道

分析 Agent 实现一键 AI 数据洞察

多模态数据信息提取

数据守护：防勒索攻击数据保障

热门讨论

热门文章

Flink CDC任务从savepoint/checkpoints状态中恢复作业错误问题

哪位有编译好的cdc 2.2.0版本能能试用flink 1.14.2的包呀？

FLink 1.13版本升级Flink 1.17 报错，怎么解决？

FLink 1.13版本升级Flink 1.17 报错，怎么处理？

Flink 1.13版本升级Flink 1.17 报错有人知道为什么吗?

Flink CDC 能适配达梦不？

那cdc最新版支持到flink的哪个版本，flink1.15还有guava兼容性问题吗？

Flink cdc sqlserver 希望不同步某些数据行

flink CDC 当第一次全量正常输出后，源表中数据任何变更就无法再被捕获到了，为什么？

Flink CDC中，有哪位大佬有flink 版本和cdc版本的适配统计啊？

展开全部

数据仓库介绍与实时数仓案例

实时计算 Flink SQL 核心功能解密

流计算StreamCompute

通过Flink实时构建搜索引擎的索引

Flume+Kafka+Flink+Redis构建大数据实时处理系统：实时统计网站PV、UV展示

阿里云实时计算产品案例&解决方案汇总

流计算精品翻译: The Dataflow Model

回顾 | Kafka x Flink Meetup 与世界人工智能大会大数据 AI 专场精彩回顾（附PPT下载）

Flink SQL 功能解密系列 —— 流式 TopN 挑战与实现

Flink Checkpoint 问题排查实用指南

展开全部

还有其他疑问?