，jdbc sink支持回撤流吗？似乎flink sql中-D的数据并不能执行删除的mysql的对应

一位隐者

阿里云实时计算 Flink 中的 JDBC Sink 支持回撤流（Retract Stream），可以将撤回的数据删除。在 Flink SQL 中，使用 -D 参数指定 JDBC Sink 的 delete-sql 时，可以使用 RETRACT_STREAM() 函数来删除回撤流中的数据。例如：

CREATE TABLE sink_table (
  id BIGINT,
  name STRING,
  age INT,
  PRIMARY KEY (id) NOT ENFORCED
) WITH (
  'connector.type' = 'jdbc',
  'connector.url' = 'jdbc:mysql://localhost:3306/test',
  'connector.table' = 'sink_table',
  'connector.driver' = 'com.mysql.jdbc.Driver',
  'connector.username' = 'root',
  'connector.password' = 'root',
  'connector.write.flush.max-rows' = '1',
  'connector.write.flush.interval' = '1s',
  'connector.write.max-retries' = '3',
  'connector.write.retry-interval' = '2s',
  'connector.write.delete-sql' = 'DELETE FROM sink_table WHERE id = ?'
);

INSERT INTO sink_table
SELECT id, name, age FROM source_table;

UPDATE source_table SET age = 20 WHERE id = 1;

DELETE FROM source_table WHERE id = 2;

在上面的例子中，使用 -D 参数指定了一个 delete-sql，当有数据从 source_table 中删除时，会执行该 delete-sql 将数据从 sink_table 中删除。使用 RETRACT_STREAM() 函数可以将回撤流中的数据删除。例如：

INSERT INTO sink_table
SELECT id, name, age FROM source_table
UNION ALL
SELECT id, name, age FROM source_table
WHERE age = 20 AND id IN (SELECT id FROM source_table WHERE age != 20);

INSERT INTO sink_table
SELECT id, name, age FROM source_table
WHERE age = 20 AND id NOT IN (SELECT id FROM source_table WHERE age != 20)
AND NOT EXISTS (SELECT * FROM retract_stream());

在上面的例子中，使用 RETRACT_STREAM() 函数将回撤流中的数据删除。

2023-05-06 23:26:07

赞同展开评论打赏

wljslmz

公众号：网络技术联盟站，InfoQ签约作者，阿里云社区签约作者，华为云云享专家，BOSS直聘创作王者，腾讯课堂创作领航员，博客+论坛：https://www.wljslmz.cn，工程师导航：https://www.wljslmz.com

阿里云实时计算 Flink的JDBC Sink支持回撤流，可以将撤回的数据删除或更新到指定的数据库中。使用JDBC Sink需要注意以下事项：

确保配置正确。请检查您在创建JDBC Sink时输入的配置是否正确，包括JDBC URL、数据库驱动、用户名和密码等。
检查数据库表结构。在使用JDBC Sink之前，请确保您的数据库表结构与输入流的数据结构相匹配。如果表结构不匹配，可能会导致数据写入失败。
确保目标数据库支持回撤流。如果您的目标数据库不支持回撤流，您将无法使用JDBC Sink来处理回撤数据。在MySQL数据库中，可以使用DELETE语句来删除回撤数据。

另外，在Flink SQL中，-D选项用于设置外部系统或表所需的属性，在删除MySQL表数据时无法使用。您应该使用DELETE语句来删除回撤数据。例如：

DELETE FROM table_name WHERE column_name = 'rollback_value';

这里的“rollback_value”是从回撤流中获取的数据。

2023-05-04 22:47:33

赞同展开评论打赏

穿过生命散发芬芳

其实sink算子是否支持回撤流，要根据sink数据源的特性而定。例如jdbc sink在Flink1.11中只支持upsert（不配置primary key会报错）。这都跟sink数据源的特性密切相关.

2023-05-02 08:08:39

赞同 1 展开评论打赏

Kinging

JDBC Sink 不支持流回撤。如果需要回撤流，可以考虑使用 Flink 原生支持的 sink，如 Kafka、Elasticsearch 等。这些 sink 支持 Flink 的 exactly-once 语义和流回撤。具体可参考 Flink 官方文档。

2023-04-27 22:25:17

赞同展开评论打赏

行十三

云端行者觅知音，技术前沿我独行。前言探索无边界，阿里风光引我情。

你这是2个问题。第一，JDBC Sink是支持回撤流。回撤流是指Flink在某些情况下需要撤回之前发送给Sink的数据，例如在发生故障时。对于第二个问题，可能是由于您在Flink SQL中使用了-D参数错误。如果您想要删除MySQL 中的数据，可以使用DELETE语句。如果真的存在错误，可以把错误信息帖出来。

2023-04-27 10:51:06

赞同展开评论打赏

ReaganYoung

值得去的地方都没有捷径

JDBC Sink 在 Flink 中是支持回撤流的。回撤流是指在 Flink 中取消之前已经输出到 Sink 的数据。JDBC Sink 支持回撤流的方式是通过在 Flink 中使用 Upsert 方式写入数据，即在写入数据时，如果数据已经存在，则更新数据，否则插入新数据。这种方式可以保证在回撤流时，已经输出的数据可以被覆盖或删除。

关于您提到的在 Flink SQL 中使用 -D 参数删除 MySQL 数据的问题，可能是由于您使用了错误的 SQL 语句或参数。建议您检查 SQL 语句和参数是否正确，并确保使用的 MySQL 用户拥有删除数据的权限。如果问题仍然存在，可以提供更多详细信息，以便更好地理解问题。

2023-04-26 12:27:56

赞同展开评论打赏

筝樾

使用两个Sink。第一个Sink(如JDBC Sink)仅进行insert操作。第二个Sink监听第一個Sink的输出,捕获retract和delete操作,并在目标数据库执行对应update和delete语句。这种方式可以支持其他目标数据库,但增加了系统复杂度

2023-04-25 14:13:20

赞同展开评论打赏

六月的雨在钉钉

从事java行业9年至今，热爱技术，热爱以博文记录日常工作，csdn博主，座右铭是：让技术不再枯燥，让每一位技术人爱上技术

官方对于sink的插入模式有以下三种描述：

Append 模式 - 该模式用户在定义Sink的DDL时候不定义PK，在Apache Flink内部生成的所有只有INSERT语句;

Upsert 模式 - 该模式用户在定义Sink的DDL时候可以定义PK，在Apache Flink内部会根据事件打标(retract机制)生成INSERT/UPDATE和DELETE 语句,其中如果定义了PK， UPDATE语句按PK进行更新，如果没有定义PK UPDATE会按整行更新;

Retract 模式 - 该模式下会产生INSERT和DELETE两种信息，Sink Connector 根据这两种信息构造对应的数据操作指令;

但其实sink算子是否支持回撤流，要根据sink数据源的特性而定。例如kafka sink只支持append模式，jdbc sink在Flink1.11中只支持upsert（不配置primary key会报错）。

2023-04-25 09:52:27

赞同展开评论打赏

游客kmd2gbly4yh72

JDBC Sink 不支持回撤流，因为 JDBC 需要向外发送 DML 语句才能保证数据的一致性和正确性。实时计算引擎在处理某个时间点的数据到 JDBC sink 中输出时，该时间前已经没有了状态和事件信息，所以无法根据之前的操作来执行相应的 SQL 删除语句。

如果你想要 JDBC Sink 支持回撤流，可以考虑将 Flink 程序变成批量任务运行，并利用不同数量的 parallism 将所有的记录全部写入一个数据表中，在批量任务结束后再一次性地根据 State 数据进行各种元素的合并与更新（包括删除）。这样便能够解决您提出的问题并且也减少了等待时间。在此过程上尽可能保障表结构简洁易读，同时整理1级或2级索引方便后续查询及运营分析。

2023-04-24 17:46:24

赞同展开评论打赏

MacondoMayor

Flink JDBC Sink 支持回撤流 JDBC Sink 只支持 INSERT 和 UPSERT 操作，不支持 DELETE 操作。因此，在使用 Flink SQL 时，如果你想执行 DELETE 操作，需要将其转换为对应的 UPSERT 操作。

在 Flink SQL 中，回撤流需要使用特定的语法进行定义。例如，下面是一个使用回撤流的 Flink SQL 查询：

SELECT * FROM my_table WHERE id > 100 WITH (update-mode = 'append-only')

在这个查询中，update-mode = 'append-only' 表示使用回撤流。

如果你在 Flink SQL 中使用了回撤流，并且使用 JDBC Sink 将数据写入 MySQL 中，需要确保 MySQL 表定义中包含一个用于唯一标识每个记录的主键。这是因为 Flink JDBC Sink 使用主键来确定要更新的记录。如果表定义中没有主键，则 Flink JDBC Sink 将无法正确执行 UPSERT 操作。

2023-04-24 15:28:19

赞同展开评论打赏

饱饱巴士

Flink JDBC Sink将Flink的数据写入外部数据库表中,但仅支持插入(insert)操作。它不支持: 1. retract操作:将之前插入的行从表中删除。 2. delete操作:删除表中现有的行。

这是一个已知的限制,原因是JDBC连接器目前还不支持Flink的更新操作。那么,如果需要支持这些操作,有以下几种方法: 1. 不使用JDBC Sink,转而使用Upsert Sink(可以将retract转换为update操作)或MySQL Sink(支持delete和update)。这需要目标数据库是MySQL,并且要求使用MySQL的binlog来确保exactly-once语义。 2. 使用两个Sink。第一个Sink(如JDBC Sink)仅进行insert操作。第二个Sink监听第一個Sink的输出,捕获retract和delete操作,并在目标数据库执行对应update和delete语句。这种方式可以支持其他目标数据库,但增加了系统复杂度。 3. 不使用SQL,直接在DataStream API中使用JDBCAppendTableSink进行只插入的操作,自己手动在DataStream中处理retract和delete,执行对应的更新和删除语句。这种方式较低层,需要手动关心状态管理和exactly-once语义。 4. 将删除和更新操作在Flink SQL中进行(发出delete和update语句),但在JDBC Sink中忽略。这会导致目标数据库中的数据与Flink运算的结果逐渐偏离。只在暂时无法完成delete和update操作时可以考虑。所以,总体来说,如果需要支持实时的数据库更新和删除操作,JDBC Sink并不是一个很好的选择。我的建议是考虑Upsert Sink或MySQL Sink来替代。

2023-04-24 15:25:21

赞同展开评论打赏

凌云Cloud

发表文章、提出问题、分享经验、结交志同道合的朋友

JDBC sink 在 Flink 中支持撤回流（Retract Stream）和删除流（Delete Stream）两种类型的流。回撤流用于将更新的数据以插入-删除的形式写入目标数据库，而删除流则直接删除目标数据库中的数据。

在 Flink SQL 中，可以通过设置 -D 参数来选择写入撤回流还是删除流。例如，使用以下命令可以将数据写入撤回流：

INSERT INTO jdbc_sink
SELECT ...
FROM ...

2023-04-24 11:32:41

赞同展开评论打赏

魏红斌

天下风云出我辈，一入江湖岁月催，皇图霸业谈笑中，不胜人生一场醉。

根据官方文档，Flink 的 JDBC Sink 支持 Upsert 和 Append 两种模式，不支持 Delete 写入。

考虑到回撤流需要支持数据的删除操作，在使用 Flink JDBC Sink 进行数据写入时，如果需要支持回撤流的功能，建议将 Upsert 或 Append 模式改为 Delete + Insert 或者 Replace，然后通过设置合适的时间窗口来控制旧数据的删除和新数据的写入。这样可以确保能够正确地处理回撤流场景。

除此之外，还有一些其他的存储技术可以支持回撤流的操作，例如 Apache Hudi、Apache Iceberg 等，可以根据实际的使用场景进行选择。

2023-04-24 09:35:56

赞同展开评论打赏

叶秋学长

全栈JAVA领域创作者

根据您提供的截图，这是一个Flink SQL中使用JDBC Sink进行数据输出时的问题。您的问题是JDBC Sink是否支持回撤流，并且在使用Flink SQL中的-D参数进行数据删除时是否能够对MySQL进行相应的删除操作。

首先，需要明确的是，JDBC Sink是一个Flink的官方插件，可以将Flink处理的数据写入到JDBC支持的各种关系型数据库中。它可以支持批量写入、异步写入、写入前缓存等功能，并且可以自定义数据写入的方式和格式。但是，它并不支持回撤流功能。

回撤流是指当Flink的数据流处理出错时，可以将处理过的数据回撤到之前的状态，并重新处理数据流。Flink中的回撤流功能由Flink的StateBackend和Checkpoint机制来支持。而JDBC Sink并不支持状态回退和Checkpoint，因此无法支持回撤流。

对于您的问题，如果您使用Flink SQL中的-D参数进行数据删除操作，但是在MySQL中没有对应的删除操作，可能是由于数据删除操作没有正确地传递到MySQL。您可以检查Flink的日志和MySQL的日志，以确定数据删除操作是否被正确执行。如果您确认数据删除操作已经被正确执行，但MySQL中仍然存在数据，那么可能是MySQL的配置或设置问题，建议您检查MySQL的配置和设置，以确保其正确性。

希望这些信息能够帮助您解决问题。如果您仍然遇到问题，请提供更多详细的信息，以便我们更好地帮助您。

2023-04-23 20:13:04

赞同展开评论打赏

祁符建

热爱开发

JDBC Sink 在 Flink 中是不支持回撤流的，因为它本质上是将数据写入到外部系统中，而在这种场景下，回撤操作可能会导致外部系统数据的不一致性。如果您需要支持回撤流，可以考虑使用其他类型的 Sink，比如 Apache Kafka、Apache Hudi 等。

另外，在 Flink SQL 中，-D 数据删除语句默认也是不起作用的。这是因为 Flink SQL 的 DELETE 语句本质上是将数据标记为已删除，而并非真正地从外部系统中删除数据。如果您希望从外部系统中删除数据，可以考虑使用 TRUNCATE TABLE 或 DROP TABLE 语句来执行删除操作。但需要注意的是，这些语句可能会造成数据的永久丢失，请谨慎使用。

2023-04-23 16:51:25

赞同展开评论打赏

huc_逆天

技术架构师阿里云开发者社区技术专家博主 CSDN签约专栏技术博主掘金签约技术博主云安全联盟专家众多开源代码库Commiter

JDBC Sink 在 Flink 中支持流的回撤。什么是回撤流？在 Flink 中，当一个 operator 发现之前输出的结果是错误的，这时候它可以把新的结果发出来，同时把之前错误的结果回撤掉（相当于删除之前输出的记录）。回撤流被设计用于保证数据的一致性和正确性。

那么在使用 JDBC Sink 时如何支持回撤流呢？具体来说，需要在创建 JDBC Sink 对应的 TableSink 时传入 upsertMode 参数为 UpsertMode.UPDATE_BEFORE。这个参数指定了更新操作之前需要先执行 DELETE 操作。下面是一个示例代码：

// 创建一个 JDBC TableSink
JdbcTableSink sink = JdbcTableSink.builder()
    .setDrivername("com.mysql.jdbc.Driver")
    .setDBUrl("jdbc:mysql://localhost:3306/mydb")
    .setUsername("myuser")
    .setPassword("mypassword")
    .setQuery("INSERT INTO mytable (id, name) VALUES (?, ?)")
    .setBatchSize(1000)
    .setParameterTypes(Types.INT, Types.STRING)
    .setUpsertMode(UpsertMode.UPDATE_BEFORE)
    .build();

// 把该 TableSink 注册到 Flink 的 TableEnvironment 中
tEnv.registerTableSink("mytable", new String[] {"id", "name"}, new TypeInformation[] {Types.INT, Types.STRING}, sink);

在上述代码中，我们通过调用 setUpsertMode(UpsertMode.UPDATE_BEFORE) 将 JDBC Sink 的 Upsert 模式设为 UPDATE_BEFORE 模式，这样每次执行 Upsert 操作前都会先执行 DELETE 操作。注意，要支持回撤流，需要保证表中有主键或唯一索引，否则 DELETE 操作将无法正常执行。

至于您提到的 Flink SQL 中 -D 参数不能执行删除操作的问题，可能是由于您没有指定正确的主键或唯一索引导致的

2023-04-23 16:40:02

赞同展开评论打赏

vohelon

Flink SQL 的 JDBC Sink 在默认情况下是不支持回撤流的。即使将 JdbcSink 的参数 "sink.buffer-flush.max-rows" 设置为 1 (即每次只提交一个数据行)，它仍然无法保证每个数据行的提交，因此只适用于 FLINK 从本地文件读取数据的批处理作业，而不适合流处理作业。

若需要在 Flink SQL 中使用回撤流，可以考虑使用 Flink CDC (Change Data Capture) 或 Debezium 等工具来实现。这些工具可以 capture 数据源的变更数据，并将其转换为带有元数据的流式数据，从而支持流式数据回撤的操作。

2023-04-23 16:33:56

赞同展开评论打赏

爱吃白菜的GGB

JDBC Sink 支持回撤流（Retract Stream）模式，可以将 Flink SQL 中的流式查询结果写入到 JDBC 数据库中。回撤流模式是指 Flink SQL 中的查询结果包含了 INSERT 和 DELETE 操作，JDBC Sink 会根据 INSERT 和 DELETE 操作来更新数据库中的数据。在使用 Flink SQL 中的-D参数时，如果您执行了 DELETE 操作，那么这个 DELETE 操作会被转换为回撤流模式中的 DELETE 操作，JDBC Sink 会根据这个 DELETE 操作来更新数据库中的数据。但是需要注意的是，JDBC Sink 只能更新数据库中的数据，不能删除已经写入到数据库中的数据。如果您需要删除已经写入到数据库中的数据，需要手动执行 DELETE SQL 语句来删除。

另外，需要注意的是，在使用 Flink SQL 中的-D参数时，如果您的查询结果包含了 UPDATE 操作，那么这个 UPDATE 操作会被转换为 INSERT 操作和 DELETE 操作，JDBC Sink 会根据这两个操作来更新数据库中的数据。因此，在使用-D参数时，需要特别注意您的查询结果中是否包含了 UPDATE 操作，以免造成数据更新异常。

2023-04-23 11:40:43

赞同展开评论打赏

，jdbc sink支持回撤流吗？似乎flink sql中-D的数据并不能执行删除的mysql的对应

实时计算 Flink

相关产品

热门讨论

热门文章

相关课程

相关电子书

相关实验场景

，jdbc sink支持回撤流吗？似乎flink sql中-D的数据并不能执行删除的mysql的对应

实时计算 Flink

相关产品

热门讨论

热门文章

相关课程

相关文章

相关电子书

相关实验场景

相关镜像