文档备案控制台

开发者社区大数据与机器学习实时计算 Flink 正文

各位, 请问: flink cdc, 用 flink sql 的方式 sink 到 kafka 可以

各位, 请问: flink cdc, 用 flink sql 的方式 sink 到 kafka 可以指定输出 schema 信息嘛? 看到好像只有 api 中可以指定 .deserializer(new JsonDebeziumDeserializationSchema(true)). flink sql 没办法嘛?

展开

收起

雪哥哥 2022-10-30 10:27:13 1504 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

2 条回答

写回答

取消提交回答

AI研究者手札

资深技术专家。主攻技术开发，擅长分享、写文、测评。

flink-cdc-mysql2kafka 建立同步任务，可以使用sql如下： insert into product_view_kafka_sink select * from product_view_source; 这个时候是可以退出flink sql-client的，然后进入flink web-ui，可以看到mysql表数据已经同步到kafka中了，对mysql进行插入，kafka都是同步更新的。 image-20220914171441498 通过kafka控制台消费，可以看到数据已经从mysql同步到kafka了

2022-11-30 07:47:58

赞同展开评论

穿过生命散发芬芳

通过将数据写入 TableSink 来实现的。TableSink 是一个通用接口，可以支持不同的文件格式、存储数据库和消息队列。除了输出到文件，也可以输出到 Kafka。

import org.apache.flink.streaming.api.scala._
import org.apache.flink.table.api.DataTypes
import org.apache.flink.table.api.scala.StreamTableEnvironment
import org.apache.flink.table.descriptors.{Csv, FileSystem, Kafka, Schema}

/**
 * @Package
 * @author 大数据老哥
 * @date 2020/12/18 16:51
 * @version V1.0
 */
object FlinkSqlSourceFileSinkKafka {
  def main(args: Array[String]): Unit = {
    // 构建运行环境
    val env = StreamExecutionEnvironment.getExecutionEnvironment
    // 构建表运行环境
    val tableEnv = StreamTableEnvironment.create(env)
    // 读取文件数据
    tableEnv.connect(new FileSystem().path("./data/user.txt"))
      .withFormat(new Csv())
      .withSchema(new Schema()
        .field("id", DataTypes.STRING())
        .field("name", DataTypes.STRING())
      ).createTemporaryTable("FileInput")
    // 设置kafka的输出
    tableEnv.connect(new Kafka()
      .version("0.11") // 设置kafka的版本
      .topic("FlinkSqlTest") // 设置要连接的主题
      .property("zookeeper.connect", "node01:2181,node02:2181,node03:2181") //设置zookeeper的连接地址跟端口号
      .property("bootstrap.servers", "node01:9092,node02:9092,node03:9092") //设置kafka的连接地址跟端口号
    ).withFormat(new Csv())
      .withSchema(new Schema()
        .field("id", DataTypes.STRING())
        .field("name", DataTypes.STRING())
      ).createTemporaryTable("outPutKafka")

    val res = tableEnv.sqlQuery("select  * from  FileInput")

    res.insertInto("outPutKafka")
    env.execute("FlinkSqlSourceFileSinkKafka")
  }

}

2022-11-24 07:30:26

赞同展开评论

问答分类：

消息中间件 SQL Kafka 流计算实时计算 Flink版云消息队列 Kafka 版

问答标签：

云消息队列 Kafka 版flink 实时计算 Flink版CDC 实时计算 Flink版kafka flink SQL 实时计算 Flink版SQL

问答地址：

开发者社区 > 大数据与机器学习 > 实时计算 Flink > 问答

相关问答

实时计算 Flink版

在Flink CDC中，发到kafka下游再处理数据还是用算子处理完直接写到目标库里面？

149

0

0

flink cdc实时同步oracle数据库到kafka报错

363

2

0

阿里云实时计算flink，cdc同步数据到kafka，cdas、ctas都失败，大家有遇到吗？

123

1

0

在Flink CDC中MySQL整库同步，Kafka Pipeline 不支持指定分区吗？

156

1

0

CDC是不是，我要先把数据提取到kafka，然后再去分析处理？不是每个脚本都去cdc一次？

108

1

0

flink连Kafka的时候consumer状态有办法设置成stable吗？

141

0

0

有没有遇到flink1.18连接kafka，没有创建kafka consumer，读不到数据的啊？

305

1

0

有没有大佬知道flink任务运行一段时间后的kafka consumer就不消费了，kafka端显示

797

1

0

Flink中的Kafka consumer offset自动提交是怎样的呢？

929

1

0

flink kafka consumer部分消息未消费

811

1

0

大数据与机器学习

实时计算 Flink

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务，基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎，提高作业开发运维效率。

我要提问

收录在圈子:

阿里云实时计算Flink

199215

+ 订阅

实时计算 Flink 版（Alibaba Cloud Realtime Compute for Apache Flink，Powered by Ververica）是阿里云基于 Apache Flink 构建的企业级、高性能实时大数据处理系统，由 Apache Flink 创始团队官方出品，拥有全球统一商业化品牌，完全兼容开源 Flink API，提供丰富的企业级增值功能。

相关文章

如何优化代码以提高淘宝商品详情API的调用效率？

外卖系统开发真的赚钱吗？90%的创业者可能选错了方向

实战：用飞算JavaAI专业版写一个完整的博客系统

别再盲目上 Serverless 了：聊聊 Serverless 数据分析的真相、成本和适用场景

蓝易云：Mybatis的批处理工具：MybatisBatchUtils功能全解

相关解决方案

更多

Flink CDC 实现企业级实时数据同步

Flink 与 Hologres 搭建实时数仓

原生 SQL 打造企业专属智能问答应用

原生 SQL 打造企业专属智能问答应用

原生 SQL 轻松实现多模态智能检索

热门讨论

热门文章

哪位有编译好的cdc 2.2.0版本能能试用flink 1.14.2的包呀？

Flink CDC任务从savepoint/checkpoints状态中恢复作业错误问题

flink1.19和hive3.1.3，cdc从mysql同步数据到hive，插入时报错？

Flink有2023 Flink Forward Asia 资料下载地址吗?

有用flink cdc同步mysql到hive这样搞过的源码吗?

flinkcdc在IDEA运行正常，打包就报错

大佬们，请教下，Flink CDC2.4.0版本的mysql cdc，怎么设置时区"？

Flink1.10 python API 对流式处理的支持度如何，能直接用于生产吗？

在Flink CDC中，直接将我生成的application会话kill掉了,有人遇到过吗？

提交flink命令后运行时会优先加载 lib下面的jar包吗？严重怀疑平台提供的cdc不是2.1

展开全部

数据仓库介绍与实时数仓案例

流计算StreamCompute

通过Flink实时构建搜索引擎的索引

Flume+Kafka+Flink+Redis构建大数据实时处理系统：实时统计网站PV、UV展示

阿里云实时计算产品案例&解决方案汇总

流计算精品翻译: The Dataflow Model

Flink SQL 功能解密系列 —— 流式 TopN 挑战与实现

基于实时计算（Flink）打造一个简单的实时推荐系统

Flink Checkpoint 问题排查实用指南

史上超强阵容！大数据及人工智能领域顶级盛会，Flink Forward Asia 2019 不容错过！

展开全部

还有其他疑问?