备案控制台

开发者社区问答正文

如何将canal json格式数据按操作类型过滤？

使用场景：我们使用canal将mysql binlog输出到kafka，然后想通过flink消费kafka数据过滤掉 delete 操作的数据插入到文件系统，因为要做历史数据存档用。查了下官网 https://ci.apache.org/projects/flink/flink-docs-release-1.13/zh/docs/connectors/table/formats/canal/#available-metadata {"data":[{"id":"111","name":"scooter","description":"Big 2-wheel scooter","weight":"5.18"}],"database":"inventory","es":1589373560000,"id":9,"isDdl":false,"mysqlType":{"id":"INTEGER","name":"VARCHAR(255)","description":"VARCHAR(512)","weight":"FLOAT"},"old":[{"weight":"5.15"}],"pkNames":["id"],"sql":"","sqlType":{"id":4,"name":12,"description":12,"weight":7},"table":"products","ts":1589373560798,"type":"UPDATE"} CREATETABLEKafkaTable(origin_databaseSTRINGMETADATAFROM'value.database'VIRTUAL,origin_tableSTRINGMETADATAFROM'value.table'VIRTUAL,origin_sql_typeMAP<STRING,INT>METADATAFROM'value.sql-type'VIRTUAL,origin_pk_namesARRAY METADATAFROM'value.pk-names'VIRTUAL,origin_tsTIMESTAMP(3)METADATAFROM'value.ingestion-timestamp'VIRTUAL,user_idBIGINT,item_idBIGINT,behaviorSTRING)WITH('connector'='kafka','topic'='user_behavior','properties.bootstrap.servers'='localhost:9092','properties.group.id'='testGroup','scan.startup.mode'='earliest-offset','value.format'='canal-json'); 只能获取到原始 database, table, sql-type, pk-names, ingestion-timestamp 字段，而拿不到代表操作类型的 type 字段。请问有什么别的办法么？*来自志愿者整理的flink邮件归档

展开

收起

塔塔塔塔塔塔 2021-12-02 15:17:33 1643 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

EXCEED

先通过 json 或者 raw format 消费原始 canal kafka ，过滤掉 delete 的数据写入到一个新的 kafka

，然后你再基于新的 kafka 建一个 canal-json 的表来落地。*来自志愿者整理的FLINK邮件归档

2021-12-02 15:38:02

赞同展开评论

问答分类：

canal JSON 数据格式实时计算 Flink版云数据库 RDS MySQL 版云消息队列 Kafka 版

问答标签：

JSON数据 JSON格式 JSON格式数据 JSON类型 canal JSON

问答地址：

开发者社区 > 开发与运维 > 问答

相关问答

SLS 使用java sdk 进行含有json类型的数据写入的步骤是什么？

104

0

0

云数据仓库ADB json类型的字段如何添加索引？

128

1

0

在workspace.apipost.net上进行钉钉考勤接口测报错—post参数需要json类型

178

1

0

PolarDB-X gsi可以作用在json类型的字段上吗？

112

1

0

大数据计算MaxCompute中有存json格式的类型吗？

126

1

0

云数据仓库ADB json类型的字段如何添加索引，举个例子？

141

2

0

云数据仓库ADB json类型的字段如何添加索引，举个例子

117

2

0

在钉钉中对应如下传入的类型是TableField，值是 json 对象的二维数组，这样的格式对吗？

249

1

0

在Flink CDC中生成的canal 格式的json里面怎么让添加库名和表名信息？

113

0

0

云数据仓库ADB json类型的字段如何添加索引，举个例子

109

1

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

阿里云开放端口权限

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

通义灵码使用代理报错

idea通义灵码插件，更新后怎么一直用英文回答。开始对话时，告诉它之后的问题使用中文回答也不行

阿里云云企业网CEN是什么？如何使用？

阿里云全球加速GA是什么？怎么使用？

钉钉小程序开发获取code失败

相关文章

CrewAI 上手攻略：多 Agent 自动化处理复杂任务，让 AI 像员工一样分工协作

Codes 创新的低代码接口测试解决方案，让点工也能做好接口自动化测试且效率起飞

【征文计划】我在 Rokid Glasses 上"织"出一个实时翻译网络

构建AI智能体：三十一、AI医疗场景实践：医学知识精准问答+临床智能辅助决策CDSS

TestNG测试报告美化教程：使用testng-xslt-1.1.zip生成可视化HTML报告（附安装包）

还有其他疑问?