文档备案控制台

开发者社区问答正文

如何从复杂的kafka消息体定义 table？

大家好：我定义了一个table, 从kafka读取数据，不知道要怎么解析，用哪个format.type. 如果json, avro不能满足的话，是不是得自己自定义一个。自定义的话不知道如何写，请各位帮忙指教下。

定义的表如下: CREATE TABLE MyUserTable( uuid VARCHAR, orgId VARCHAR ) with ( 'connector.type' = 'kafka', 'connector.version' = '0.11', 'connector.topic' = 'topic_name', 'connector.properties.zookeeper.connect' = 'localhost:2181', 'connector.properties.bootstrap.servers' = 'localhost:9092', 'connector.properties.group.id' = 'testGroup', 'format.type' = '？' )

Kafka的消息体如下, 好像不符合avro之类的标准格式:

{ "beforeData": [], "byteSize": 272, "columnNumber": 32, "data": [{ "byteSize": 8, "columnName": "APPLY_PERSON_ID", "rawData": 10017, "type": "LONG" }, { "byteSize": 12, "columnName": "UPDATE_SALARY", "rawData": "11000.000000", "type": "DOUBLE" }, { "byteSize": 11, "columnName": "UP_AMOUNT", "rawData": "1000.000000", "type": "DOUBLE" }, { "byteSize": 3, "columnName": "CURRENCY", "rawData": "CNY", "type": "STRING" }, { "byteSize": 32, "columnName": "EXCHANGE_RATE", "rawData": "1.000000000000000000000000000000", "type": "DOUBLE" }, { "byteSize": 11, "columnName": "DEDUCTED_ACCOUNT", "rawData": "1000.000000", "type": "DOUBLE" }, { "byteSize": 1, "columnName": "ENTER_AT_PROCESS", "rawData": "Y", "type": "STRING" }], "dataCount": 0, "dataMetaData": { "connector": "mysql", "pos": 1000368076, "row": 0, "ts_ms": 1625565737000, "snapshot": "false", "db": "testdb", "table": "flow_person_t" }, "key": "APPLY_PERSON_ID", "memorySize": 1120, "operation": "insert", "rowIndex": -1, "timestamp": "1970-01-01 00:00:00" }*来自志愿者整理的flink邮件归档

展开

收起

塔塔塔塔塔塔 2021-12-02 15:14:21 985 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

EXCEED

事实上,你的 data 是一个 jsonarray 只需要列转行取 columnName 字段就可以了.*来自志愿者整理的FLINK邮件归档

2021-12-02 15:39:07

赞同展开评论

问答分类：

消息中间件 JSON Kafka 流计算数据格式云消息队列 Kafka 版微服务引擎云数据库 RDS MySQL 版实时计算 Flink版云解析DNS

问答标签：

云消息队列 Kafka 版table 云消息队列 Kafka 版定义云消息队列 Kafka 版消息

问答地址：

开发者社区 > 大数据 > 问答

相关问答

如果有五百张表的job，用Flink Table API，是不是实际必须中间套层Kafka？

153

1

0

函数计算，kafka触发器里的data数据是业务端根据自己的实际情况定义数据结构吗？

161

1

0

如何在vvp作业中定义Kafka作为数据源（Source）的临时表？

162

1

0

mysql实时同步kafka，在payload中before和after能同时一个消息里传递出来吗？

297

1

0

调整完kafka消息大小max.message.bytes之后依然报错消息过大的情况咋办？

1782

1

0

各位大佬，你们在使用upsert-kafka的时候，在update操作会产生俩条消息到kafka，一

788

1

0

请问下当flink集群重启之后 kafka消息还是重复有什么办法解决吗 kafka sink 已设

1407

4

0

kafka可以持久化传递消息吗？

1731

1

0

dataStream 如何做到像table api的upsert-kafka一样更新数据呢？

633

1

0

请问MongoShake 如何确认是否拿到了一条消息并推送给了kafka？

644

1

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

【精品问答】python技术1000问(1)

2026年阿里云千问大模型深度解读：模型特性及优惠活动全面说明

2026年阿里云最新免费云服务器配置全览，免费试用云产品推荐来啦！

2026年阿里云大模型Qwen3 - Max介绍及优惠活动详细说明

2026年新手必看：阿里云大模型Qwen3.5 - Flash是什么，附介绍与优惠活动

2026年专业剖析：阿里云大模型Wan2.7 - Image介绍及优惠活动详解

相关文章

【开源剪映小助手】API 接口文档

互联网医院系统开发实战：在线问诊平台的APP与小程序搭建方案

阐述：通过商品ID获取微店商品详情数据教程

DeepSeek-V4 核心能力落地与实战应用指南：从底层机制到多智能体架构复盘

还有其他疑问?