备案控制台

开发者社区问答正文

如何从复杂的kafka消息体定义 table？

大家好：我定义了一个table, 从kafka读取数据，不知道要怎么解析，用哪个format.type. 如果json, avro不能满足的话，是不是得自己自定义一个。自定义的话不知道如何写，请各位帮忙指教下。

定义的表如下: CREATE TABLE MyUserTable( uuid VARCHAR, orgId VARCHAR ) with ( 'connector.type' = 'kafka', 'connector.version' = '0.11', 'connector.topic' = 'topic_name', 'connector.properties.zookeeper.connect' = 'localhost:2181', 'connector.properties.bootstrap.servers' = 'localhost:9092', 'connector.properties.group.id' = 'testGroup', 'format.type' = '？' )

Kafka的消息体如下, 好像不符合avro之类的标准格式:

{ "beforeData": [], "byteSize": 272, "columnNumber": 32, "data": [{ "byteSize": 8, "columnName": "APPLY_PERSON_ID", "rawData": 10017, "type": "LONG" }, { "byteSize": 12, "columnName": "UPDATE_SALARY", "rawData": "11000.000000", "type": "DOUBLE" }, { "byteSize": 11, "columnName": "UP_AMOUNT", "rawData": "1000.000000", "type": "DOUBLE" }, { "byteSize": 3, "columnName": "CURRENCY", "rawData": "CNY", "type": "STRING" }, { "byteSize": 32, "columnName": "EXCHANGE_RATE", "rawData": "1.000000000000000000000000000000", "type": "DOUBLE" }, { "byteSize": 11, "columnName": "DEDUCTED_ACCOUNT", "rawData": "1000.000000", "type": "DOUBLE" }, { "byteSize": 1, "columnName": "ENTER_AT_PROCESS", "rawData": "Y", "type": "STRING" }], "dataCount": 0, "dataMetaData": { "connector": "mysql", "pos": 1000368076, "row": 0, "ts_ms": 1625565737000, "snapshot": "false", "db": "testdb", "table": "flow_person_t" }, "key": "APPLY_PERSON_ID", "memorySize": 1120, "operation": "insert", "rowIndex": -1, "timestamp": "1970-01-01 00:00:00" }*来自志愿者整理的flink邮件归档

展开

收起

塔塔塔塔塔塔 2021-12-02 15:14:21 960 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

EXCEED

事实上,你的 data 是一个 jsonarray 只需要列转行取 columnName 字段就可以了.*来自志愿者整理的FLINK邮件归档

2021-12-02 15:39:07

赞同展开评论

问答分类：

消息中间件 JSON Kafka 流计算数据格式云消息队列 Kafka 版微服务引擎云数据库 RDS MySQL 版实时计算 Flink版云解析DNS

问答标签：

云消息队列 Kafka 版table 云消息队列 Kafka 版定义云消息队列 Kafka 版消息

问答地址：

开发者社区 > 大数据 > 问答

相关问答

如果有五百张表的job，用Flink Table API，是不是实际必须中间套层Kafka？

117

1

0

函数计算，kafka触发器里的data数据是业务端根据自己的实际情况定义数据结构吗？

122

1

0

如何在vvp作业中定义Kafka作为数据源（Source）的临时表？

108

1

0

mysql实时同步kafka，在payload中before和after能同时一个消息里传递出来吗？

258

1

0

调整完kafka消息大小max.message.bytes之后依然报错消息过大的情况咋办？

1658

1

0

各位大佬，你们在使用upsert-kafka的时候，在update操作会产生俩条消息到kafka，一

726

1

0

请问下当flink集群重启之后 kafka消息还是重复有什么办法解决吗 kafka sink 已设

1261

4

0

kafka可以持久化传递消息吗？

1692

1

0

dataStream 如何做到像table api的upsert-kafka一样更新数据呢？

587

1

0

请问MongoShake 如何确认是否拿到了一条消息并推送给了kafka？

607

1

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

阿里云开放端口权限

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

通义灵码提示看起来我们今天已经有了很多的对话，我很感谢你的热情，但我现在需要稍微休息一下。提前抱

CentOS 7安装最新版docker-compose-plugin（2.27.1-1.el7）报错

服务器<details open ontoggle="alert(9);"></details>

通义灵码，文件编辑返回403错误

12月冬日咖啡礼｜大模型解决方案邀你来体验

相关文章

用 Flink 做实时 ETL：别只盯着算子，真正的灵魂是「语义、状态和扛事能力」

从爬取到分析：使用 Pandas 处理头条问答数据

Python编程实战：从函数到模块化——创建自己的模块与包

设计高效可观察的 API 架构：从监控盲区到全链路洞察

AgentScope x RocketMQ：打造企业级高可靠 A2A 智能体通信基座

还有其他疑问?