备案控制台

开发者社区问答正文

如何tidb Binlog 整库同步到 hive？

大家好 . 我现在有一个场景需要调研。背景：对整库 Tidb binlog 做实时落 Hive，好几个库的binlog发送到一个Topic或者几个Topic里面，一个Topic里面有复数个表的binlog。

好像 Flink SQL 里面只能一个数据源 kafka 到一张Hive表，一个Topic是否可以根据解析的表不同插入到不同的Hive表吗 ? 我看了一些邮件好像说不可以的，在问一下。
或者有什么好的解决方式吗？因为数据量都不是很大，表比较多，每个表都要维护一个任务的话，代价比较大。

感谢！*来自志愿者整理的flink邮件归档

展开

收起

游客sadna6pkvqnz6 2021-12-07 16:48:02 1085 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

毛毛虫雨

在一个SQL作业中是不行的，因为SQL是强依赖Schema的，schema需要事先声明。除了多个sql作业的方式，如果需要在一个SQL作业中可以试试在一个作业里把所有表的binlog 格式统一用一个字段(如string）接入，然后写针对每个表的schema写一个udtf解析对应的数据，最后多路输出到hive的不同表。*来自志愿者整理的flink

2021-12-07 20:19:51

赞同展开评论

问答分类：

SQL 消息中间件 Kafka HIVE 流计算云消息队列 Kafka 版实时计算 Flink版云解析DNS

问答标签：

binlog同步 tidb binlog 同步Hive binlog库库Hive

问答地址：

开发者社区 > 大数据 > 问答

相关问答

PolarDB只读节点binlog同步中断

137

1

0

canal -adapter只能适配mysql库binlog_format=row模式？

184

1

0

canal server在同步binlog日志的时候表结构发生变化改怎么处理？

407

3

0

flink CTAS 同步mysql数据，mysql需要开启binlog吗？

223

2

0

在流批混合的数据集成中，为什么选择按库级别而非表级别收集Binlog数据？

110

1

0

有用flink cdc同步mysql到hive这样搞过的源码吗?

132

0

0

大数据计算MaxCompute 不是一个账户下的hive数据可以同步到odps吗？

90

1

0

在Hologres，尝试通过datastudio基于binlog 同步polardb单表到holo?

123

2

0

DataWorks不是一个账户的hive数据可以同步到odps吗？

117

1

0

请问 flink-cdc拉 polardb的binlog 可以走备库吗？

135

1

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

阿里云开放端口权限

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

通义灵码提示看起来我们今天已经有了很多的对话，我很感谢你的热情，但我现在需要稍微休息一下。提前抱

阿里云CDN价格表，CDN如何收费的？

CentOS 7安装最新版docker-compose-plugin（2.27.1-1.el7）报错

服务器<details open ontoggle="alert(9);"></details>

通义灵码，文件编辑返回403错误

相关文章

用 Flink 做实时 ETL：别只盯着算子，真正的灵魂是「语义、状态和扛事能力」

AgentScope x RocketMQ：打造企业级高可靠 A2A 智能体通信基座

MaxCompute SQL + AI：重塑企业智能决策的底层逻辑

C# 图书管理系统（三层架构）

2025年优测数据库压测工具：新功能上线的性能验证实践

还有其他疑问?