备案控制台

开发者社区问答正文

如何tidb Binlog 整库同步到 hive？

大家好 . 我现在有一个场景需要调研。背景：对整库 Tidb binlog 做实时落 Hive，好几个库的binlog发送到一个Topic或者几个Topic里面，一个Topic里面有复数个表的binlog。

好像 Flink SQL 里面只能一个数据源 kafka 到一张Hive表，一个Topic是否可以根据解析的表不同插入到不同的Hive表吗 ? 我看了一些邮件好像说不可以的，在问一下。
或者有什么好的解决方式吗？因为数据量都不是很大，表比较多，每个表都要维护一个任务的话，代价比较大。

感谢！*来自志愿者整理的flink邮件归档

展开

收起

游客sadna6pkvqnz6 2021-12-07 16:48:02 1067 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

毛毛虫雨

在一个SQL作业中是不行的，因为SQL是强依赖Schema的，schema需要事先声明。除了多个sql作业的方式，如果需要在一个SQL作业中可以试试在一个作业里把所有表的binlog 格式统一用一个字段(如string）接入，然后写针对每个表的schema写一个udtf解析对应的数据，最后多路输出到hive的不同表。*来自志愿者整理的flink

2021-12-07 20:19:51

赞同展开评论

问答分类：

SQL 消息中间件 Kafka HIVE 流计算云消息队列 Kafka 版实时计算 Flink版云解析DNS

问答标签：

binlog同步 tidb binlog 同步Hive binlog库库Hive

问答地址：

开发者社区 > 大数据 > 问答

相关问答

PolarDB只读节点binlog同步中断

92

1

0

canal -adapter只能适配mysql库binlog_format=row模式？

162

1

0

canal server在同步binlog日志的时候表结构发生变化改怎么处理？

341

3

0

flink CTAS 同步mysql数据，mysql需要开启binlog吗？

195

2

0

在流批混合的数据集成中，为什么选择按库级别而非表级别收集Binlog数据？

91

1

0

有用flink cdc同步mysql到hive这样搞过的源码吗?

86

0

0

大数据计算MaxCompute 不是一个账户下的hive数据可以同步到odps吗？

67

1

0

在Hologres，尝试通过datastudio基于binlog 同步polardb单表到holo?

97

2

0

DataWorks不是一个账户的hive数据可以同步到odps吗？

95

1

0

请问 flink-cdc拉 polardb的binlog 可以走备库吗？

115

1

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

阿里云开放端口权限

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

阿里云短信服务工程师连我方发送记录只会收阿里云错误码都不知道吗？

qwen3-32b和qwen-2.5-32b-Instruct有什么区别

我就想把本地的 vm 虚拟机迁移到 ECS，整的这些文档又臭又长，有这精力你录个视频不行吗？

为什么现在连qwen3-coder 之类的模型都不能选了，就一个智能回答？

biz.util.invokeWorkbench这个api打开窗口方式变了

相关文章

Linux环境下 java程序提交spark任务到Yarn报错

抖音ID提取手机号黑科技 dy一键查手机号数据互站共通【易语言版】

服务器数据恢复—raid崩溃导致同友存储无法启动的数据恢复

实时库存同步接口技术详解

如何设计10亿用户级的微博Feed流系统并应对100W QPS的挑战？

还有其他疑问?