文档备案控制台

开发者社区大数据与机器学习实时计算 Flink 正文

Flink CDC创建副本表CREATE TABLE..SELECT AS ，有什么好的方式吗？

Flink CDC创建副本表CREATE TABLE..SELECT AS ，我是这种方式有影响生产数据库性能了，有什么好的方式吗？

展开

收起

真的很搞笑 2023-12-19 08:08:10 202 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

2 条回答

写回答

取消提交回答

芯在这

还行，你这个列少，create table select 直接搞就行,让运维弄，白天要是业务量大，影响的话晚上吧，分批的话也挺折腾，用键分页搬，我一般是 create table select where 1=0
insert into xx
select * from xx不直接create进数据，此回答整理自钉群“Flink CDC 社区”

2023-12-19 16:20:12

赞同展开评论
小周sir

面对过去，不要迷离；面对未来，不必彷徨；活在今天，你只要把自己完全展示给别人看。
Flink CDC创建副本表时，使用CREATE TABLE...SELECT AS语句会将源表中的数据复制到目标表中。这种方式可能会对生产数据库的性能产生影响，因为需要从源表中读取数据并写入目标表。

为了减少对生产数据库性能的影响，可以考虑以下方式：
1. 使用异步方式进行数据同步：Flink CDC支持异步模式，可以在不影响源表性能的情况下进行数据同步。通过设置合适的延迟时间，可以平衡实时性和性能之间的需求。
2. 调整并行度和并发数：根据系统资源和网络带宽的情况，适当调整Flink作业的并行度和并发数，以充分利用系统资源并提高数据同步的效率。
3. 优化查询语句：在SELECT语句中只选择需要的字段，避免全表扫描和不必要的数据传输。同时，可以使用索引等技术来加速查询过程。
4. 使用增量同步：Flink CDC支持基于时间戳或位置的增量同步，可以根据业务需求选择合适的同步方式。增量同步可以减少数据同步的数据量和频率，从而降低对生产数据库性能的影响。
2023-12-19 14:40:57

赞同展开评论

问答分类：

流计算数据库实时计算 Flink版

问答标签：

实时计算 Flink版CDC 实时计算 Flink版createtable 实时计算 Flink版cdc select 实时计算 Flink版select 实时计算 Flink版表

问答地址：

开发者社区 > 大数据与机器学习 > 实时计算 Flink > 问答

相关问答

实时计算 Flink版

Flink cdc HiveServer2 Endpoint支持select kafka表数据吗？

164

0

0

Flink mysql cdc全量阶段现在支持select *字段自定义吗？

3985

1

0

Flink报错Failed to create upload session with tun...

197

1

0

Flink 如何对show create table打印出来的connector参数中的密码加密?

235

1

0

在Flink CDC中，怎么查看我是用这个查所有 SELECT？

177

0

0

Flink多表不是我想的那种多个 create 的方式吗？好像是同步整库，然后在库里面选表吗？

145

1

0

Flink报错Failed to create the Kubernetes resource...

208

1

0

Flink写入holo报错CREATE TABLE is not supported for ...

142

1

0

这架构holo替换为select DB 支持吗？在flink文档没有找到对应的支持

163

1

0

Flink连接odps报错Error happens when create ODPS dow...

177

1

0

大数据与机器学习

实时计算 Flink

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务，基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎，提高作业开发运维效率。

我要提问

相关文章

跨境电商独立站多租户架构设计：从零搭建SaaS平台

商品采集服务设计：1688/淘宝链接自动抓取与解析

深度解析AI索引逻辑：为什么你的内容被屏蔽

MySQL并行复制调优最佳实践：从LOGICAL_CLOCK到WRITESET_SESSION的升级路径

CAD软件二次开发的流程

热门讨论

热门文章

Flink CDC任务从savepoint/checkpoints状态中恢复作业错误问题

flinkcdc在IDEA运行正常，打包就报错

Flink CDC 能适配达梦不？

有用flink cdc同步mysql到hive这样搞过的源码吗?

flink1.19和hive3.1.3，cdc从mysql同步数据到hive，插入时报错？

哪位有编译好的cdc 2.2.0版本能能试用flink 1.14.2的包呀？

在Flink想实时汇总数据，类似数据大屏功能，应该用阿里云Flink的什么功能服务？

如何用实时数据同步打破企业数据孤岛？

Flink CDC2.4.1的版本sqlserver支持指定时间戳消费了吗？

请问mysql-cdc支持在pyflink中将数据从mysql-cdc输入到doris吗？

展开全部

数据仓库介绍与实时数仓案例

独家专访阿里集团副总裁贾扬清：我为什么选择加入阿里巴巴？

流计算精品翻译: The Dataflow Model

接着！！Apache Flink 全领域干货合集（持续更新）

Flink Checkpoint 问题排查实用指南

史上超强阵容！大数据及人工智能领域顶级盛会，Flink Forward Asia 2019 不容错过！

如何在 PyFlink 1.10 中自定义 Python UDF？

Apache Flink 漫谈系列(04) - State

Flink SQL 功能解密系列 —— 数据去重的技巧和思考

基于Flink的实时日志分析系统实践

展开全部

还有其他疑问?