备案控制台

开发者社区 > 大数据与机器学习 > 实时计算 Flink > 正文

flinkcdc 同步数据到hbase 单表1000多万的数据配置有要注意的么？

flinkcdc 同步数据到hbase 单表1000多万的数据配置有要注意的么？

展开

收起

十一0204 2023-04-10 20:45:13 275 0

2 条回答

写回答

取消提交回答

意中人jswy

意中人就是我呀！

"你这个最主要是看上游的数据源可以承载多大的吞吐。 checkpoint的超时时间可以加大一旦在你的flink上添加这几个参数 execution.checkpointing.interval: 10min execution.checkpointing.tolerable-failed-checkpoints: 10 restart-strategy: fixed-delay restart-strategy.fixed-delay.attempts: 2147483647 tm存在超时失联情况，可能存在的原因内存不足或者tm的通信时间较短，按照这个问题导致的原因去调整参数，比如tm内存大小，超时时间等。此答案整理自钉群“Flink CDC 社区”"

2023-04-12 08:48:51

赞同展开评论打赏
HaydenGuo

坚持这件事孤独又漫长。
以下是一些需要注意的配置：
1. HBase连接的配置：确保Flink程序可以连接到HBase集群，并且具有对HBase表执行读/写操作的权限。
2. HBase表的设计：在设计HBase表时，建议使用与业务逻辑相关的列族和列名。另外，还要考虑存储的数据类型和查询方式。
3. Flink程序的配置：由于单表数据量较大，需要适当增加Flink程序的并行度和内存分配等配置，以提高处理性能。
4. CDC数据采集的配置：要确保CDC数据源的配置能够满足你的数据采集需求。
5. 数据同步的代码实现：最好使用异步方式将数据写入HBase，以提高处理性能和稳定性。
2023-04-11 09:02:14

赞同展开评论打赏

问答分类：

分布式数据库 Hbase 云数据库HBase版实时计算 Flink版

问答标签：

云数据库HBase版数据云数据库HBase版配置数据云数据库HBase版同步云数据库HBase版同步数据云数据库HBase版

问答地址：

开发者社区 > 大数据与机器学习 > 实时计算 Flink > 问答

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

相关问答

实时计算 Flink版

E-MapReduce如何配置HBase BucketCache

29

1

0

DataWorks中odps同步数据到hbase报错怎么办？

55

1

0

DataWorks通过脚本模式配置离线同步任务，从Hive同步数据到HBase，是参数位置不对吗？

47

1

0

PolarDB是否支持全量或增量同步数据到Hbase

51

1

0

现在用的2.3.0的Flink CDC，从oracle同步到hbase，不知道哪种方式好些？

110

4

0

DataWorks新建hbase的数据源时，HDFS端口为何是9000而非50070？

85

2

0

DataWorks中odps向hbase同步数据失败？

47

2

0

dataworks通过资源jar访问hbase 需要什么额外的配置吗？

99

2

0

DataWorks这个文档里面的hbase 里面的同步where、querysql 有demo吗？

75

1

0

DataWorks中hbase增量同步方案是什么？

154

1

0

大数据与机器学习

实时计算 Flink

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务，基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎，提高作业开发运维效率。

我要提问

热门讨论

热门文章

各位老师，请教个问题，flink 会在本地 /tmp 目录下产生大量flink-临时文件，目前看好？

Flink这个未授权访问漏洞有什么解决方案吗？

FlinkCDC MySQL 中 scan.startup.mode 用的是什么模式啊？

Flink如何配置Task Manager？

Flink CDC 使用jar包启动异常

flinkcdc启动，怎么修改默认端口号，默认是8081。

Flink sql将数组炸开，实现hive的explode函数的效果，还有什么其他好的方式？

Flink 集群重启后，所有的Jobs任务全都没有了。如果快速恢复所有的任务

Flink1.17为什么需要JDK 11呢？JDK8我试了也能运行

Flink CDC中SQL server CDC这种报错有什么解决方式嘛？

展开全部

数据仓库介绍与实时数仓案例

Flink SQL 功能解密系列 —— 维表 JOIN 与异步优化

Flume+Kafka+Flink+Redis构建大数据实时处理系统：实时统计网站PV、UV展示

流计算精品翻译: The Dataflow Model

接着！！Apache Flink 全领域干货合集（持续更新）

Flink SQL 功能解密系列 —— 流式 TopN 挑战与实现

基于实时计算（Flink）打造一个简单的实时推荐系统

Flink SQL 功能解密系列 —— 流计算“撤回(Retraction)”案例分析

Apache Flink 漫谈系列(04) - State

使用 Kafka 和 Flink 构建实时数据处理系统

展开全部

相关课程

更多

HBase入门与实战

603

7

去学习

云数据库HBase版使用教程

5775

7

去学习

HBase入门教程

10368

41

去学习

分布式数据库 HBase 快速入门

729

49

去学习

相关电子书

更多

大数据时代的存储 ——HBase的实践与探索 立即下载

Hbase在滴滴出行的应用场景和最佳实践 立即下载

阿里云HBase主备双活 立即下载