文档备案控制台

开发者社区大数据与机器学习实时计算 Flink 正文

大佬们，我在用flink cdc 采集mysql表时，表里面有一个字段是 `signed_pdf`

大佬们，我在用flink cdc 采集mysql表时，表里面有一个字段是 signed_pdf longtext COLLATE utf8mb4_bin COMMENT '签章合同' 占用的空间很大, 代码里没有采集这个字段，但是采集任务没有输出，运行一段时间后报错（内存不足），有什么办法解决这个问题

展开

收起

雪哥哥 2022-11-05 21:46:33 1510 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

3 条回答

写回答

取消提交回答

co63oc_

GitHub https://github.com/co63oc/cloud

字段内容保存到文件，用字段保存文件路径

2022-11-24 17:28:58

赞同展开评论
穿过生命散发芬芳

可以尝试加大flink任务资源，加⼤jobManager和taskManger内存（扩⼤4倍或更多），再看看效果。

2022-11-24 07:30:31

赞同展开评论
魏红斌

天下风云出我辈，一入江湖岁月催，皇图霸业谈笑中，不胜人生一场醉。

物理和堆内存总量很难计算，因为它在很大程度上取决于您的用户代码、作业的拓扑结构以及您使用的状态后端。根据经验，如果遇到 OOM 并且仍在使用FileSystemStateBackend或MemoryStateBackend，那么您应该切换到RocksDBStateBackend，因为如果状态变得太大，溢出到磁盘。

如果仍然遇到所描述的 OOM 异常，那么您应该检查您的用户代码是否保留对状态对象的引用或以其他方式生成无法被垃圾收集的大对象。如果是这种情况，那么你应该尝试重构你的代码以依赖 Flink 的状态抽象，因为使用 RocksDB 它可以脱离核心。

RocksDB 本身需要原生内存，这增加了 Flink 的内存占用。这取决于块缓存大小、索引、布隆过滤器和内存表。您可以在此处找到有关这些内容以及如何配置它们的更多信息。

最后但并非最不重要的一点是，您不应taskmanager.memory.preallocate在运行流式作业时激活，因为流式作业当前不使用托管内存。因此，通过激活预分配，将为 Flink 的托管内存分配内存，这会减少可用的堆空间。

2022-11-23 15:34:28

赞同展开评论

问答分类：

关系型数据库 MySQL 流计算实时计算 Flink版云数据库 RDS MySQL 版

问答标签：

实时计算 Flink版CDC 云数据库 RDS MySQL 版字段 flink云数据库 RDS MySQL 版实时计算 Flink版mysql 实时计算 Flink版cdc mysql

问答地址：

开发者社区 > 大数据与机器学习 > 实时计算 Flink > 问答

相关问答

实时计算 Flink版

现在flink cdc 接入mysql 表时表新增字段还会导致同步任务重新初始化吗？

266

1

0

Flink在读取mysql空间类型的表时，可能会报如下错误，怎么解决？

244

2

0

Flink的ffa分会场有回放吗？另外pdf可以下载吗？

200

1

0

Flink CDC中FFA 2023的演讲PDF有下载的地方么？

201

0

0

Flink CDC中MySQL同步表时，有人了解这个有什么解决办法吗？

331

2

0

请问下 flink cdc 全量初始化mysql表时，主键是字符串类型同步很慢，这个需要咋优化配置？

394

2

0

各位大佬，请教一下，如果在flink cdc sql客户端使用SQL查询表，怎么能记录原系统的数据

2311

1

0

那cdc最新版支持到flink的哪个版本，flink1.15还有guava兼容性问题吗？

1915

0

0

flink cdc(mysql) -> elasticsearch7, 任务每次持续跑了一段时间之后

1465

2

0

请教下，我数据库时rds mysql5.6

1103

1

0

大数据与机器学习

实时计算 Flink

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务，基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎，提高作业开发运维效率。

我要提问

收录在圈子:

阿里云实时计算Flink

199215

+ 订阅

实时计算 Flink 版（Alibaba Cloud Realtime Compute for Apache Flink，Powered by Ververica）是阿里云基于 Apache Flink 构建的企业级、高性能实时大数据处理系统，由 Apache Flink 创始团队官方出品，拥有全球统一商业化品牌，完全兼容开源 Flink API，提供丰富的企业级增值功能。

相关文章

阿里云云数据库SelectDB版完全对接指南：从零搭建实时数仓到生产级运维

哔哩哔哩基于阿里云PolarDB与通义千问构建全域内容洞察新框架

2026年企业上云热门阿里云产品与活动指南：省钱攻略全解析

Text-to-SQL进阶小工具-text2sql 智能查询小工具

记忆张量MemOS + 阿里云PolarDB一站式记忆管理方案发布：给AI装上不断片的记忆

相关解决方案

更多

Flink CDC 实现企业级实时数据同步

Flink 与 Hologres 搭建实时数仓

通过 RocketMQ 实现分布式事务

云上高可用架构

快速集成分布式任务调度

热门讨论

热门文章

Flink CDC任务从savepoint/checkpoints状态中恢复作业错误问题

哪位有编译好的cdc 2.2.0版本能能试用flink 1.14.2的包呀？

FLink 1.13版本升级Flink 1.17 报错，怎么解决？

FLink 1.13版本升级Flink 1.17 报错，怎么处理？

Flink 1.13版本升级Flink 1.17 报错有人知道为什么吗?

Flink CDC 能适配达梦不？

有用flink cdc同步mysql到hive这样搞过的源码吗?

那cdc最新版支持到flink的哪个版本，flink1.15还有guava兼容性问题吗？

flink1.19和hive3.1.3，cdc从mysql同步数据到hive，插入时报错？

flinkcdc在IDEA运行正常，打包就报错

展开全部

数据仓库介绍与实时数仓案例

独家专访阿里集团副总裁贾扬清：我为什么选择加入阿里巴巴？

回顾 | Kafka x Flink Meetup 与世界人工智能大会大数据 AI 专场精彩回顾（附PPT下载）

Flink SQL 功能解密系列 —— 流式 TopN 挑战与实现

基于实时计算（Flink）打造一个简单的实时推荐系统

广告场景下的实时计算

史上超强阵容！大数据及人工智能领域顶级盛会，Flink Forward Asia 2019 不容错过！

如何在 PyFlink 1.10 中自定义 Python UDF？

使用 Kafka 和 Flink 构建实时数据处理系统

运维场景下的实时计算应用

展开全部

还有其他疑问?