文档备案控制台

开发者社区大数据与机器学习实时计算 Flink 正文

大佬们，我在用flink cdc 采集mysql表时，表里面有一个字段是 `signed_pdf`

大佬们，我在用flink cdc 采集mysql表时，表里面有一个字段是 signed_pdf longtext COLLATE utf8mb4_bin COMMENT '签章合同' 占用的空间很大, 代码里没有采集这个字段，但是采集任务没有输出，运行一段时间后报错（内存不足），有什么办法解决这个问题

展开

收起

雪哥哥 2022-11-05 21:46:33 1519 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

3 条回答

写回答

取消提交回答

co63oc_

GitHub https://github.com/co63oc/cloud

字段内容保存到文件，用字段保存文件路径

2022-11-24 17:28:58

赞同展开评论
穿过生命散发芬芳

可以尝试加大flink任务资源，加⼤jobManager和taskManger内存（扩⼤4倍或更多），再看看效果。

2022-11-24 07:30:31

赞同展开评论
魏红斌

天下风云出我辈，一入江湖岁月催，皇图霸业谈笑中，不胜人生一场醉。

物理和堆内存总量很难计算，因为它在很大程度上取决于您的用户代码、作业的拓扑结构以及您使用的状态后端。根据经验，如果遇到 OOM 并且仍在使用FileSystemStateBackend或MemoryStateBackend，那么您应该切换到RocksDBStateBackend，因为如果状态变得太大，溢出到磁盘。

如果仍然遇到所描述的 OOM 异常，那么您应该检查您的用户代码是否保留对状态对象的引用或以其他方式生成无法被垃圾收集的大对象。如果是这种情况，那么你应该尝试重构你的代码以依赖 Flink 的状态抽象，因为使用 RocksDB 它可以脱离核心。

RocksDB 本身需要原生内存，这增加了 Flink 的内存占用。这取决于块缓存大小、索引、布隆过滤器和内存表。您可以在此处找到有关这些内容以及如何配置它们的更多信息。

最后但并非最不重要的一点是，您不应taskmanager.memory.preallocate在运行流式作业时激活，因为流式作业当前不使用托管内存。因此，通过激活预分配，将为 Flink 的托管内存分配内存，这会减少可用的堆空间。

2022-11-23 15:34:28

赞同展开评论

问答分类：

关系型数据库 MySQL 流计算实时计算 Flink版云数据库 RDS MySQL 版

问答标签：

cdc云数据库 RDS MySQL 版 flink云数据库 RDS MySQL 版 cdc云数据库 RDS MySQL 版字段采集云数据库 RDS MySQL 版实时计算 Flink版采集mysql

问答地址：

开发者社区 > 大数据与机器学习 > 实时计算 Flink > 问答

相关问答

实时计算 Flink版

Flink CDC里这个是字段属性类型问题吗?

319

0

0

flink cdc oracle 读取归档日志，NUMBER类型字段返回值这要怎么转成数字？

318

1

0

Flink现在有open api获取vvp任务表血缘和字段血缘吗？

325

2

0

在Flink CDC中写代码的方式还得我们自己维护新增/扩容字段这些ddl操作？

307

1

0

在Flink CDC中如下源端库加字段is not null场景同步会报错？

454

1

0

在Flink CDC中要怎么添加 exclude 字段呀？

201

1

0

对于Flink CDC，schema中fields的name是指字段名字吗？

204

1

0

Flink全托管的TableStore维表是否有计划支持多个字段join

216

1

0

如何在flink sql中如何获取到op这个这个隐藏字段，op：插入，更新，删除这个操作之类的？

438

1

0

用flink cdc 向 es 插入数据的时候，会报这个错误，但是不提醒具体是哪个字段出了问题？

290

0

0

大数据与机器学习

实时计算 Flink

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务，基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎，提高作业开发运维效率。

我要提问

收录在圈子:

阿里云实时计算Flink

199215

+ 订阅

实时计算 Flink 版（Alibaba Cloud Realtime Compute for Apache Flink，Powered by Ververica）是阿里云基于 Apache Flink 构建的企业级、高性能实时大数据处理系统，由 Apache Flink 创始团队官方出品，拥有全球统一商业化品牌，完全兼容开源 Flink API，提供丰富的企业级增值功能。

相关文章

5 步搞定 4 层嵌套 SQL 才能算清的股票连涨天数

开发者自主授权全解析：从社区版到常青藤计划，数据库选型新思路

2026年 | 8月云大使推广奖励规则

斗篷系统数据库架构设计：基于阿里云RDS的数据管理实践

相关解决方案

更多

Flink CDC 实现企业级实时数据同步

Flink 与 Hologres 搭建实时数仓

通过 RocketMQ 实现分布式事务

云上高可用架构

快速集成分布式任务调度

热门讨论

热门文章

Flink cdc sqlserver 希望不同步某些数据行

Flink CDC任务从savepoint/checkpoints状态中恢复作业错误问题

Flink CDC 能适配达梦不？

Flink CDC刚刚写了几条数据，但是里面有点问题，其他字段都是正常的。这是咋回事呀？

哪位有编译好的cdc 2.2.0版本能能试用flink 1.14.2的包呀？

有用flink cdc同步mysql到hive这样搞过的源码吗?

有人遇到flink打不开web界面吗？

flink k8s navtive application 这种部署模式怎么发布算子啊？

Flink On Docker 启动 jm 时报这个错误请问有知道这个错误的原因吗？

flinkcdc在IDEA运行正常，打包就报错

展开全部

数据仓库介绍与实时数仓案例

通过Flink实时构建搜索引擎的索引

接着！！Apache Flink 全领域干货合集（持续更新）

回顾 | Kafka x Flink Meetup 与世界人工智能大会大数据 AI 专场精彩回顾（附PPT下载）

史上超强阵容！大数据及人工智能领域顶级盛会，Flink Forward Asia 2019 不容错过！

Flink SQL 功能解密系列 —— 流计算“撤回(Retraction)”案例分析

如何在 PyFlink 1.10 中自定义 Python UDF？

Apache Flink 漫谈系列(04) - State

使用 Kafka 和 Flink 构建实时数据处理系统

Flink: 快速构建统一的实时日志平台

展开全部

还有其他疑问?