文档备案控制台

开发者社区大数据与机器学习实时计算 Flink 正文

flink-sql往es里更新数据，为何有时候会自动删除es index ？

flink-sql往es里更新数据，为何有时候会自动删除es index ？

展开

收起

wenti 2023-02-27 18:54:21 655 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

牧羊吖

月移花影，暗香浮动

Flink SQL 往 Elasticsearch 中更新数据，会涉及到 Elasticsearch 中的索引更新操作。如果数据更新频繁，而且没有优化 Elasticsearch 索引写入和刷新操作，就有可能导致 Elasticsearch 中的索引被删除。

在 Flink SQL 中往 Elasticsearch 中写入数据，一般是采用 Elasticsearch's Bulk API 方式。在 Bulk API 中，数据先被写入到内存缓冲区，等到缓冲区满或达到一定阈值后再以批量方式写入 Elasticsearch 中。这种方式虽然写入数据的速度较快，但是需要特别注意内存的使用情况和索引的刷新策略。

在 Elasticsearch 中，索引的刷新是一种将新的段（segments）写入磁盘，以及释放旧的段的操作。如果刷新不频繁，数据会在内存缓存区域中累积，内存使用率上升，可能会导致 OOM（内存溢出）错误。而如果刷新过于频繁，会导致索引性能下降。

因此，应该根据具体情况进行优化，可以通过设置 Bulk API 中的 flush_interval 和 flush_size 参数来控制缓冲区的刷新策略，避免 Elasticsearch 索引被删除。同时，也要注意 Elasticsearch 中的数据存储结构，以确保数据的准确性和一致性。

2023-03-13 10:25:55

赞同展开评论

问答分类：

实时计算 Flink版

问答标签：

SQL数据实时计算 Flink版数据实时计算 Flink版es SQL es 实时计算 Flink版自动删除

问答地址：

开发者社区 > 大数据与机器学习 > 实时计算 Flink > 问答

相关问答

实时计算 Flink版

MY SQL 版支持 select * from tab use index (index)吗

246

1

0

Flink cdc支持同步自建的ES吗？

211

1

0

flink es connector7丢数据

330

0

0

Elasticsearch 连接器，flink1.18开始没有了吗？那怎么操作es呢？

418

1

0

请问 flink 1.19 现在支持 es sql connector吗？

213

0

0

在Flink CDC中flink会自动删除cp文件？

184

1

0

在Flink CDC中这种配置，会自动删除超过30天前的hive分区吗？

177

0

0

用flink cdc 向 es 插入数据的时候，会报这个错误，但是不提醒具体是哪个字段出了问题？

278

0

0

在Flink 多表 join 写入 es ，有什么其他方案嘛？

355

0

0

我写了个flink处理es数据的问题，这里也没有什么过滤逻辑，有没有人遇到过类似问题?

181

0

0

大数据与机器学习

实时计算 Flink

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务，基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎，提高作业开发运维效率。

我要提问

收录在圈子:

阿里云实时计算Flink

199215

+ 订阅

实时计算 Flink 版（Alibaba Cloud Realtime Compute for Apache Flink，Powered by Ververica）是阿里云基于 Apache Flink 构建的企业级、高性能实时大数据处理系统，由 Apache Flink 创始团队官方出品，拥有全球统一商业化品牌，完全兼容开源 Flink API，提供丰富的企业级增值功能。

相关文章

Flink CDC 3.6.0：支持 Flink 1.20/2.2, MySQL/PostgreSQL入湖入流支持Schema Evolution

相约深圳，全球征集｜Flink Forward Asia 2026 演讲议题征集正式启动

Flink Agents 0.3 Roadmap解读

Flink Forward Asia 2026 官宣深圳｜From Cloud Native to AI Native

Skill即服务：用Agent安全玩转云上Flink

相关解决方案

更多

基于数据闪回，快速恢复数据

海量异构数据预处理破局之道

分析 Agent 实现一键 AI 数据洞察

多模态数据信息提取

数据守护：防勒索攻击数据保障

热门讨论

热门文章

Flink CDC任务从savepoint/checkpoints状态中恢复作业错误问题

Flink CDC 能适配达梦不？

有用flink cdc同步mysql到hive这样搞过的源码吗?

flink1.19和hive3.1.3，cdc从mysql同步数据到hive，插入时报错？

Flink CDC里这个问题怎么解决？

flinkcdc在IDEA运行正常，打包就报错

Flink 1.13版本升级Flink 1.17 报错有人知道为什么吗?

FLink 1.13版本升级Flink 1.17 报错，怎么处理？

哪位有编译好的cdc 2.2.0版本能能试用flink 1.14.2的包呀？

flink 手动触发savepoint会出现timeout，有办法调整超市时间之类吗？

展开全部

独家专访阿里集团副总裁贾扬清：我为什么选择加入阿里巴巴？

通过Flink实时构建搜索引擎的索引

Flume+Kafka+Flink+Redis构建大数据实时处理系统：实时统计网站PV、UV展示

阿里云实时计算产品案例&解决方案汇总

流计算精品翻译: The Dataflow Model

接着！！Apache Flink 全领域干货合集（持续更新）

广告场景下的实时计算

Flink SQL 功能解密系列 —— 流计算“撤回(Retraction)”案例分析

如何在 PyFlink 1.10 中自定义 Python UDF？

基于Flink的实时日志分析系统实践

展开全部

还有其他疑问?