文档备案控制台

开发者社区问答正文

Apache flink - 阅读后将文件移动到其他文件夹

我正在从目录中读取csv文件并进行一些处理。现在flink只选择该目录中的任何新文件并对其进行处理。这对我来说很好。

我陷入了两个问题：

我想记录flink已完成处理的文件名。
我想在flink完成处理后立即将处理过的文件移动到不同的文件夹。
我的代码片段是：

final StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment();

org.apache.flink.core.fs.Path filePath = new org.apache.flink.core.fs.Path(feedFileFolderPath);

RowCsvInputFormat format = new RowCsvInputFormat(filePath, FetchTypeInformation.getTypeInformation());

DataStream inputStream = env.readFile(format, feedFileFolderPath, FileProcessingMode.PROCESS_CONTINUOUSLY,

            parseInt(folderLookupTime));

展开

收起

社区小助手 2018-12-11 16:11:17 2610 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

2 条回答

写回答

取消提交回答

bill_xiang

请问一下Flink是可以扫描一个目录底下不断产生的新文件吗

2019-07-17 23:19:50

赞同展开评论
社区小助手

社区小助手是spark中国社区的管理员，我会定期更新直播回顾等资料和文章干货，还整合了大家在钉群提出的有关spark的问题及回答。

这个主题在flink邮件列表上出现了几次 - 请参阅此处和此处的讨论- 但简短的总结是，在Flink中还没有一种简单的方法可以做到这一点。
似乎通常做的是使用cron作业定期将旧文件移出被监视的目录，并假设它们已被处理。如果你想要更加小心，那么你将不得不实现自己的机制来跟踪进行处理的作业的进度。上面提到的电子邮件主题包括如何做到这一点的一些想法。

2019-07-17 23:19:50

赞同展开评论

问答分类：

Apache 流计算实时计算 Flink版

问答标签：

Apache flink 实时计算 Flink版Apache 实时计算 Flink版文件 Apache文件 Apache阅读

问答地址：

开发者社区 > 大数据 > 问答

相关问答

Flink mysql binlog文件过期时间如何调整

212

1

0

Flink CDC里全量阶段开了之后，checkpoint的文件过大，现在不知道怎么优化了？

259

1

0

Flink CDC可以给一个2.4.0cdc的Pom文件吗？

129

0

0

Apache Commons Compress 解析win11自带的压缩工具压缩的文件，中文会乱码？

235

1

0

Flink CDC中sql-client的日志是应该修改哪个文件的日志级别？

211

1

0

Flink CDC任务手动cancele后为啥checkpoin的metadata文件也自动删除了？

263

1

0

Flink在oss并没有生成文件是为什么？

174

1

0

在Flink CDC中，怎么没字段 hdfs上文件也是空的？

157

0

0

对于Flink CDC，看起来像是yaml文件里哪块没写对，但是没显示具体是那行？

173

1

0

Flink解析文件

111

1

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

【精品问答】python技术1000问(1)

CoPAW配置后，对话，出现 AGENT_UNKNOWN_ERROR 如何解决

copaw安装后，出现这个情况，在设置模型的过程中出现这个问题，如何解决

Qwen OpenAI-Responses 兼容模式有问题

copaw安装后选择ollma为啥报错不能安装相关模型？

建议通义灵码参考字节的trae ，可以自主选择一些开源的模型

相关文章

我们用 AI Observe Stack 观测了 OpenClaw，发现 AI Agent 背后的这些隐患

Spark / Flink 跑在 Kubernetes 上真的更香吗？聊聊那些没人提前告诉你的性能坑

Dataphin功能Tips系列（95）如何自定义Dataphin告警消息

申请ssl证书详细步骤

文档变形记：用SpringBoot让Word和PDF“相亲相爱”的魔幻操作

还有其他疑问?