备案控制台

开发者社区大数据与机器学习实时计算 Flink 正文

Flink有一个问题咨询一下：我的数据在ftp的文件中，现有的数据处理方案是：请问有什么简化方案吗？

Flink有一个问题咨询一下：我的数据在ftp的文件中，现有的数据处理方案是：通过shell将文件copy到hdfs 中，然后启动一个flink batch的任务读取文件中的数据然后做处理。备注（单条数据比较大 10mb左右不等）。这个流程大量的时间都消耗在了copy文件。请问有什么简化方案吗？

展开

收起

真的很搞笑 2024-07-15 09:40:48 110 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

0 条回答

写回答

取消提交回答

问答分类：

流计算数据处理 Shell 实时计算 Flink版

问答标签：

实时计算 Flink版数据实时计算 Flink版文件实时计算 Flink版数据处理 FTP文件实时计算 Flink版方案

问答地址：

开发者社区 > 大数据与机器学习 > 实时计算 Flink > 问答

相关问答

实时计算 Flink版

在Flink CDC中这种方式必须是hive的用户创建的表，创建的hdfs文件才能挂载没有其他方法?

126

0

0

在Flink CDC的并行读取最终方案中，你们是如何通过标签和通知机制来保证数据顺序和状态清理的？

142

1

0

到2021年3季度，斗鱼实时计算平台的数据处理能力如何？

84

1

0

在Flink CDC中，怎么没字段 hdfs上文件也是空的？

126

0

0

为什么在建行大数据云平台中采用Flink进行实时数据处理？

106

1

0

在Flink CDC中，pgsql备库cdc，wal_level不改成逻辑的有啥方案嘛？

111

0

0

实时计算平台的数据处理流程是怎样的？

107

1

0

Flink有一个问题咨询一下：我的数据在ftp的文件中，现有的数据处理方案是：请问有什么简化方案吗？

177

1

0

Flink CDC有验证过oracle-cdc的数据处理能力么？

116

1

0

对于Flink CDC，看起来像是yaml文件里哪块没写对，但是没显示具体是那行？

145

1

0

大数据与机器学习

实时计算 Flink

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务，基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎，提高作业开发运维效率。

我要提问

相关文章

在 OpenAI 打造流处理平台：超大规模实时计算的实践与思考

JBoltAI V4开启“软件定义AI”新范式，国产框架以新质生产力引领智能革命

Python列表推导式：简洁高效的数据处理利器

Dataphin功能Tips系列（82）「Dataphin标签管理」：让数据资产分类与检索更高效、更智能

数据慢半拍，问题可能不在“数据”：聊聊数据传播延迟的那些坑

热门讨论

热门文章

Flink1.17为什么需要JDK 11呢？JDK8我试了也能运行

Flink CDC任务从savepoint/checkpoints状态中恢复作业错误问题

Flink CDC 人大金仓能作为source吗？支持bin-log吗？

Flink CDC把主表先全量同步到索引中更新到索引中这种怎么搞？

flink cdc source端能降低消费速度嘛？

flink cdc同步的源表，一定要有主键么？

我使用flink cdc StartupOptions.latest() 采最新的日志。要是程序挂了

请问一下Flink mysqlcdc获取到数据之后关联结果不更新这个怎么办?

flink datastream ，向clickhouse插入数据时怎么关闭插入时更新,

Flink CDC有知道Mac m1下的docker 环境如何开启sqlserver代理吗？

展开全部

Flume+Kafka+Flink+Redis构建大数据实时处理系统：实时统计网站PV、UV展示

Flink Checkpoint 问题排查实用指南

史上超强阵容！大数据及人工智能领域顶级盛会，Flink Forward Asia 2019 不容错过！

Flink SQL 功能解密系列 —— 流计算“撤回(Retraction)”案例分析

如何正确使用 Flink Connector？

如何在 PyFlink 1.10 中自定义 Python UDF？

Flink SQL 功能解密系列 —— 解决热点问题的大杀器MiniBatch

Apache Flink 漫谈系列(09) - JOIN 算子

Flink on YARN（上）：一张图轻松掌握基础架构与启动流程

实时计算Flink on Kubernetes产品模式介绍

展开全部

还有其他疑问?