备案控制台

开发者社区大数据与机器学习实时计算 Flink 正文

问怎么使用flink做批计算？尝试使用flink做批计算，感觉怎么也没有spark方便。

请问怎么使用flink做批计算？尝试使用flink做批计算，感觉怎么也没有spark方便，特别时在读取不同数据源时，例如我mysql ，hive 都是分区表？

展开

收起

十一0204 2023-07-19 17:38:16 125 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

算精通

北京阿里云ACE会长

Flink 是一款流式计算引擎，但是它也可以用于批处理。Flink 的批处理模式与流处理模式非常相似，因此可以使用相同的 API 和运行时环境来开发和运行批处理作业。下面是使用 Flink 进行批处理的一些建议：
使用 DataSet API
Flink 提供了 DataSet API，用于处理批处理数据。在使用 DataSet API 时，可以将数据加载到内存中，然后对数据进行操作。DataSet API 提供了丰富的操作符，例如 Map、Filter、Reduce 和 Join 等，可以方便地进行数据转换和计算。
调整并行度
在使用 Flink 进行批处理时，可以通过调整并行度来提高作业的性能。可以根据数据大小、计算复杂度和计算资源等因素来调整并行度。
使用批处理优化技术
Flink 中提供了一些批处理优化技术，例如 Sort-Based Shuffle 和 Data Skew Optimization 等。这些优化技术可以提高批处理作业的性能，并减少资源消耗。
使用 Flink SQL
Flink 还提供了 Flink SQL，用于处理结构化数据。Flink SQL 可以通过 SQL 语句来处

2023-07-29 20:00:06

赞同展开评论

问答分类：

SQL 分布式计算关系型数据库 MySQL HIVE 流计算 Spark 实时计算 Flink版云数据库 RDS MySQL 版

问答标签：

实时计算 Flink版批计算 apache spark计算 apache spark flink 实时计算 Flink版计算 flink apache spark

问答地址：

开发者社区 > 大数据与机器学习 > 实时计算 Flink > 问答

相关问答

实时计算 Flink版

我们在用flink sql 做实时指标计算时，insert into语句能否动态修改？

189

0

0

flink里pyspark ,通过 spark-submit 这种方式提交作业，报错依赖缺失咋办？

183

1

0

dataworks上如何开发实时任务 spark任务或者flink任务？

112

0

0

在Flink CDC中，flinsql读spark表的timestamp类型字段报这个错，这个咋解决

86

0

0

为什么选择从Kafka + Spark Streaming转向Flink？

98

1

0

Spark提供了哪些主要参数来调整计算存储资源的使用情况？

77

1

0

要在DataWorks上同时使用EMR Spark和Flink应用，应该怎么选择技术架构？

145

0

0

在Flink CDC中使用窗口去重然后进行累计求和计算，输出的求和结果会出现跳变，为什么？

120

0

0

Flink有没有办法变更自定义计算列的顺序?

73

1

0

Flink的cdas语法支持自定义计算列嘛？

134

1

0

大数据与机器学习

实时计算 Flink

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务，基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎，提高作业开发运维效率。

我要提问

相关文章

基于springboot的高校科研管理系统

【赵渝强老师】Oracle数据库的PL/SQL编程语言

Codes 创新的低代码接口测试解决方案，让点工也能做好接口自动化测试且效率起飞

2026版基于python大数据的电影分析可视化系统

当大数据遇上全球健康：如何用数据把“救命”这件事做得更聪明？

热门讨论

热门文章

Flink CDC任务从savepoint/checkpoints状态中恢复作业错误问题

Flink1.17为什么需要JDK 11呢？JDK8我试了也能运行

Flink CDC中，有哪位大佬有flink 版本和cdc版本的适配统计啊？

有大佬遇到过flink web ui上的指标都是loading状态吗，flink版本是1.17.1？

FlinkCDC MySQL 中 scan.startup.mode 用的是什么模式啊？

hudi怎么删除某个分区（年、月两级分区）

Flink sql中的GROUP_CONCAT 函数得怎么实现？

Flink这个 busy 是啥意思？

Flink CDC 2.4版本支持多并发读取Postgresql存量数据并且无锁吗？

Flink CDC里用jdbc往达梦dm8推数据，老是显示字符被截断是咋回事？有人碰到过嘛？

展开全部

流计算StreamCompute

Flink SQL 功能解密系列 —— 流式 TopN 挑战与实现

Flink Checkpoint 问题排查实用指南

Flink SQL 功能解密系列 —— 数据去重的技巧和思考

咱们从头到尾讲一次 Flink 网络流控和反压剖析

Apache Flink 漫谈系列(09) - JOIN 算子

Flink on YARN（下）：常见问题与排查思路

重磅揭晓！Flink Forward Asia 2019 议程完整出炉

Flink on YARN（上）：一张图轻松掌握基础架构与启动流程

Apache Flink 漫谈系列(10) - JOIN LATERAL

展开全部

还有其他疑问?