IDEA上运行Flink任务-阿里云开发者社区

IDEA上运行Flink任务

2022-04-01 971

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

本文涉及的产品

实时计算 Flink 版，1000CU*H 3个月

简介： 将最简单的flink任务在IDEA上开发和运行，为后面的深入学习和实践打好基础

欢迎访问我的GitHub

这里分类和汇总了欣宸的全部原创(含配套源码)： https://github.com/zq2599/blog_demos

关于本篇

IDEA是常用的IDE，我们编写的flink任务代码如果能直接在IDEA运行，会给学习和开发带来很大便利，例如改完代码立即运行不用部署、断点、单步调试等；

环境信息

电脑：2019版13寸MacBook Pro，2.3 GHz 四核Intel Core i5，8 GB 2133 MHz LPDDR3
操作系统：macOS Catalina 10.15.3
JDK：1.8.0_211
Maven：3.6.0
IDEA：2018.3.5 (Ultimate Edition)
Flink版本：1.9.2

关于正版IDEA

如何免费使用正版IDEA，可以参考《免费申请和使用IntelliJ IDEA商业版License指南》

开发

首先确保您电脑上maven已装好；
创建一个flink任务的maven工程，找个干净目录执行以下命令：

mvn \
archetype:generate \
-DarchetypeGroupId=org.apache.flink \
-DarchetypeArtifactId=flink-quickstart-java \
-DarchetypeVersion=1.9.2

按提示输入groupId、artifactId、version、package等内容：

在这里插入图片描述

现在maven工程已生成，用IDEA导入这个工程，如下图：

在这里插入图片描述

以maven的类型导入：

在这里插入图片描述

导入成功后的样子：

在这里插入图片描述

修改StreamingJob.java，加入功能是监听本地18081端口，得到的字符串做word count操作，完整代码在此下载：https://raw.githubusercontent.com/zq2599/blog_demos/master/files/StreamingJob.java

在这里插入图片描述

现在的代码已经能运行，但flink网页却还不能访问，会显示以下错误信息，需要继续做些设置：

在这里插入图片描述

下载flink-1.9.2安装包，这里面有flink网页服务用到的一个jar，地址是：https://www-eu.apache.org/dist/flink/flink-1.9.2/flink-1.9.2-bin-scala_2.11.tgz

flink-1.9.2-bin-scala_2.11.tgz下载后解压，在lib目录下有个flink-dist_2.11-1.9.2.jar文件，记住此文件的位置，稍后会用到；

回到IDEA，在项目上点击右键，点击菜单Open Module Settings：

在这里插入图片描述

在弹出的窗口做如下操作，目的是给项目中增加jar：

在这里插入图片描述

弹出选择文件的窗口，请选择刚才准备好的文件flink-dist_2.11-1.9.2.jar：

在这里插入图片描述

设置工作已经完成，由于StreamingJob的工作是读取本机18081端口的数据，所以我们要把18081端口的服务启动起来，不然StreamingJob运行时是连不上端口的，打开一个控制台，执行命令：nc -l 18081
现在可以将StreamingJob运行起来，如下图，右键点击StreamingJob，选择Run 'StreamingJob.main()'：即可启动flink任务，如果想打断点调试，请选择Debug 'StreamingJob.main()'

在这里插入图片描述

回到刚才执行nc命令的控制台，输入一些字符串，例如"aaa bbb aaa"，然后回车；
再回到IDEA，可见StreamingJob已经从18081端口读到了数据并且输出了统计结果：

在这里插入图片描述

在IDEA的控制台搜索关键字localhost，如下图红框，可以查到flink网页的端口，我这里是62641：

在这里插入图片描述

浏览器访问http://localhost:62641，如下图，可见flink网页已经正常显示，正在运行的任务也能看到：

在这里插入图片描述

至此，最简单的IDEA运行flink任务的实战就完成了，如果您也在学习flink，希望本文能给您一些参考；

欢迎关注阿里云开发者社区博客：程序员欣宸

学习路上，你不孤单，欣宸原创一路相伴...

相关实践学习

基于Hologres+Flink搭建GitHub实时数据大屏

通过使用Flink、Hologres构建实时数仓，并通过Hologres对接BI分析工具（以DataV为例），实现海量数据实时分析.

实时计算 Flink 实战课程

如何使用实时计算 Flink 搞定数据处理难题？实时计算 Flink 极客训练营产品、技术专家齐上阵，从开源 Flink功能介绍到实时计算 Flink 优势详解，现场实操，5天即可上手！欢迎开通实时计算 Flink 版： https://cn.aliyun.com/product/bigdata/sc Flink Forward Asia 介绍： Flink Forward 是由 Apache 官方授权，Apache Flink Community China 支持的会议，通过参会不仅可以了解到 Flink 社区的最新动态和发展计划，还可以了解到国内外一线大厂围绕 Flink 生态的生产实践经验，是 Flink 开发者和使用者不可错过的盛会。去年经过品牌升级后的 Flink Forward Asia 吸引了超过2000人线下参与，一举成为国内最大的 Apache 顶级项目会议。结合2020年的特殊情况，Flink Forward Asia 2020 将在12月26日以线上峰会的形式与大家见面。