Flink快速入门--安装与示例运行

2022-05-25 2782

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： flink是一款开源的大数据流式处理框架，他可以同时批处理和流处理，具有容错性、高吞吐、低延迟等优势，本文简述flink在windows和linux中安装步骤，和示例程序的运行。

首先要想运行Flink，我们需要下载并解压Flink的二进制包，下载地址如下：https://flink.apache.org/downloads.html

微信图片_20220525225057.jpg

我们可以选择Flink与Scala结合版本，这里我们选择最新的1.9版本Apache Flink 1.9.0 for Scala 2.12进行下载。

下载成功后，在windows系统中可以通过Windows的bat文件或者Cygwin来运行Flink。

在linux系统中分为单机，集群和Hadoop等多种情况。

通过Windows的bat文件运行

首先启动cmd命令行窗口，进入flink文件夹，运行bin目录下的start-cluster.bat

注意：运行flink需要java环境，请确保系统已经配置java环境变量。

$ cd flink
$ cd bin
$ start-cluster.bat
Starting a local cluster with one JobManager process and one TaskManager process.
You can terminate the processes via CTRL-C in the spawned shell windows.
Web interface by default on http://localhost:8081/.

显示启动成功后，我们在浏览器访问 http://localhost:8081/

可以看到flink的管理页面。

通过Cygwin运行

Cygwin是一个在windows平台上运行的类UNIX模拟环境，官网下载：http://cygwin.com/install.html

安装成功后，启动Cygwin终端，运行start-cluster.sh脚本。

$ cd flink
$ bin/start-cluster.sh
Starting cluster.

显示启动成功后，我们在浏览器访问 http://localhost:8081/

可以看到flink的管理页面。

微信图片_20220525225105.jpg

Linux系统上安装flink

单节点安装

在Linux上单节点安装方式与cygwin一样，下载Apache Flink 1.9.0 for Scala 2.12，然后解压后只需要启动start-cluster.sh。

集群安装

集群安装分为以下几步：

1、在每台机器上复制解压出来的flink目录。

2、选择一个作为master节点，然后修改所有机器conf/flink-conf.yaml

jobmanager.rpc.address = master主机名

3、修改conf/slaves,将所有work节点写入

work01
work02

4、在master上启动集群

bin/start-cluster.sh

安装在Hadoop

我们可以选择让Flink运行在Yarn集群上。

下载Flink for Hadoop的包

保证 HADOOP_HOME已经正确设置即可

启动 bin/yarn-session.sh

运行flink示例程序

批处理示例：

提交flink的批处理examples程序：

bin/flink run examples/batch/WordCount.jar

这是flink提供的examples下的批处理例子程序，统计单词个数。

$ bin/flink run examples/batch/WordCount.jar
Starting execution of program
Executing WordCount example with default input data set.
Use --input to specify file input.
Printing result to stdout. Use --output to specify output path.
(a,5)
(action,1)
(after,1)
(against,1)
(all,2)
(and,12)
(arms,1)
(arrows,1)
(awry,1)
(ay,1)

得到结果，这里统计的是默认的数据集，可以通过--input --output指定输入输出。

我们可以在页面中查看运行的情况：

微信图片_20220525225109.jpg

流处理示例：

启动nc服务器：

nc -l 9000

提交flink的批处理examples程序：

bin/flink run examples/streaming/SocketWindowWordCount.jar --port 9000

这是flink提供的examples下的流处理例子程序，接收socket数据传入，统计单词个数。

在nc端写入单词

$ nc -l 9000
lorem ipsum
ipsum ipsum ipsum
bye

输出在日志中

$ tail -f log/flink-*-taskexecutor-*.out
lorem : 1
bye : 1
ipsum : 4

停止flink

$ ./bin/stop-cluster.sh

相关实践学习

基于Hologres+Flink搭建GitHub实时数据大屏

通过使用Flink、Hologres构建实时数仓，并通过Hologres对接BI分析工具（以DataV为例），实现海量数据实时分析.

实时计算 Flink 实战课程

如何使用实时计算 Flink 搞定数据处理难题？实时计算 Flink 极客训练营产品、技术专家齐上阵，从开源 Flink功能介绍到实时计算 Flink 优势详解，现场实操，5天即可上手！欢迎开通实时计算 Flink 版： https://cn.aliyun.com/product/bigdata/sc Flink Forward Asia 介绍： Flink Forward 是由 Apache 官方授权，Apache Flink Community China 支持的会议，通过参会不仅可以了解到 Flink 社区的最新动态和发展计划，还可以了解到国内外一线大厂围绕 Flink 生态的生产实践经验，是 Flink 开发者和使用者不可错过的盛会。去年经过品牌升级后的 Flink Forward Asia 吸引了超过2000人线下参与，一举成为国内最大的 Apache 顶级项目会议。结合2020年的特殊情况，Flink Forward Asia 2020 将在12月26日以线上峰会的形式与大家见面。

Flink快速入门--安装与示例运行

通过Windows的bat文件运行

通过Cygwin运行

Linux系统上安装flink

单节点安装

集群安装

安装在Hadoop

运行flink示例程序

批处理示例：

流处理示例：

热门文章

最新文章

相关课程

相关电子书

相关实验场景

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

Flink快速入门--安装与示例运行

通过Windows的bat文件运行

通过Cygwin运行

Linux系统上安装flink

单节点安装

集群安装

安装在Hadoop

运行flink示例程序

批处理示例：

流处理示例：

热门文章

最新文章

相关课程

相关电子书

相关实验场景