环境篇之 flink 的集群测试|学习笔记

简介: 快速学习环境篇之 flink 的集群测试

开发者学堂课程【大数据 Flink 实时旅游平台环境篇 2020版:环境篇之 flink 的集群测试】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址https://developer.aliyun.com/learning/course/643/detail/10709


环境篇之 flink 的集群测试

内容介绍:

一、启动

二、测试进程

三、监控输入数据

四、测试提交批次作业


一、启动

上节介绍了 flink 的安装配置,本节讲解 flink 的测试

启动顺序:先启动 zk 和 hdfs、再启动 flink。

拷贝hdfs的依赖包:

cp/home/flink-shaded-hadoop-2-uber-2.7.5-10.0.jar/usr/local/flink-1.9.1/lib/

若不拷贝会报错,之后进行远程拷贝

scp/home/flink-shaded-hadoop-2-uber-2.7.5-10.0.jar

hadoop02 :/usr/local/flink-1.9.1/lib/

scp/home/flink-shaded-hadoop-2-uber-2.7.5-10.0.jar

hadoop03 :/usr/local/flink-1.9.1/lib/

再来启动集群:输入

start-cluster.sh

无法启动,在三个端口中都输入zkServer.sh start再进行启动

再在从中输入zkCli.sh查看可以使用,再输入quit

在主中输入start -all.sh

jps

查看可以使用后再输入start-cluster.sh

启动完毕


二、测试进程

检测每一台的 jps 进程

web 访问地址: http://hadoop01:8081

web 访问地址: http://hadoop02:8081

如图就是 web 的一个控制台

image.png

可以看到图中左侧有简介 overview,中间有 Available Task Slots 资源共享和Running jobs 正在运行的 job 数量,Running Job List 运行的 job 列表,Completed Job List 完成的 job

如下图也可以单独查看

image.png

可以查看 Task Managers、job Manager

以上证明 web 的页面测试没有问题

如果要关闭 standalone 模式:

./bin/stop-cluster.sh


三、监控输入数据

接下来介绍如何做实时的应用处理:

先安装 nc:

yum install -y nc

再来查看是否可以监听 nc 客户端:新建一个端口,登录 root 用户

然后在主中输入

nc -l 6666 监听到后在从中输入

cd /usr/local/flink-1.9.1/  进入到后使用包监控该端口:

flink run examples/streaming/SocketWindoWordCount.jar--port 6666

接着在主中输入hello hello hello hi hi

可以看到从中已经开始实时监控,再新建一个端口登录 root用 户,输入cd /usr/local/flink-1.9.1/再来查看监控结果,输入

tail -f /usr/local/flink-1.9.1/log/flink-*-taskexecutor-* .out

结果显示:

hello:3

hi:2

可以在主中继续输入数据:

qianfeng qianfne qianfeng

可以看到刚才显示的结果新增显示:

qianfeng:2

qianfne:1

再在主中输入数据:

good lice nice good

结果显示:

good:2

nice:1

lice:1

以上就叫做 flink 的流式处理,不能显示状态:再输入数据 good 可以看到结果继续显示 good:1,并没有做累加


四、测试提交批次作业

再来测试批处理

flinkrun /usr/local/flink-1.9.1/examples/batch/WordCount.jar --input/home/words --output /home/out/fl00

结果显示报错,不存在该文件

输入cat /home/words

再输入

flinkrun /usr/local/flink-1.9.1/examples/batch/WordCount.jar --input/home/words --output /home/out/fl00

可以看到页面上也存在报错

image.png

再来输入

flinkrun /usr/local/flink-1.9.1/examples/batch/WordCount.jar --input/home/words --output /home/out/fl00

刷新页面显示成功

image.png

成功后可以来查看一下数据,输入

cat /home/out/fl00

结果显示:

flink 1 hello 3  hroe 1  jiayou 1  qianfeng 1  wuhan 3

再来查看源数据,输入

cat /home/words

结果显示:hello-qianfeng  hello-flink  wuhan jiayou hello wuhan wuhan hroe

hello-qianfeng  hello-flink  wuhan jiayou hello wuhan wuhan hroe

相关实践学习
基于Hologres+Flink搭建GitHub实时数据大屏
通过使用Flink、Hologres构建实时数仓,并通过Hologres对接BI分析工具(以DataV为例),实现海量数据实时分析.
实时计算 Flink 实战课程
如何使用实时计算 Flink 搞定数据处理难题?实时计算 Flink 极客训练营产品、技术专家齐上阵,从开源 Flink功能介绍到实时计算 Flink 优势详解,现场实操,5天即可上手! 欢迎开通实时计算 Flink 版: https://cn.aliyun.com/product/bigdata/sc Flink Forward Asia 介绍: Flink Forward 是由 Apache 官方授权,Apache Flink Community China 支持的会议,通过参会不仅可以了解到 Flink 社区的最新动态和发展计划,还可以了解到国内外一线大厂围绕 Flink 生态的生产实践经验,是 Flink 开发者和使用者不可错过的盛会。 去年经过品牌升级后的 Flink Forward Asia 吸引了超过2000人线下参与,一举成为国内最大的 Apache 顶级项目会议。结合2020年的特殊情况,Flink Forward Asia 2020 将在12月26日以线上峰会的形式与大家见面。
相关文章
|
7月前
|
人工智能 测试技术 芯片
AMD Ryzen AI Max+ 395四机并联:大语言模型集群推理深度测试
本文介绍了使用四块Framework主板构建AI推理集群的过程,并基于AMD Ryzen AI Max+ 395处理器进行大语言模型推理性能测试,重点评估其并行推理能力及集群表现。
611 0
AMD Ryzen AI Max+ 395四机并联:大语言模型集群推理深度测试
|
消息中间件 分布式计算 大数据
大数据-123 - Flink 并行度 相关概念 全局、作业、算子、Slot并行度 Flink并行度设置与测试
大数据-123 - Flink 并行度 相关概念 全局、作业、算子、Slot并行度 Flink并行度设置与测试
610 0
zdl
|
消息中间件 运维 大数据
大数据实时计算产品的对比测评:实时计算Flink版 VS 自建Flink集群
本文介绍了实时计算Flink版与自建Flink集群的对比,涵盖部署成本、性能表现、易用性和企业级能力等方面。实时计算Flink版作为全托管服务,显著降低了运维成本,提供了强大的集成能力和弹性扩展,特别适合中小型团队和业务波动大的场景。文中还提出了改进建议,并探讨了与其他产品的联动可能性。总结指出,实时计算Flink版在简化运维、降低成本和提升易用性方面表现出色,是大数据实时计算的优选方案。
zdl
660 56
|
测试技术
自动化测试项目学习笔记(五):Pytest结合allure生成测试报告以及重构项目
本文介绍了如何使用Pytest和Allure生成自动化测试报告。通过安装allure-pytest和配置环境,可以生成包含用例描述、步骤、等级等详细信息的美观报告。文章还提供了代码示例和运行指南,以及重构项目时的注意事项。
1430 1
自动化测试项目学习笔记(五):Pytest结合allure生成测试报告以及重构项目
|
SQL 分布式计算 NoSQL
大数据-170 Elasticsearch 云服务器三节点集群搭建 测试运行
大数据-170 Elasticsearch 云服务器三节点集群搭建 测试运行
403 4
|
测试技术 Python
自动化测试项目学习笔记(四):Pytest介绍和使用
本文是关于自动化测试框架Pytest的介绍和使用。Pytest是一个功能丰富的Python测试工具,支持参数化、多种测试类型,并拥有众多第三方插件。文章讲解了Pytest的编写规则、命令行参数、执行测试、参数化处理以及如何使用fixture实现测试用例间的调用。此外,还提供了pytest.ini配置文件示例。
805 2
|
测试技术 Python
自动化测试项目学习笔记(二):学习各种setup、tearDown、断言方法
本文主要介绍了自动化测试中setup、teardown、断言方法的使用,以及unittest框架中setUp、tearDown、setUpClass和tearDownClass的区别和应用。
499 0
自动化测试项目学习笔记(二):学习各种setup、tearDown、断言方法
|
存储 运维 监控
实时计算Flink版在稳定性、性能、开发运维、安全能力等等跟其他引擎及自建Flink集群比较。
实时计算Flink版在稳定性、性能、开发运维和安全能力等方面表现出色。其自研的高性能状态存储引擎GeminiStateBackend显著提升了作业稳定性,状态管理优化使性能提升40%以上。核心性能较开源Flink提升2-3倍,资源利用率提高100%。提供一站式开发管理、自动化运维和丰富的监控告警功能,支持多语言开发和智能调优。安全方面,具备访问控制、高可用保障和全链路容错能力,确保企业级应用的安全与稳定。
287 0
|
存储 大数据 Apache
大数据-146 Apache Kudu 安装运行 Dockerfile 模拟集群 启动测试
大数据-146 Apache Kudu 安装运行 Dockerfile 模拟集群 启动测试
212 0
|
存储 SQL 分布式计算
大数据-135 - ClickHouse 集群 - 数据类型 实际测试
大数据-135 - ClickHouse 集群 - 数据类型 实际测试
264 0

热门文章

最新文章