环境篇之 flink 的集群测试|学习笔记

本文涉及的产品
实时计算 Flink 版,5000CU*H 3个月
简介: 快速学习环境篇之 flink 的集群测试

开发者学堂课程【大数据 Flink 实时旅游平台环境篇 2020版:环境篇之 flink 的集群测试】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址https://developer.aliyun.com/learning/course/643/detail/10709


环境篇之 flink 的集群测试

内容介绍:

一、启动

二、测试进程

三、监控输入数据

四、测试提交批次作业


一、启动

上节介绍了 flink 的安装配置,本节讲解 flink 的测试

启动顺序:先启动 zk 和 hdfs、再启动 flink。

拷贝hdfs的依赖包:

cp/home/flink-shaded-hadoop-2-uber-2.7.5-10.0.jar/usr/local/flink-1.9.1/lib/

若不拷贝会报错,之后进行远程拷贝

scp/home/flink-shaded-hadoop-2-uber-2.7.5-10.0.jar

hadoop02 :/usr/local/flink-1.9.1/lib/

scp/home/flink-shaded-hadoop-2-uber-2.7.5-10.0.jar

hadoop03 :/usr/local/flink-1.9.1/lib/

再来启动集群:输入

start-cluster.sh

无法启动,在三个端口中都输入zkServer.sh start再进行启动

再在从中输入zkCli.sh查看可以使用,再输入quit

在主中输入start -all.sh

jps

查看可以使用后再输入start-cluster.sh

启动完毕


二、测试进程

检测每一台的 jps 进程

web 访问地址: http://hadoop01:8081

web 访问地址: http://hadoop02:8081

如图就是 web 的一个控制台

image.png

可以看到图中左侧有简介 overview,中间有 Available Task Slots 资源共享和Running jobs 正在运行的 job 数量,Running Job List 运行的 job 列表,Completed Job List 完成的 job

如下图也可以单独查看

image.png

可以查看 Task Managers、job Manager

以上证明 web 的页面测试没有问题

如果要关闭 standalone 模式:

./bin/stop-cluster.sh


三、监控输入数据

接下来介绍如何做实时的应用处理:

先安装 nc:

yum install -y nc

再来查看是否可以监听 nc 客户端:新建一个端口,登录 root 用户

然后在主中输入

nc -l 6666 监听到后在从中输入

cd /usr/local/flink-1.9.1/  进入到后使用包监控该端口:

flink run examples/streaming/SocketWindoWordCount.jar--port 6666

接着在主中输入hello hello hello hi hi

可以看到从中已经开始实时监控,再新建一个端口登录 root用 户,输入cd /usr/local/flink-1.9.1/再来查看监控结果,输入

tail -f /usr/local/flink-1.9.1/log/flink-*-taskexecutor-* .out

结果显示:

hello:3

hi:2

可以在主中继续输入数据:

qianfeng qianfne qianfeng

可以看到刚才显示的结果新增显示:

qianfeng:2

qianfne:1

再在主中输入数据:

good lice nice good

结果显示:

good:2

nice:1

lice:1

以上就叫做 flink 的流式处理,不能显示状态:再输入数据 good 可以看到结果继续显示 good:1,并没有做累加


四、测试提交批次作业

再来测试批处理

flinkrun /usr/local/flink-1.9.1/examples/batch/WordCount.jar --input/home/words --output /home/out/fl00

结果显示报错,不存在该文件

输入cat /home/words

再输入

flinkrun /usr/local/flink-1.9.1/examples/batch/WordCount.jar --input/home/words --output /home/out/fl00

可以看到页面上也存在报错

image.png

再来输入

flinkrun /usr/local/flink-1.9.1/examples/batch/WordCount.jar --input/home/words --output /home/out/fl00

刷新页面显示成功

image.png

成功后可以来查看一下数据,输入

cat /home/out/fl00

结果显示:

flink 1 hello 3  hroe 1  jiayou 1  qianfeng 1  wuhan 3

再来查看源数据,输入

cat /home/words

结果显示:hello-qianfeng  hello-flink  wuhan jiayou hello wuhan wuhan hroe

hello-qianfeng  hello-flink  wuhan jiayou hello wuhan wuhan hroe

相关实践学习
基于Hologres轻松玩转一站式实时仓库
本场景介绍如何利用阿里云MaxCompute、实时计算Flink和交互式分析服务Hologres开发离线、实时数据融合分析的数据大屏应用。
Linux入门到精通
本套课程是从入门开始的Linux学习课程,适合初学者阅读。由浅入深案例丰富,通俗易懂。主要涉及基础的系统操作以及工作中常用的各种服务软件的应用、部署和优化。即使是零基础的学员,只要能够坚持把所有章节都学完,也一定会受益匪浅。
相关文章
|
28天前
|
机器学习/深度学习 人工智能 算法
BALROG:基准测试工具,用于评估 LLMs 和 VLMs 在复杂动态环境中的推理能力
BALROG 是一款用于评估大型语言模型(LLMs)和视觉语言模型(VLMs)在复杂动态环境中推理能力的基准测试工具。它通过一系列挑战性的游戏环境,如 NetHack,测试模型的规划、空间推理和探索能力。BALROG 提供了一个开放且细粒度的评估框架,推动了自主代理研究的进展。
40 3
BALROG:基准测试工具,用于评估 LLMs 和 VLMs 在复杂动态环境中的推理能力
|
1月前
|
缓存 Ubuntu Linux
Linux环境下测试服务器的DDR5内存性能
通过使用 `memtester`和 `sysbench`等工具,可以有效地测试Linux环境下服务器的DDR5内存性能。这些工具不仅可以评估内存的读写速度,还可以检测内存中的潜在问题,帮助确保系统的稳定性和性能。通过合理配置和使用这些工具,系统管理员可以深入了解服务器内存的性能状况,为系统优化提供数据支持。
38 4
|
1月前
|
消息中间件 资源调度 关系型数据库
如何在Flink on YARN环境中配置Debezium CDC 3.0,以实现实时捕获数据库变更事件并将其传输到Flink进行处理
本文介绍了如何在Flink on YARN环境中配置Debezium CDC 3.0,以实现实时捕获数据库变更事件并将其传输到Flink进行处理。主要内容包括安装Debezium、配置Kafka Connect、创建Flink任务以及启动任务的具体步骤,为构建实时数据管道提供了详细指导。
94 9
|
1月前
|
机器学习/深度学习 自然语言处理 前端开发
前端神经网络入门:Brain.js - 详细介绍和对比不同的实现 - CNN、RNN、DNN、FFNN -无需准备环境打开浏览器即可测试运行-支持WebGPU加速
本文介绍了如何使用 JavaScript 神经网络库 **Brain.js** 实现不同类型的神经网络,包括前馈神经网络(FFNN)、深度神经网络(DNN)和循环神经网络(RNN)。通过简单的示例和代码,帮助前端开发者快速入门并理解神经网络的基本概念。文章还对比了各类神经网络的特点和适用场景,并简要介绍了卷积神经网络(CNN)的替代方案。
133 1
|
2月前
|
测试技术
自动化测试项目学习笔记(五):Pytest结合allure生成测试报告以及重构项目
本文介绍了如何使用Pytest和Allure生成自动化测试报告。通过安装allure-pytest和配置环境,可以生成包含用例描述、步骤、等级等详细信息的美观报告。文章还提供了代码示例和运行指南,以及重构项目时的注意事项。
290 1
自动化测试项目学习笔记(五):Pytest结合allure生成测试报告以及重构项目
|
1月前
|
编解码 安全 Linux
网络空间安全之一个WH的超前沿全栈技术深入学习之路(10-2):保姆级别教会你如何搭建白帽黑客渗透测试系统环境Kali——Liinux-Debian:就怕你学成黑客啦!)作者——LJS
保姆级别教会你如何搭建白帽黑客渗透测试系统环境Kali以及常见的报错及对应解决方案、常用Kali功能简便化以及详解如何具体实现
|
2月前
|
测试技术 Python
自动化测试项目学习笔记(四):Pytest介绍和使用
本文是关于自动化测试框架Pytest的介绍和使用。Pytest是一个功能丰富的Python测试工具,支持参数化、多种测试类型,并拥有众多第三方插件。文章讲解了Pytest的编写规则、命令行参数、执行测试、参数化处理以及如何使用fixture实现测试用例间的调用。此外,还提供了pytest.ini配置文件示例。
57 2
|
2月前
|
分布式计算 Hadoop 大数据
大数据体系知识学习(一):PySpark和Hadoop环境的搭建与测试
这篇文章是关于大数据体系知识学习的,主要介绍了Apache Spark的基本概念、特点、组件,以及如何安装配置Java、PySpark和Hadoop环境。文章还提供了详细的安装步骤和测试代码,帮助读者搭建和测试大数据环境。
83 1
|
2月前
|
测试技术 Python
自动化测试项目学习笔记(二):学习各种setup、tearDown、断言方法
本文主要介绍了自动化测试中setup、teardown、断言方法的使用,以及unittest框架中setUp、tearDown、setUpClass和tearDownClass的区别和应用。
87 0
自动化测试项目学习笔记(二):学习各种setup、tearDown、断言方法
|
3月前
|
运维 数据处理 数据安全/隐私保护
阿里云实时计算Flink版测评报告
该测评报告详细介绍了阿里云实时计算Flink版在用户行为分析与标签画像中的应用实践,展示了其毫秒级的数据处理能力和高效的开发流程。报告还全面评测了该服务在稳定性、性能、开发运维及安全性方面的卓越表现,并对比自建Flink集群的优势。最后,报告评估了其成本效益,强调了其灵活扩展性和高投资回报率,适合各类实时数据处理需求。