环境篇之 flink 的集群测试|学习笔记

本文涉及的产品
实时计算 Flink 版,5000CU*H 3个月
简介: 快速学习环境篇之 flink 的集群测试

开发者学堂课程【大数据 Flink 实时旅游平台环境篇 2020版:环境篇之 flink 的集群测试】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址https://developer.aliyun.com/learning/course/643/detail/10709


环境篇之 flink 的集群测试

内容介绍:

一、启动

二、测试进程

三、监控输入数据

四、测试提交批次作业


一、启动

上节介绍了 flink 的安装配置,本节讲解 flink 的测试

启动顺序:先启动 zk 和 hdfs、再启动 flink。

拷贝hdfs的依赖包:

cp/home/flink-shaded-hadoop-2-uber-2.7.5-10.0.jar/usr/local/flink-1.9.1/lib/

若不拷贝会报错,之后进行远程拷贝

scp/home/flink-shaded-hadoop-2-uber-2.7.5-10.0.jar

hadoop02 :/usr/local/flink-1.9.1/lib/

scp/home/flink-shaded-hadoop-2-uber-2.7.5-10.0.jar

hadoop03 :/usr/local/flink-1.9.1/lib/

再来启动集群:输入

start-cluster.sh

无法启动,在三个端口中都输入zkServer.sh start再进行启动

再在从中输入zkCli.sh查看可以使用,再输入quit

在主中输入start -all.sh

jps

查看可以使用后再输入start-cluster.sh

启动完毕


二、测试进程

检测每一台的 jps 进程

web 访问地址: http://hadoop01:8081

web 访问地址: http://hadoop02:8081

如图就是 web 的一个控制台

image.png

可以看到图中左侧有简介 overview,中间有 Available Task Slots 资源共享和Running jobs 正在运行的 job 数量,Running Job List 运行的 job 列表,Completed Job List 完成的 job

如下图也可以单独查看

image.png

可以查看 Task Managers、job Manager

以上证明 web 的页面测试没有问题

如果要关闭 standalone 模式:

./bin/stop-cluster.sh


三、监控输入数据

接下来介绍如何做实时的应用处理:

先安装 nc:

yum install -y nc

再来查看是否可以监听 nc 客户端:新建一个端口,登录 root 用户

然后在主中输入

nc -l 6666 监听到后在从中输入

cd /usr/local/flink-1.9.1/  进入到后使用包监控该端口:

flink run examples/streaming/SocketWindoWordCount.jar--port 6666

接着在主中输入hello hello hello hi hi

可以看到从中已经开始实时监控,再新建一个端口登录 root用 户,输入cd /usr/local/flink-1.9.1/再来查看监控结果,输入

tail -f /usr/local/flink-1.9.1/log/flink-*-taskexecutor-* .out

结果显示:

hello:3

hi:2

可以在主中继续输入数据:

qianfeng qianfne qianfeng

可以看到刚才显示的结果新增显示:

qianfeng:2

qianfne:1

再在主中输入数据:

good lice nice good

结果显示:

good:2

nice:1

lice:1

以上就叫做 flink 的流式处理,不能显示状态:再输入数据 good 可以看到结果继续显示 good:1,并没有做累加


四、测试提交批次作业

再来测试批处理

flinkrun /usr/local/flink-1.9.1/examples/batch/WordCount.jar --input/home/words --output /home/out/fl00

结果显示报错,不存在该文件

输入cat /home/words

再输入

flinkrun /usr/local/flink-1.9.1/examples/batch/WordCount.jar --input/home/words --output /home/out/fl00

可以看到页面上也存在报错

image.png

再来输入

flinkrun /usr/local/flink-1.9.1/examples/batch/WordCount.jar --input/home/words --output /home/out/fl00

刷新页面显示成功

image.png

成功后可以来查看一下数据,输入

cat /home/out/fl00

结果显示:

flink 1 hello 3  hroe 1  jiayou 1  qianfeng 1  wuhan 3

再来查看源数据,输入

cat /home/words

结果显示:hello-qianfeng  hello-flink  wuhan jiayou hello wuhan wuhan hroe

hello-qianfeng  hello-flink  wuhan jiayou hello wuhan wuhan hroe

相关实践学习
基于Hologres轻松玩转一站式实时仓库
本场景介绍如何利用阿里云MaxCompute、实时计算Flink和交互式分析服务Hologres开发离线、实时数据融合分析的数据大屏应用。
Linux入门到精通
本套课程是从入门开始的Linux学习课程,适合初学者阅读。由浅入深案例丰富,通俗易懂。主要涉及基础的系统操作以及工作中常用的各种服务软件的应用、部署和优化。即使是零基础的学员,只要能够坚持把所有章节都学完,也一定会受益匪浅。
相关文章
|
1月前
|
消息中间件 分布式计算 大数据
大数据-123 - Flink 并行度 相关概念 全局、作业、算子、Slot并行度 Flink并行度设置与测试
大数据-123 - Flink 并行度 相关概念 全局、作业、算子、Slot并行度 Flink并行度设置与测试
113 0
|
18天前
|
机器学习/深度学习 自然语言处理 前端开发
前端神经网络入门:Brain.js - 详细介绍和对比不同的实现 - CNN、RNN、DNN、FFNN -无需准备环境打开浏览器即可测试运行-支持WebGPU加速
本文介绍了如何使用 JavaScript 神经网络库 **Brain.js** 实现不同类型的神经网络,包括前馈神经网络(FFNN)、深度神经网络(DNN)和循环神经网络(RNN)。通过简单的示例和代码,帮助前端开发者快速入门并理解神经网络的基本概念。文章还对比了各类神经网络的特点和适用场景,并简要介绍了卷积神经网络(CNN)的替代方案。
|
25天前
|
编解码 安全 Linux
网络空间安全之一个WH的超前沿全栈技术深入学习之路(10-2):保姆级别教会你如何搭建白帽黑客渗透测试系统环境Kali——Liinux-Debian:就怕你学成黑客啦!)作者——LJS
保姆级别教会你如何搭建白帽黑客渗透测试系统环境Kali以及常见的报错及对应解决方案、常用Kali功能简便化以及详解如何具体实现
zdl
|
11天前
|
消息中间件 运维 大数据
大数据实时计算产品的对比测评:实时计算Flink版 VS 自建Flink集群
本文介绍了实时计算Flink版与自建Flink集群的对比,涵盖部署成本、性能表现、易用性和企业级能力等方面。实时计算Flink版作为全托管服务,显著降低了运维成本,提供了强大的集成能力和弹性扩展,特别适合中小型团队和业务波动大的场景。文中还提出了改进建议,并探讨了与其他产品的联动可能性。总结指出,实时计算Flink版在简化运维、降低成本和提升易用性方面表现出色,是大数据实时计算的优选方案。
zdl
42 0
|
1月前
|
分布式计算 Hadoop 大数据
大数据体系知识学习(一):PySpark和Hadoop环境的搭建与测试
这篇文章是关于大数据体系知识学习的,主要介绍了Apache Spark的基本概念、特点、组件,以及如何安装配置Java、PySpark和Hadoop环境。文章还提供了详细的安装步骤和测试代码,帮助读者搭建和测试大数据环境。
61 1
|
1月前
|
SQL 分布式计算 NoSQL
大数据-170 Elasticsearch 云服务器三节点集群搭建 测试运行
大数据-170 Elasticsearch 云服务器三节点集群搭建 测试运行
41 4
|
1月前
|
存储 运维 监控
实时计算Flink版在稳定性、性能、开发运维、安全能力等等跟其他引擎及自建Flink集群比较。
实时计算Flink版在稳定性、性能、开发运维和安全能力等方面表现出色。其自研的高性能状态存储引擎GeminiStateBackend显著提升了作业稳定性,状态管理优化使性能提升40%以上。核心性能较开源Flink提升2-3倍,资源利用率提高100%。提供一站式开发管理、自动化运维和丰富的监控告警功能,支持多语言开发和智能调优。安全方面,具备访问控制、高可用保障和全链路容错能力,确保企业级应用的安全与稳定。
43 0
|
1月前
|
存储 大数据 Apache
大数据-146 Apache Kudu 安装运行 Dockerfile 模拟集群 启动测试
大数据-146 Apache Kudu 安装运行 Dockerfile 模拟集群 启动测试
23 0
|
1月前
|
存储 SQL 分布式计算
大数据-135 - ClickHouse 集群 - 数据类型 实际测试
大数据-135 - ClickHouse 集群 - 数据类型 实际测试
38 0
|
1月前
|
分布式计算 Java 大数据
大数据-122 - Flink Time Watermark Java代码测试实现Tumbling Window
大数据-122 - Flink Time Watermark Java代码测试实现Tumbling Window
35 0
下一篇
无影云桌面