搭建Flink集群环境

本文涉及的产品
实时计算 Flink 版,5000CU*H 3个月
简介: 搭建Flink集群环境

下载最新的Flink安装包


https://www.apache.org/dyn/closer.lua/flink/flink-1.12.1/flink-1.12.1-bin-scala_2.11.tgz


好用的下载工具


速度快的没得说 你可以对付费的迅雷说拜拜了


motrix

下载地址

https://motrix.app/

image.png


Free Download Manager


下载地址

https://dn3.freedownloadmanager.org/6/latest/fdm.dmg


image.png


本地模式安装


解压安装包

tar -xzf flink-1.12.0-bin-scala_2.11.tgz
cd flink-1.12.0-bin-scala_2.11

启动集群

./bin/start-cluster.sh

image.png


提交作业(Job)

./bin/flink run examples/streaming/WordCount.jar

image.png

查看日志

tail log/flink-*-taskexecutor-*.out

image.png

监视集群的状态和正在运行的作业

http://localhost:8081/#/overview

image.png

停止集群

./bin/stop-cluster.sh


High-Availability with Standalone


服务器资源

服务器1 192.168.84.128 jobmanager
服务器2 192.168.84.131 taskmanager
服务器3 192.168.84.132 taskmanager
安装包路径
/opt/flink/flink-1.12.1

修改jobmanager服务器地址

vi conf/flink-conf.yaml 
jobmanager.rpc.address: 192.168.84.128

指定master flink web ui

vi conf/master
192.168.84.128:8081

修改worker服务器地址

vi conf/workers
192.168.84.131
192.168.84.132

访问 flink web ui

http://192.168.84.128:8081/#/overview

image.png



免密登陆


客户端生成密钥

ssh-keygen

查看公私钥

cd ~/.ssh
id_rsa (私钥)
id_rsa.pub (公钥)

上传公钥到服务器

# 写到服务器上的ssh目录
ssh-copy-id -i ~/.ssh/id_rsa.pub root@192.168.84.131
ssh-copy-id -i ~/.ssh/id_rsa.pub root@192.168.84.132

到指定服务器查看公钥

cd ~/.ssh
cat known_hosts

免密登陆

ssh root@192.168.84.131


磁盘满了


space left on device

当磁盘容量或inode容量任意一个不足时就都会提示No

查看磁盘空间

df -h

image.png

查看inode空间

df -i

image.png

由上可知根目录/磁盘满了 接下来需要确定是哪个文件太大导致的

查看指定目录下所有文件大小并排序

du -sh  /* |sort


最终确定是docker磁盘文件太大导致的 因该dokcer是用来测试玩的 删掉即可

rm -rf /var/lib/docker

image.png

相关实践学习
基于Hologres轻松玩转一站式实时仓库
本场景介绍如何利用阿里云MaxCompute、实时计算Flink和交互式分析服务Hologres开发离线、实时数据融合分析的数据大屏应用。
Linux入门到精通
本套课程是从入门开始的Linux学习课程,适合初学者阅读。由浅入深案例丰富,通俗易懂。主要涉及基础的系统操作以及工作中常用的各种服务软件的应用、部署和优化。即使是零基础的学员,只要能够坚持把所有章节都学完,也一定会受益匪浅。
相关文章
|
3月前
|
分布式计算 Java Apache
Flink问题之本地集群报错如何解决
Apache Flink是由Apache软件基金会开发的开源流处理框架,其核心是用Java和Scala编写的分布式流数据流引擎。本合集提供有关Apache Flink相关技术、使用技巧和最佳实践的资源。
43 1
|
5月前
|
调度 流计算
为什么部署起来flink集群 没有资源 哪里有问题呢?
为什么部署起来flink集群 没有资源 哪里有问题呢?
44 0
|
7月前
|
流计算
Flink CDC程序都需要打包到flink集群去执行来保证高可用
Flink CDC程序都需要打包到flink集群去执行来保证高可用吗?
128 2
|
5月前
|
弹性计算 资源调度 Kubernetes
Flink三种集群模式,Standalone模式,Flink On YARN,Flink On K8S,这三种模式有啥优缺点,生产环境如何选择呢?
Flink三种集群模式,Standalone模式,Flink On YARN,Flink On K8S,这三种模式有啥优缺点,生产环境如何选择呢?
261 3
|
22天前
|
资源调度 监控 数据处理
【Flink】Flink集群有哪些角色?各自有什么作用?
【4月更文挑战第18天】【Flink】Flink集群有哪些角色?各自有什么作用?
|
4月前
|
SQL Java 流计算
Flink SQL UDF(用户自定义函数)需要打包成JAR文件并上传到Flink集群中
【1月更文挑战第1天】【1月更文挑战第2篇】Flink SQL UDF(用户自定义函数)需要打包成JAR文件并上传到Flink集群中
98 0
|
13天前
|
机器学习/深度学习 人工智能 流计算
人工智能平台PAI 操作报错合集之在集群上提交了包含alink相关功能的flink任务,但是却报错如何解决
阿里云人工智能平台PAI (Platform for Artificial Intelligence) 是阿里云推出的一套全面、易用的机器学习和深度学习平台,旨在帮助企业、开发者和数据科学家快速构建、训练、部署和管理人工智能模型。在使用阿里云人工智能平台PAI进行操作时,可能会遇到各种类型的错误。以下列举了一些常见的报错情况及其可能的原因和解决方法。
|
2月前
|
消息中间件 Kafka 流计算
如果有多个版本的Flink CDC在同一环境中运行,可能会导致Debezium版本冲突
【2月更文挑战第30天】如果有多个版本的Flink CDC在同一环境中运行,可能会导致Debezium版本冲突
22 2
|
2月前
|
缓存 监控 Java
Flink CDC产品常见问题之flink集群jps命令报错如何解决
Flink CDC(Change Data Capture)是一个基于Apache Flink的实时数据变更捕获库,用于实现数据库的实时同步和变更流的处理;在本汇总中,我们组织了关于Flink CDC产品在实践中用户经常提出的问题及其解答,目的是辅助用户更好地理解和应用这一技术,优化实时数据处理流程。
|
2月前
|
资源调度 Kubernetes Apache
部署Flink集群后没有资源可能有以下几个原因
【2月更文挑战第23天】 部署Flink集群后没有资源可能有以下几个原因
19 2