Docker Swarm介绍
Docker Swarm用来管理docker集群的平台,Client(compose,docker-py等)均可以直接与Swarm通信,甚至Docker本身都可以很容易的与Swarm集成,这大大方便了用户将原本基于单节点的系统移植到Swarm上,同时Swarm内置了对Docker网络插件的支持,用户也很容易的部署跨主机的容器集群服务。
Docker Swarm 和 Docker Compose 一样,都是 Docker 官方容器编排项目,但不同的是,Docker Compose 是一个在单个服务器或主机上创建多个容器的工具,而 Docker Swarm 则可以在多个服务器或主机上创建容器集群服务,对于微服务的部署,显然 Docker Swarm 会更加适合。
Swarm的几个概念
Node:一个节点是docker引擎集群的一个实例。可以将其视为Docker节点。可以在单个物理计算机或云服务器上运行一个或多个节点,但生产群集部署通常包括分布在多个物理和云计算机上的Docker节点。
要将应用程序部署到swarm,请将服务定义提交给 manager节点。manager节点将称为任务的工作单元分派 给worker节点。
manager节点还执行维护所需群集状态所需的编排和集群管理功能。manager节点选择单个领导者来执行编排任务。
worker节点接收并执行从manager节点分派的任务。默认情况下,manager节点还将服务作为worker节点运行,但可以将它们配置为仅运行编排和集群管理任务并且仅是manager节点。代理程序在每个worker节点上运行,并报告分配给它的任务。worker节点向manager节点通知其分配的任务的当前状态,以便manager节点可以维持每个工作者的期望状态。
Service:一个服务是任务的定义,manager节点或worker节点上执行。它是群体系统的中心结构,是用户与群体交互的主要根源。创建服务时,你需要指定要使用的容器镜像。
Task:任务是在docekr容器中执行的命令,manager节点根据指定数量的任务副本分配任务给worker节点
使用方法
docker swarm:集群管理,子命令有init, join, leave, update。(docker swarm --help查看帮助)
docker service:服务创建,子命令有create, inspect, update, remove, tasks。(docker service--help查看帮助)
docker node:节点管理,子命令有accept, promote, demote, inspect, update, tasks, ls, rm。(docker node --help查看帮助)
node是加入到swarm集群中的一个docker引擎实体,可以在一台物理机上运行多个node,node分为:
manager nodes,也就是管理节点
worker nodes,也就是工作节点
- manager node 管理节点:执行集群的管理功能,维护集群的状态,选举一个leader节点去执行调度任务。
- worker node 工作节点:接收和执行任务。参与容器集群负载调度,仅用于承载task。
- service 服务:一个服务是工作节点上执行任务的定义。创建一个服务,指定了容器所使用的镜像和容器运行的命令。
service是运行在worker nodes上的task的描述,service的描述包括使用哪个docker 镜像,以及在使用该镜像的容器中执行什么命令。 - task任务:一个任务包含了一个容器及其运行的命令。task是service的执行实体,task启动docker容器并在容器中执行任务。
集群搭建
首先准备四台服务器,并且提前安装Docker环境以及Docker-Compose
官方文档 https://docs.docker.com/engine/swarm/
搭建前提
集群节点之间保证TCP 2377 (集群管理),TCP/UDP 7946 (容器网络发现)和UDP 4789 (Overlay网络)端口通信。
防火墙开放这些端口,或者学着玩的同学干脆直接关闭防火墙
管理节点
命令初始化一个docker swarm 管理节点,这里用berbai01机器作为管理节点【注意图片中主机名,下文不在赘述】。
docker swarm init —advertise-addr 本机ip地址
# 仅供参考
docker swarm init —advertise-addr 192.168.227.3
提示的指令就是供从机加入管理节点使用的。
加入节点
生成加入节点指令
# 创建其加入管理节点token命令
docker swarm join-token manager
# 创建其加入工作节点token命令
docker swarm join-token worker
docker swarm join
加入一个节点,在从机中输入加入work节点指令
# 仅供参考
docker swarm join --token SWMTKN-1-3fw6zjc9k84qpf04hls6rjslhk3ukse8n8av97dx9ip1g0r0oe-8qrzoo6sziqe3qydc84f17042 192.168.227.3:2377
额外提示
如果加入节点提示错误
Error response from daemon: rpc error: code = Unavailable desc = connection error: desc = "transport: Error while dialing dial tcp 192.168.227.3:2377: connect: no route to host"
可以参考这篇文章https://blog.csdn.net/Ber_Bai/article/details/120026242
查看节点状态
docker node ls
再尝试加入一个manager节点和一个work节点
加入work节点
生成加入指令
docker swarm join-token worker
机器加入
docker swarm join --token SWMTKN-1-3fw6zjc9k84qpf04hls6rjslhk3ukse8n8av97dx9ip1g0r0oe-8qrzoo6sziqe3qydc84f17042 192.168.227.3:2377
加入manager节点
docker swarm join-token manager
机器加入
docker swarm join --token SWMTKN-1-3fw6zjc9k84qpf04hls6rjslhk3ukse8n8av97dx9ip1g0r0oe-coptwyoqxq3lckfdyhoz46hd0 192.168.227.3:2377
额外提示
如果加入节点提示错误
Error response from daemon: manager stopped: can't initialize raft node: rpc error: code = Unknown desc = could not connect to prospective new cluster member using its advertised address: rpc error: code = Unavailable desc = connection error: desc = "transport: Error while dialing dial tcp 192.168.227.6:2377: connect: no route to host"
可以参考这篇文章https://blog.csdn.net/Ber_Bai/article/details/120026242。
再次查看节点状态
管理节点才有权限查看节点状态,
docker node ls
到此,docker swarm集群搭建成功了。
Raft 协议
具体算法逻辑可以看一下这篇文章:Raft算法详解
Docker Raft算法只要保证n/2+1节点正常就能够提供服务,所以要保证docker swarm高可用,至少保证三台manager节点。
如果有不对的地点,麻烦大家评论指正。