Mesos+Marathon docker 集群管理-阿里云开发者社区

前面我们了解了docker常见的操作和部署方法，在企业中，如果要大规模使用docker就不能通过纯手工的方式去维护和部署了。目前比较流行的有两种解决方案，一种是使用 Mesos+Marathon+docker的方式对集群中的容器进行管理，另一种方式是使用Kubernetes，就目前Kubernetes有引领行业的趋势，但是对于小型的集群管理，mesos符合传统主从架构，更加简单。

Mesos介绍

Mesos容器管理的理念个人觉得类似于OpenStack, 通过master将整个集群的资源搜集起来，当需要创建容器，或执行某个task时，会根据当前集群中的资源情况进行调度，对集群中运行的应用进行统一的资源管理。创建的容器在节点上是随机分配的（前提是资源足够的情况下），当某个容器或任务因故障终止后，在其它节点会自动创建一个新的容器来实现高可用。

在 Mesos 上运行的 framework 由两部分组成：一个是 scheduler ，通过注册到　master 来获取集群资源。另一个是在 slave 节点上运行的 executor 进程，它可以执行 framework 的 task 。 Master 决定为每个　framework 提供多少资源， framework 的 scheduler 来选择其中提供的资源。当 framework 同意了提供的资源，它通过 master 将 task发送到提供资源的　slaves 上运行。

配置mesos集群

本次示例使用6台CentOS7.2主机，3台作为mesos-master集群，另外3台作为mesos-slave。slave上运行容器执行task.

1、系统初始化：

对这六台机器配置hosts解析，并添加yum源：

 
         cat 
         >>
         /etc/hosts 
         <<EOF 
        
         192.168.20.41 mesos1       
         # master 
        
         192.168.20.42 mesos2       
         # master 
        
         192.168.20.43 mesos3       
         # master 
        
         192.168.20.44 mesos4       
         # slave 
        
         192.168.20.45 mesos5       
         # slave 
        
         192.168.20.46 mesos6       
         # slave 
        
         EOF

 
         setenforce 0
        
         sed 
         -i 
         's#SELINUX=enforcing#SELINUX=disabled#g' 
         /etc/sysconfig/selinux 
        
         systemctl stop firewalld
        
         systemctl disable firewalld

 
         rpm -Uvh http:
         //repos
         .mesosphere.io
         /el/7/noarch/RPMS/mesosphere-el-repo-7-2
         .noarch.rpm

2、配置mesos-master

在mesos1,mesos2和mesos3上配置zookeeper集群：

 
         yum 
         install 
         -y java-1.8.0-openjdk-devel java-1.8.0-openjdk 
        
         yum -y 
         install 
         mesos marathon mesosphere-zookeeper

配置zookeeper集群ID

mesos1:

 
         echo 
         1 > 
         /var/lib/zookeeper/myid

mesos2:

 
         echo 
         2 > 
         /var/lib/zookeeper/myid

mesos3:

 
         echo 
         3 > 
         /var/lib/zookeeper/myid

在3台master上, 配置zookeeper集群信息:

 
         vim 
         /etc/zookeeper/conf/zoo
         .cfg

 
         maxClientCnxns=50                     
         #单个客户端与单台服务器之间的连接数的限制，是ip级别的，默认是50，如果设置为0，那么表明不作任何限制。请注意这个限制的使用范围，仅仅是单台客户端机器与单台ZK服务器之间的连接数限制，不是针对指定客户端IP，也不是ZK集群的连接数限制，也不是单台ZK对所有客户端的连接数限制。 
        
         tickTime=2000                         
         #Zookeeper 服务器之间或客户端与服务器之间维持心跳的时间间隔，也就是每个 tickTime 时间就会发送一个心跳 
        
         initLimit=10                          
         #Zookeeper的Leader 接受客户端（Follower）初始化连接时最长能忍受多少个心跳时间间隔数。当已经超过 5个心跳的时间（也就是tickTime）长度后 Zookeeper 服务器还没有收到客户端的返回信息，那么表明这个客户端连接失败。总的时间长度就是 5*2000=10 秒 
        
         syncLimit=5                           
         #表示 Leader 与 Follower 之间发送消息时请求和应答时间长度，最长不能超过多少个tickTime 的时间长度，总的时间长度就是 2*2000=4 秒 
        
         dataDir=
         /var/lib/zookeeper            
         #zookeeper数据文件存放目录 
        
         clientPort=2181                       
         #客户端连接端口 
        
         server.1=192.168.20.41:3181:4181      
         #数字1,2,3表示这个是第几号服务器（是上面myid文件里对应的数字）；中间的是master主节点的ip地址 
        
         server.2=192.168.20.42:3181:4181      
         #第一个端口2888（这个端口可以自己定义）表示的是这个服务器与集群中的 Leader 服务器交换信息的端口 
        
         server.3=192.168.20.43:3181:4181      
         #第二个端口3888表示的是万一集群中的 Leader 服务器挂了，需要一个端口来重新进行选举，选出一个新的 Leader，而这个端口就是用来执行选举时服务器相互通信的端口。

配置集群端口:

 
         vim 
         /etc/mesos/zk 
        
         zk:
         //192
         .168.20.41:2181,192.168.20.42:2181,192.168.20.43:2181
         /mesos

配置仲裁,此处使用的是3个节点,所以配置仲裁数目为2 (集群节点数目/2,四舍五入):

 
         cat 
         /etc/mesos-master/quorum 
        
         2

mesos集群是通过zookeeper来交互的,所以只需要配置zookeeper即可, 配置完成之后,启动mesos-master集群:

 
         systemctl 
         enable 
         zookeeper && systemctl 
         enable 
         mesos-master && systemctl 
         enable 
         marathon 
        
         systemctl start zookeeper && systemctl start mesos-master && systemctl start marathon
        
         systemctl disable mesos-slave

查看zookeeper的状态:

 
         /opt/mesosphere/zookeeper/bin/zkServer
         .sh status 
         /etc/zookeeper/conf/zoo
         .cfg

确认mesos-master 和marathon启动,并开放端口:

 
         systemctl status mesos-master 
        
         systemctl status marathon

3. 配置各slave节点

安装docker 和mesos :

 
         yum 
         install 
         docker -y 
        
         yum 
         install 
         mesos -y

配置slave的master信息以及运行方式:

 
         echo 
         "zk://192.168.20.41:2181,192.168.20.42:2181,192.168.20.43:2181/mesos" 
         > 
         /etc/mesos/zk 
        
         echo 
         'docker,mesos' 
         > 
         /etc/mesos-slave/containerizers

启动服务:

 
         systemctl start docker && systemctl 
         enable 
         docker 
        
         systemctl start mesos-slave && systemctl 
         enable 
         mesos-slave

下载docker 镜像(可参考配置国内镜像源的方式):

 
         docker pull nginx
        
         docker pull tomcat

4. 登录master上的任意一台机器, 分别进入 mesos和marathon的管理界面:

http://192.168.20.41:5050

http://192.168.20.41:8080

在端口为5050的mesos 界面，angent栏中可以看到三台slave已经被添加进来：

使用8080端口访问的Marathon,由于还没有添加任务，所以显示的是“No Application”:

测试容器应用

1、marathon可以使用REST API的方式来处理任务需求，我们先测试通过API的方式来创建一个nginx的docker容器

在master上编辑nginx.json:

 
         {
        
         "id"
         :
         "nginx"
         , 
        
         "cpus"
         :0.2, 
        
         "mem"
         :20.0, 
        
         "instances"
         : 1, 
        
         "constraints"
         : [[
         "hostname"
         , 
         "UNIQUE"
         ,
         ""
         ]], 
        
         "container"
         : { 
        
         "type"
         :
         "DOCKER"
         , 
        
         "docker"
         : { 
        
         "image"
         : 
         "nginx"
         , 
        
         "network"
         : 
         "BRIDGE"
         , 
        
         "portMappings"
         : [ 
        
         {
         "containerPort"
         : 80, 
         "hostPort"
         : 0,
         "servicePort"
         : 0, 
         "protocol"
         : 
         "tcp" 
         } 
        
         ] 
        
         } 
        
         } 
        
         }

使用POST 方法执行：

 
         curl -X POST http:
         //192
         .168.20.41:8080
         /v2/apps 
         -d @nginx.json -H 
         "Content-type: application/json"

执行此命令后，会返回一串json的详细配置信息，在mesos界面可以看到已经有一个任务在运行：

在marathon界面，可以看到此容器对外开放的端口：

直接对此端口进行访问，就可以访问到我们熟悉的nginx初始界面。

我们可以查看在mesos5这台机器上的容器状态：

 
         [root@mesos5 ~]
         # docker ps -a 
        
         CONTAINER ID        IMAGE               COMMAND                  CREATED             STATUS                        PORTS                   NAMES
        
         ee6639983450        nginx               
         "nginx -g 'daemon off"   
         11 minutes ago      Up 11 minutes                 0.0.0.0:31495->80
         /tcp   
         mesos-398a0a16-fe13-48e6-9a9c-6932c6c58014-S1.525f7318-9bb7-486c-9c3a-13d5294f37ff

查看端口：

 
         [root@mesos5 ~]
         # docker port ee6639983450  
        
         80
         /tcp 
         -> 0.0.0.0:31495

mesos上创建的容器映射的对外端口，默认会使用31000-32000之间的随机端口。

使用Marathon管理容器

在日常的操作中，为了更加方便快捷的使用docker,可以通过使用Marathon来管理容器。

在Marathon的创建应用界面，我们可以看到对应的配置选项：

在此界面，我们也可以直接使用json配置的方式，直接编写我们需要的配置：

输入以下内容：

 
         {  
        
         "id"
         :
         "tomcat"
         ,   
        
         "cpus"
         :1,   
        
         "mem"
         :128,   
        
         "instances"
         : 1,   
        
         "constraints"
         : [[
         "hostname"
         , 
         "UNIQUE"
         ,
         ""
         ]],   
        
         "container"
         : {   
        
         "type"
         :
         "DOCKER"
         ,   
        
         "docker"
         : {   
        
         "image"
         : 
         "tomcat"
         ,                                               
        
         "network"
         : 
         "BRIDGE"
         ,  
        
         "portMappings"
         : [   
        
         {
         "containerPort"
         : 8080, 
         "hostPort"
         : 31001,
         "servicePort"
         : 31002, 
         "protocol"
         : 
         "tcp" 
         }   
        
         ]  
        
         }   
        
         }   
        
         }

这里指定了容器端口和对外映射的端口，hostPort为主机上映射的端口，可指定的范围是31000到32000，如果设置为0 表示随机分配端口。当containerPort和hostPort都设置为0时，将随机分配一个相同的端口。

点击“Create Application”即可创建出一个tomcat容器：

这里在配置json的时候，我们指定了默认的端口为31001：

如果当某个节点出现故障，或者docker 服务意外退出，mesos会自动掉度容器到其他可用的主机上，如果是指定了容器的对外端口，端口不会改变：

停止mesos6上的docker 服务，tomcat 容器将会漂移到其他slave节点

 
         [root@mesos6 ~]
         # systemctl stop docker

查看Marathon上容器状态：

容器从mesos6 漂移到了mesos4, 对外端口不变：

 
         [root@mesos4 ~]
         # docker ps  
        
         CONTAINER ID        IMAGE               COMMAND             CREATED             STATUS              PORTS                     NAMES
        
         03b70cad8ad9        tomcat              
         "catalina.sh run"   
         4 minutes ago       Up 3 minutes        0.0.0.0:31001->8080
         /tcp   
         mesos-398a0a16-fe13-48e6-9a9c-6932c6c58014-S0.6b97951a-336e-47ab-84c9-38229e9ba132 
        
         [root@mesos4 ~]
         # docker port 03b70cad8ad9 
        
         8080
         /tcp 
         -> 0.0.0.0:31001

mesos创建容器流程

目前，Docker Containerizer 作为任务启动时，需要执行以下操作：

将所有在 CommandInfo 中指定的文件放入一个隔离的沙盒中

从远程仓库拉取 docker 镜像

使用 Docker executor 来运行 docker 镜像，同时将沙盒目录映射到容器中环境变量 MESOS_SANDBOX 所指定的目录。 executor 也将容器的日志流重新定向到外部的 stdout/stderr 文件。

当退出容器或者销毁 containerizer 时，停止并移除 docker 容器实例。

Docker Containerizer 启动的容器的 ID 由前缀" mesos- " 加上 slave ID（如，mesos-slave1-abcdefghji ）组成，并且假设所有以 " mesos- "为前缀的容器都由 slave 管理，slave 可以任意停止和销毁容器。

在创建容器的时候会出现容器创建不成功的情况，一般有如下几种原因：

1、环境资源不足。在mesos资源管理界面，可以看到当前资源的使用情况，如果容器的cpu,内存，磁盘等资源超出当前环境可以提供的范围，容器创建会失败。

2、当前环境中无可用的镜像。创建容器时，如果本地没有对应的镜像，docker默认会从官方下载，但是下载不一定会成功，可以查看系统进程，如果长时间卡在 docker pull等命令上，就是无法获取镜像。建议先在本地创建好镜像资源。

3、端口指定超出范围。在指定hostPort时，也需要指定servicePort, 且端口范围必须在31000-32000之间，否则创建容器的时候会出错。这个端口范围可以通过配置修改，在实际应用中一般使用marathon-lb来解决随机端口的问题。

参考资料：

https://mesos-cn.gitbooks.io/mesos-cn/content/OverView/Mesos-Architecture.html

http://www.cnblogs.com/kevingrace/p/5685313.html

https://mesosphere.github.io/marathon/docs/ports.html

本文转自酥心糖 51CTO博客，原文链接:http://blog.51cto.com/tryingstuff/1954726

Mesos+Marathon docker 集群管理

热门文章

最新文章

相关课程

相关电子书

相关实验场景

推荐镜像