谁说Docker只能运行无状态的应用?本次DockerCon大会,众多容器存储解决方案的厂商齐聚一堂,展示了不同的产品或解决方案。有很早就推出开源容器数据管理Flocker的ClusterHQ,传统存储巨头EMC,初创公司Portworx,另外华为推出了自己的容器存储Elara,阿里云也支持通过数据卷(支持OSSFS和NAS)来管理用户的容器数据。
基于容器的存储方案和传统的存储方案的区别
作为非存储领域的人,尝试从容器的角度理解下基于容器的存储方案和传统的存储方案的区别:
容器更易变:
- 存储要能随着容器迁移自动挂载
- 要能和已有容器调度框架整合
容器更细粒度和高密度:
- 这样场景下的拷贝、快照、Quota、流控有新的挑战
容器和后端存储的对接:
- 需要考虑在不同的环境下(公有云、自有机房等)支持不同的存储后端
- 如何横向扩展
- 如何保证挂载速度(挂载了卷轴后是否还能做到容器秒级启动?)
- 更友好的动态显示容器的挂载状态(挂载中、等待中等)
- 是否可以复用容器所在机器的存储资源
应用感知和云端感知:
- 根据容器的部署信息,对后端存储做调度,数据贴近服务
- 如何根据运行节点和存储节点间的网络情况做相应的调度
- 识别云平台的可用区概念和地域
我们再回顾下在使用容器之前的几种简单玩法:
- 单机:很多VPS的场景,固定一台机器,数据不迁移。
- 多机共享存储:块存储(SAN)、文件存储(NAS)、对象存储(OSS)
- 多机数据拷贝:数据层拷贝(rsync)、应用层拷贝(如mysql binlog)
接下来分别看下几家厂商的存储方案:
ClusterHQ:
Flocker:
Flocker是较早推出的一个开源容器数据卷管理框架,对接了SwarmKubernetsMesosphere,基于Ext4支持很多的存储后端。
Volume Hub:
Flocker的图形化工具,支持显示所有节点上的容器、卷轴信息以及绑定状态,还支持数据卷的日志显示,很方便问题排查。目前还只是0.1 alpha版本。
dvol:
可以像git一样的版本管理Docker的数据卷,非常赞的功能,便于在调试阶段做对比。其实际上也是一个docker 的volume plugin。
- docker run -v demo:/path --volume-driver=dvol
- dvol commit -m "commit description"
- dvol checkout -b newbranch
华为 Elara
Elara定位于容器编排框架和底层存储的桥梁,相对于Flocker,有一些设计上的区别:
- Flocker有中心节点,而Elara的所有Agent是分布式无状态的,只依赖kv
- 目前Flocker依赖的Docker的volume plugin接口比较少,只有创建和Mount的操作。Elara在自己的API上额外支持了快照、备份和流控等接口。
- 类似于Cinder支持存储资源调度
Portworx
Portworx是一家位于加州的初创公司。他的定位非常明确:在容器时代,专门购买存储设备是一个不符合潮流的做法。而使用Portworx的产品,可以直接利用运行容器的x86机器作为存储载体,其存储和管理节点也是以容器方式运行。存储成本可以降低70%,同时支持容器级别的快照、复制等管理能力。本月刚推出了企业版的PX-Enterprise产品。
下面展示的是在kubernets上部署myql的示例:
apiVersion: v1
kind: Pod
metadata:
name: mysql
labels:
name: mysql
spec:
containers:
-
name: mysql
image: mysql:latest
env:
-
name: MYSQL_PASSWORD
value: mysql
ports:
-
containerPort: 3306
volumeMounts:
- name: mysql-persistent-storage
mountPath: /var/lib/mysql
volumes:
- name: mysql-persistent-storage
pwxDiskName: mysql-disk
fsType: ext4
cos:2
snapshots: 12h #定时快照时间
haFactor: 3
size: 4TB
EMC
EMC code也不甘落后,在原有开源产品libStorage之上,拥抱容器社区,将存储作为一等公民,提供平台无关的框架,支持存储的生产、编排和控制。libStorage支持三种架构:嵌入式、集中式和分布式。libStorage通过REX-Ray提供厂商无关的存储编排引擎,为Docker和Mesos运行环境提供支持。
下图为libStorage分布式架构图:
阿里云
阿里云容器服务也提供了数据卷的功能帮忙用户更好的管理存储,目前支持通过OSSFS和NAS提供共享文件存储。
OSSFS
ossfs是阿里云官方提供的基于FUSE的文件系统,项目主页见https://github.com/aliyun/ossfs。
ossfs适合于对IO性能要求比较低并且没有文件改写的场景,如保存wordpress上传的配置和图片。
ossfs和本地文件系统具体差异:
- 随机或者追加写文件会导致整个文件的重写。
- 元数据操作,例如list directory,性能较差,因为需要远程访问OSS服务器。
- 文件/文件夹的rename操作不是原子的。
- 多个客户端挂载同一个oss bucket时,依赖用户自行协调各个客户端的行为。例如避免多个客户端写同一个文件等等。
- 不支持hard link。
虽然OSSFS在使用场景和性能上会比接下来介绍的NAS方案弱一些,但是价格会便宜很多。
NAS
阿里云NAS是面向阿里云ECS实例的文件存储服务,提供标准的文件访问协议,用户无需对现有应用做任何修改,即可使用具备无限容量及性能扩展、单一命名空间、多共享、高可靠和高可用等特性的分布式文件系统。
只需要两步即可完成数据卷的管理:
- 创建数据卷,设置数据卷的名称、阿里云NAS产品的文件系统ID和挂载点域名
- 创建容器时设置容器内部路径,设置上一个步骤的数据卷名就可完成目录映射。
阿里云容器服务正在测试对云盘的支持,会在近期推出。除此以外,阿里云容器服务支持标准的Docker volume plugin机制,任何volume插件都可以方便的集成进来,一些合作伙伴的集成也正在火热进行中。想了解更多阿里云容器服务的内容,请访问:http://www.aliyun.com/product/containerservice