ACK集群中云盘数据卷的备份恢复方案

本文涉及的产品
容器镜像服务 ACR,镜像仓库100个 不限时长
简介: 在阿里云ACK集群中部署有状态服务通常使用云盘数据卷做数据存储,云盘本身提供了数据的备份(快照)恢复机制,但是如何将底层能力和K8S服务集成并灵活的提供给应用使用,是云原生存储服务需要解决的问题。K8S使用如下两个特性来实现备份恢复能力: 通过VolumeSnapshot对象实现云盘的备份(快照.

在阿里云ACK集群中部署有状态服务通常使用云盘数据卷做数据存储,云盘本身提供了数据的备份(快照)恢复机制,但是如何将底层能力和K8S服务集成并灵活的提供给应用使用,是云原生存储服务需要解决的问题。K8S使用如下两个特性来实现备份恢复能力:

通过VolumeSnapshot对象实现云盘的备份(快照功能);

通过PVC中的DataSource功能实现数据的恢复(快照恢复);

由于VolumeSnapshot在K8S 1.16版本处于Alpha状态,所以ACK集群当前没有默认部署快照功能,需要手动安装插件才能使用;

K8S快照说明:

在Kubernetes中为了实现快照相关功能,通过CRD定义了下面3个相关资源类型:

VolumeSnapshotContent:描述存储后端的快照实例,由系统管理员创建维护,无NameSpace;类比于PV概念;

VolumeSnapshot:声明一个快照实例,由用户创建维护,属于特定NameSpace;类比于PVC概念;

VolumeSnapshotClass:定义一个快照类,描述创建快照使用的参数、Controller;类比于StorageClass概念;

快照资源绑定规则:

在使用Snapshot对象时,和pv、pvc一样,VolumeSnapshot与VolumeSnapshotContent需要首先进行绑定;

VolumeSnapshot如果没有静态VolumeSnapshotContent可以绑定,则会创建动态VolumeSnapshotContent;

VolumeSnapshotContent 与 VolumeSnapshot 绑定是一对一;

删除VolumeSnapshotContent 同时会把后端的快照也删除;

1.卷快照模板

下面是一个VolumeSnapshotClass定义模板:

apiVersion: snapshot.storage.k8s.io/v1beta1
kind: VolumeSnapshotClass
metadata:
  name: default-snapclass
driver: diskplugin.csi.alibabacloud.com
parameters:
  forceDelete: "false"
deletionPolicy: Delete

其中:

driver:定义了使用这个快照类的VolumeSnapshot所使用的controller;

deletionPolicy: 表示删除volumeSnapshot的时候,volumeSnapshotContent是否删除;

forceDelete: 表示是否允许在云盘引用快照的时候删除快照(默认是不允许删除的,因为以快照为数据源创建云盘时,创建过程会有时延,强制删除可能会造成数据丢失);

下面是一个VolumeSnapshot定义模板:

apiVersion: snapshot.storage.k8s.io/v1beta1
kind: VolumeSnapshot
metadata:
  name: new-snapshot-demo
spec:
  volumeSnapshotClassName: default-snapclass
  source:
    persistentVolumeClaimName: disk-ssd-web-0

其中:

persistentVolumeClaimName:定义使用哪个pvc作为快照源;

volumeSnapshotClassName:定义了打快照使用的快照类;

2.通过快照恢复数据

通过云盘快照创建云盘是阿里云云盘提供的基础功能。在容器服务中通过在pvc定义DataSource指定使用哪个快照,动态创建云盘的时候即可实现使用快照创建云盘;

kind: PersistentVolumeClaim
apiVersion: v1
metadata:
  name: disk-snapshot
spec:
  accessModes:
    - ReadWriteOnce
  storageClassName: alicloud-disk-ssd
  dataSource:
    name: new-snapshot-demo
    kind: VolumeSnapshot
    apiGroup: snapshot.storage.k8s.io
  resources:
    requests:
      storage: 20Gi

其中:

storageClassName:定创建pv的存储类,指向的disk controller需要支持DataSource特性;

dataSource:指定snapshot资源,说明创建云盘会使用这个快照数据;

插件部署:

集群准备:

部署csi-snapshotter前,您需要创建一个ACK 1.16版本集群,并在创建集群的时候选择使用CSI插件;集群创建

部署CRD & Snapshot:

下载snapshotter crd模板:https://github.com/kubernetes-sigs/alibaba-cloud-csi-driver/blob/master/deploy/disk/snapshot/crd.yaml

下载csi-snapshotter模板:https://github.com/kubernetes-sigs/alibaba-cloud-csi-driver/blob/master/deploy/disk/snapshot/csi-snapshotter.yaml

部署插件:

$ kubectl apply -f crd.yaml
$ kubectl apply -f csi-snapshotter.yaml

部署完成后集群中csi插件如下:

# kubectl get crd
NAME                                             CREATED AT
volumesnapshotclasses.snapshot.storage.k8s.io    2020-06-17T09:36:32Z
volumesnapshotcontents.snapshot.storage.k8s.io   2020-06-17T09:36:32Z
volumesnapshots.snapshot.storage.k8s.io          2020-06-17T09:36:32Z

# kubectl get pod -nkube-system |grep csi-snap
csi-snapshotter-d78f57d4d-rmjhp                     3/3     Running   0          54m

使用:

下图是一个使用示例流程图,分成1、2、3三个步骤:

image

步骤1:创建原始应用,创建云盘卷保存数据;

步骤2:创建VolumeSnapshot,这时会自动创建VolumeSnapshotContent和存储端的快照实例;

步骤3:创建新的应用,并配置PVC引用步骤2中创建的快照对象;

通过上述三步实现了:

备份:Volume1中的数据备份到Snapshot1;

恢复:Snapshot1的数据(Volume1的数据)恢复成Volume2卷;

创建VolumeSnapshotClass快照类:

下载VolumeSnapshotClass模板:https://github.com/kubernetes-sigs/alibaba-cloud-csi-driver/blob/master/examples/disk/snapshot/snapshotclass.yaml

$ kubectl apply -f calss.yaml

apiVersion: snapshot.storage.k8s.io/v1beta1
kind: VolumeSnapshotClass
metadata:
  name: default-snapclass
driver: diskplugin.csi.alibabacloud.com
deletionPolicy: Delete
# kubectl get VolumeSnapshotClass
NAME                AGE
default-snapclass   4h40m

步骤1:创建原始应用并写入数据:

$ kubectl apply -f sts.yaml

apiVersion: apps/v1
kind: StatefulSet
metadata:
  name: web
spec:
  selector:
    matchLabels:
      app: nginx
  serviceName: "nginx"
  replicas: 1
  template:
    metadata:
      labels:
        app: nginx
    spec:
      containers:
      - name: nginx
        image: nginx
        volumeMounts:
        - name: disk-ssd
          mountPath: /data
  volumeClaimTemplates:
  - metadata:
      name: disk-ssd
    spec:
      accessModes: [ "ReadWriteOnce" ]
      storageClassName: "alicloud-disk-snap"
      resources:
        requests:
          storage: 20Gi

往pod中写入数据:

# kubectl exec -ti web-0 touch /data/test
# kubectl exec -ti web-0 ls /data
lost+found  test

步骤2:创建VolumeSnapshot:

$ kubectl apply -f snapshot.yaml

apiVersion: snapshot.storage.k8s.io/v1beta1
kind: VolumeSnapshot
metadata:
  name: new-snapshot-demo
spec:
  volumeSnapshotClassName: default-snapclass
  source:
    persistentVolumeClaimName: disk-ssd-web-0

检查集群状态,VolumeSnapshot、VolumeSnapshotContent创建完成,同时到ECS控制台查看快照实例也创建完成:

# kubectl get volumesnapshots.snapshot.storage.k8s.io
NAME                AGE
new-snapshot-demo   36m

# kubectl get VolumeSnapshotContent
NAME                                               AGE
snapcontent-222d4dbb-beb4-49e5-8e11-ca6358c62123   36m

步骤3:数据恢复

$ kubectl apply -f sts-snapshot.yaml

apiVersion: v1
kind: Service
metadata:
  name: nginx
  labels:
    app: nginx
spec:
  ports:
  - port: 80
    name: web
  clusterIP: None
  selector:
    app: nginx
---
apiVersion: apps/v1beta2
kind: StatefulSet
metadata:
  name: web-restore
spec:
  selector:
    matchLabels:
      app: nginx
  serviceName: "nginx"
  replicas: 1
  template:
    metadata:
      labels:
        app: nginx
    spec:
      hostNetwork: true
      containers:
      - name: nginx
        image: nginx
        command: ["sh", "-c"]
        args: ["sleep 10000"]
        volumeMounts:
        - name: disk-ssd
          mountPath: /data
  volumeClaimTemplates:
  - metadata:
      name: disk-ssd
    spec:
      accessModes: [ "ReadWriteOnce" ]
      storageClassName: alicloud-disk-ssd
      resources:
        requests:
          storage: 20Gi
      dataSource:
        name: new-snapshot-demo
        kind: VolumeSnapshot
        apiGroup: snapshot.storage.k8s.io

在volumeClaimTemplates定义中指定dataSource为VolumeSnapshot类型,且选择步骤2创建的名字为new-snapshot-demo的VolumeSnapshot。

查看容器数据,验证是否恢复成功:

# kubectl exec -ti web-restore-0 ls /data
lost+found  test

可见实现了数据的恢复。

本方案只给出了创建一个快照并进行恢复的场景,后续我们会提供创建定时快照的方案。

相关实践学习
通过Ingress进行灰度发布
本场景您将运行一个简单的应用,部署一个新的应用用于新的发布,并通过Ingress能力实现灰度发布。
容器应用与集群管理
欢迎来到《容器应用与集群管理》课程,本课程是“云原生容器Clouder认证“系列中的第二阶段。课程将向您介绍与容器集群相关的概念和技术,这些概念和技术可以帮助您了解阿里云容器服务ACK/ACK Serverless的使用。同时,本课程也会向您介绍可以采取的工具、方法和可操作步骤,以帮助您了解如何基于容器服务ACK Serverless构建和管理企业级应用。 学习完本课程后,您将能够: 掌握容器集群、容器编排的基本概念 掌握Kubernetes的基础概念及核心思想 掌握阿里云容器服务ACK/ACK Serverless概念及使用方法 基于容器服务ACK Serverless搭建和管理企业级网站应用
目录
相关文章
|
1天前
|
Prometheus Kubernetes 监控
OpenAI故障复盘 - 阿里云容器服务与可观测产品如何保障大规模K8s集群稳定性
聚焦近日OpenAI的大规模K8s集群故障,介绍阿里云容器服务与可观测团队在大规模K8s场景下我们的建设与沉淀。以及分享对类似故障问题的应对方案:包括在K8s和Prometheus的高可用架构设计方面、事前事后的稳定性保障体系方面。
|
4天前
|
Kubernetes 网络协议 应用服务中间件
Kubernetes Ingress:灵活的集群外部网络访问的利器
《Kubernetes Ingress:集群外部访问的利器-打造灵活的集群网络》介绍了如何通过Ingress实现Kubernetes集群的外部访问。前提条件是已拥有Kubernetes集群并安装了kubectl工具。文章详细讲解了Ingress的基本组成(Ingress Controller和资源对象),选择合适的版本,以及具体的安装步骤,如下载配置文件、部署Nginx Ingress Controller等。此外,还提供了常见问题的解决方案,例如镜像下载失败的应对措施。最后,通过部署示例应用展示了Ingress的实际使用方法。
18 2
|
16天前
|
人工智能 Kubernetes 安全
赋能加速AI应用交付,F5 BIG-IP Next for Kubernetes方案解读
赋能加速AI应用交付,F5 BIG-IP Next for Kubernetes方案解读
56 13
|
16天前
|
存储 Kubernetes 关系型数据库
阿里云ACK备份中心,K8s集群业务应用数据的一站式灾备方案
本文源自2024云栖大会苏雅诗的演讲,探讨了K8s集群业务为何需要灾备及其重要性。文中强调了集群与业务高可用配置对稳定性的重要性,并指出人为误操作等风险,建议实施周期性和特定情况下的灾备措施。针对容器化业务,提出了灾备的新特性与需求,包括工作负载为核心、云资源信息的备份,以及有状态应用的数据保护。介绍了ACK推出的备份中心解决方案,支持命名空间、标签、资源类型等维度的备份,并具备存储卷数据保护功能,能够满足GitOps流程企业的特定需求。此外,还详细描述了备份中心的使用流程、控制台展示、灾备难点及解决方案等内容,展示了备份中心如何有效应对K8s集群资源和存储卷数据的灾备挑战。
|
1月前
|
Kubernetes 监控 Cloud Native
Kubernetes集群的高可用性与伸缩性实践
Kubernetes集群的高可用性与伸缩性实践
74 1
|
2月前
|
JSON Kubernetes 容灾
ACK One应用分发上线:高效管理多集群应用
ACK One应用分发上线,主要介绍了新能力的使用场景
|
2月前
|
Kubernetes 持续交付 开发工具
ACK One GitOps:ApplicationSet UI简化多集群GitOps应用管理
ACK One GitOps新发布了多集群应用控制台,支持管理Argo CD ApplicationSet,提升大规模应用和集群的多集群GitOps应用分发管理体验。
|
2月前
|
Kubernetes Cloud Native 云计算
云原生之旅:Kubernetes 集群的搭建与实践
【8月更文挑战第67天】在云原生技术日益成为IT行业焦点的今天,掌握Kubernetes已成为每个软件工程师必备的技能。本文将通过浅显易懂的语言和实际代码示例,引导你从零开始搭建一个Kubernetes集群,并探索其核心概念。无论你是初学者还是希望巩固知识的开发者,这篇文章都将为你打开一扇通往云原生世界的大门。
147 17
|
2月前
|
Kubernetes Ubuntu Linux
Centos7 搭建 kubernetes集群
本文介绍了如何搭建一个三节点的Kubernetes集群,包括一个主节点和两个工作节点。各节点运行CentOS 7系统,最低配置为2核CPU、2GB内存和15GB硬盘。详细步骤包括环境配置、安装Docker、关闭防火墙和SELinux、禁用交换分区、安装kubeadm、kubelet、kubectl,以及初始化Kubernetes集群和安装网络插件Calico或Flannel。
208 4
|
2月前
|
Kubernetes 应用服务中间件 nginx
搭建Kubernetes v1.31.1服务器集群,采用Calico网络技术
在阿里云服务器上部署k8s集群,一、3台k8s服务器,1个Master节点,2个工作节点,采用Calico网络技术。二、部署nginx服务到k8s集群,并验证nginx服务运行状态。
983 1

相关产品

  • 容器服务Kubernetes版
  • 推荐镜像

    更多