开发者社区> nas-hz> 正文
阿里云
为了无法计算的价值
打开APP
阿里云APP内打开

云上NAS的备份实践

简介:
+关注继续查看

数据存储是各类应用的核心,它决定着应用的生死存亡。所存储的数据的安全性,与上层应用的安全性、可靠性、可用性息息相关。应用层的Bug、运维人员的误操作、不可预知的环境因素,都有可能会危及数据的完整性与可用性,进而导致应用的不可用。无数次的运维人员误删数据库、硬盘损坏、施工挖断电缆,正向我们展示了数据存储的脆弱性,也警示着我们要时刻关注数据安全性问题。而备份,则是提升数据安全性的重要手段之一,它可以以额外的存储空间、带宽消耗以及CPU消耗来换取更高的数据安全性。

阿里云文件存储(NAS,Network Attached Storage)是一种分布式的网络文件存储系统,为ECS、HPC、Docker、Batch Compute等提供安全、无限容量、高性能、高可靠、简单易用的文件存储服务。

作为直接支持用户应用的存储服务,NAS在数据可用性、数据可靠性、数据安全性上进行了大量的开发、优化与支持,并提供了一系列的服务帮助用户更好地了解他们的数据、管理他们的数据。备份服务是NAS提供的诸多功能之一,以帮助用户进一步提高他们的数据安全性,使得数据不再畏惧于天灾或者人祸。目前,NAS备份服务还处于公测当中,正式版本的备份服务也在紧张的设计与开发当中。接下来,本文将介绍NAS正在公测的备份服务的使用方法与典型实践。

NAS备份服务架构

NAS备份服务架构如图所示:

image

Backup Service会根据Backup Plan来将任务下发到Backup Executor,Backup Executor会将待备份文件系统的数据从一个可用区传输到另外一个可用区中。

备份实践

在对数据进行备份时,我们需要考虑三个问题:

  1. 备份的触发:我们在什么情况下需要进行一次备份?
  2. 备份的历史变更:一系列备份后形成的版本历史线。
  3. 备份的使用:主数据出现问题时,我们需要从备份版本历史线中选出一个版本,并进行恢复。

我们将从这三个维度来介绍NAS备份服务的使用与实践。

备份的触发

新建备份时,用户可以指定文件系统的备份触发策略,备份触发策略由两个参数值确定:备份开始时间与备份间隔时间。备份开始时间指定了备份操作第一次被触发的时间,备份间隔时间指定了上一次备份完成后下一次备份执行的时间。两个值协同起来,定义了时间维度上一系列备份的触发。那么,我们应该如何设置这两个值呢?

NAS备份服务在对源文件系统进行备份时,会发生数据传输,而数据传输的过程会消耗一定的CPU与带宽。为了避免影响用户的正常服务,备份服务会对整个备份过程进行流控。另一方面,整个过程视源文件系统的大小而消耗不同的时间。显然,备份服务会对源文件系统的IOPS与带宽有略微的消耗。如果希望完全避免备份服务对文件系统正常服务的影响,我们需要精心设置备份开始时间与备份间隔时间。一种可行的方法是将备份开始时间设置为00:00,将间隔时间设置为24小时。这样,备份服务会总是在业务压力较小的凌晨运行,从而做到普通用户无感知。
除了自动触发备份外,NAS备份服务还提供了手动触发备份,给用户以最大的灵活性来进行数据备份。

备份历史

每一次的备份运行,都会生成文件系统的一个实时备份,一系列的备份组成了文件系统的一个备份历史。我们在创建备份时,可以设置备份保留份数。显然,保留的份数越多,当系统不幸出现数据损坏时,我们可以追溯的时间越久,我们甚至可以追溯到数天、数周、甚至数月以前的数据。然而,备份需要消耗大量的存储资源,保留的备份份数越多,所付出的成本也就越大。当然,目前正在公测中的NAS备份服务是完全免费的。为了在数据安全性与成本之间做出妥善的权衡,我们需要认真思考备份开始时间、备份间隔时间、备份保留份数。一个可行的方案是每天凌晨备份一次,保留三份备份。这种设置可以将备份对业务的压力降到最低,同时,在数据出现故障时,留给运维人员一定的时间(三天)去发现它,并进行恢复。

备份恢复

当主数据不幸出现故障而被损坏时,我们需要使用备份过的副本进行恢复。数据恢复涉及到线上数据的变更,这是一个高危操作,操作失误可能会误覆盖掉线上正确的数据。为了尽可能的避免运维人员此类误操作,NAS备份服务对备份恢复添加了较为严格的限制:恢复的目标文件系统必须是一个空文件系统。这种强制限制为用户提供了多一次的思考机会,并且在很大程度上杜绝了运维人员覆盖其他可用线上数据的情况。

备份服务使用示例

下面演示NAS备份服务的使用方法。

  1. 申请公测资格
    image
  2. 创建备份任务
    image

image

  1. 手动触发一次备份(一般不需要,自动触发足够了)
    image
  2. 查看备份进度
    image

image

  1. 数据恢复
    image

结语

数据可靠性、可用性、安全性是用户应用的生死线,阿里云文件存储致力于为用户提供高性能、高一致性的共享文件存储服务,同时,数据可靠性、可用性、安全性也是我们从不妥协的底线,我们将一直心怀敬畏、砥砺前行,为用户提供更好、更强、更宜用的文件存储服务。欢迎广大用户参与进来,提出宝贵的意见,帮助我们做到更好。您的每一次使用,都是我们前进的无限动力。

参考资料

  1. NAS备份服务文档

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
【NLP最佳实践】Huggingface Transformers实战教程
【NLP最佳实践】Huggingface Transformers实战教程
100 0
【实战】K8S部署Nacos微服务(2)
【实战】K8S部署Nacos微服务(2)
160 0
云上实践初体验
在老师的引领下,我们通过阿里云开启了云上学习实践之旅,使用云服务器等产品制作个人简历网站,博客等,在操作过程中我对相关知识有了更多的了解,为专业课程的深入学习奠定了基础。
118 0
数禾云上数据湖最佳实践
数禾科技从成立伊始就组建了大数据团队并搭建了大数据平台。并在ECS上搭建了自己的Cloudera Hadoop集群。但随着公司互联网金融业务的快速扩张发展,大数据团队承担的责任也越来越重,实时数仓需求,日志分析需求,即席查询需求,数据分析需求等,每个业务提出的需求都极大的考验这个Cloudera Hadoop集群的能力。为了减轻Cloudera集群的压力,我们结合自身业务情况,在阿里云上落地一个适合数禾当前现实状况的数据湖。
1115 0
数禾云上数据湖最佳实践
数禾科技从成立伊始就组建了大数据团队并搭建了大数据平台。并在ECS上搭建了自己的Cloudera Hadoop集群。但随着公司互联网金融业务的快速扩张发展,大数据团队承担的责任也越来越重,实时数仓需求,日志分析需求,即席查询需求,数据分析需求等,每个业务提出的需求都极大的考验这个Cloudera Hadoop集群的能力。为了减轻Cloudera集群的压力,我们结合自身业务情况,在阿里云上落地一个适合数禾当前现实状况的数据湖。
421 0
HBR云上统一备份
本文介绍如何在云上对文件系统进行备份,通过阿里云HBR可以对 ECS文件系统、NAS文件、OSS对象存储文件,以及ECS上自建的SQL Server、SAP HANA数据库进行统一备份、管理和恢复。
1078 0
HBR云上统一备份
本文介绍如何在云上对文件系统进行备份,通过阿里云HBR可以对 ECS文件系统、NAS文件、OSS对象存储文件,以及ECS上自建的SQL Server、SAP HANA数据库进行统一备份、管理和恢复。
2107 0
机器学习在高德起点抓路中的应用实践 | 7月18号云栖夜读
今天的首篇文章,讲述了:高德地图作为中国领先的出行领域解决方案提供商,导航是其核心用户场景。路线规划作为导航的前提,是根据起点、终点以及路径策略设置,为用户量身定制出行方案。起点抓路,作为路线规划的初始必备环节,其准确率对于路线规划质量及用户体验至关重要。
35301 0
+关注
nas-hz
阿里云NAS文件存储团队出品的技术博客
29
文章
0
问答
来源圈子
更多
阿里云存储基于飞天盘古2.0分布式存储系统,产品包括对象存储OSS、块存储Block Storage、共享文件存储NAS、表格存储、日志存储与分析、归档存储及混合云存储等,充分满足用户数据存储和迁移上云需求,连续三年跻身全球云存储魔力象限四强。
+ 订阅
文章排行榜
最热
最新
相关电子书
更多
低代码开发师(初级)实战教程
立即下载
阿里巴巴DevOps 最佳实践手册
立即下载
冬季实战营第三期:MySQL数据库进阶实战
立即下载