玩转ECS第7讲 | ECS数据保护-数据备份新特性与最佳实践

本文涉及的产品
云服务器 ECS,u1 2核4GB 3个月
云服务器 ECS,u1 4核8GB 1个月
云服务器 ECS,每月免费额度200元 3个月
简介: 本文中,阿里云智能弹性计算专家余初武(悟元)将结合阿里云近期推出的数据备份新特性(快照极速备份、一致性快照组)来介绍云上环境如何做数据备份的最佳实践;适合需要构建云上架构的工程师,架构师和云上实施从业人员收看。

关键词:极速备份、崩溃一致性、异地备份

演讲嘉宾简介:余初武(悟元),阿里云技术专家,2011年加入阿里巴巴,一直从事服务端研发工作;2015年加入阿里云ECS团队,在ECS管控、云盘、快照等多个管控领域有丰富的研发经验。

以下内容根据演讲视频以及PPT整理而成。观看回放
更多课程请进入“玩转ECS详情页”了解

本次分享主要围绕以下三个方面:

一、快照极速可用特性
二、一致性快照组
三、总结与思考

数据是企业重要资产,作为存储数据的介质,IT设施发生问题是不可避免的,人为误操作或者程序bug导致数据丢失的情况也偶有发生。因此,每一个企业都应该做好数据备份,保证数据的安全与业务的可用。

为了提升备份与同步的性能,阿里云推出了快照极速可用特性和一致性快照组,为了客户提供更高性能的数据备份功能。

本文将重点介绍如何利用这两个新特性,以及阿里云提供的各种运维部署工具,便捷地完成云上自建数据库的数据备份的两个最佳实践。

第一个是自建数据库的磁盘扩容场景,适用于大多数的企业;第二个则是使用了多磁盘自建数据库的场景,则更多见于大型复杂的业务。

一、极速可用特性——秒级,非一致性数据备份

阿里云ECS的极速可用特性主要包括四个方面,分别是快照秒级可用、云盘回滚性能0损失、ESSD增值特性以及全地域支持等。阿里云ECS极速可用特性的典型使用场景包括快速搭建研发测试环境;业务关键配置的变更保护,实现秒级备份相关磁盘数据;云盘极速回滚,并实现回滚的磁盘性能无损耗。

image.png

基于极速可用的特性,用户仅需要几秒钟的时间就可以复制出一个新磁盘。

这一过程也非常简单,首先创建一个带极速可用特性的快照,关键参数的设置如下图所示,主要包括InstantAccess和InstantAccessRetentionDays,前者设置为True就可以设置成为极速可用的快照,后者则是极速可用特性的保留天数,可以让这特性到期之后就会自动被关闭。当快照创建完成(极速可用特性开启的情况下,不需要等快照进度完成)之后,就能够快速创建磁盘并立即挂载使用。

image.png

案例:自建数据库,磁盘空间不够,怎么办?

在这样的情况下,最直接能想到的解决方案是纯人工方式。

首先,对于需要扩容的磁盘打好一个普通快照,这个过程一般都比较慢,往往需要几分钟、几小时以及几天不等的时间。

其次,需要人工登录到控制台对磁盘进行在线扩容。

再次,要登录到实例内部找到相应的磁盘进行扩展分区以及文件系统等各种命令的操作,而这些命令往往是非常复杂的,也是非常容易出错的。

这一方案的缺点十分明显,那就是耗时很久,平均需要1到2小时,而且很容易出错。

image.png

而目前阿里云推荐的最佳解决方案是将上述过程全部通过编码实现自动化,做成OOS(运维编排,Operation Orchestration Service)的模板,通过OOS模块实现一键扩容,完成上述方案的全部过程。

这种方案的使用方式就非常简单了,用户可以直接进入到OOS控制台,找到相应的模板并创建一个相应的执行即可,整个过程只需要几十秒就可以完成,而且可以进一步优化至十几秒。

image.png

接下来对于刚才提到的OOS一键扩容的关键技术内幕进行讲解。

其实在该方案背后主要包括三个关键技术:分别是快照的极速可用特性通过云助手执行扩展分区的命令以及磁盘的序列号

这里值得注意的是通过云助手执行扩展分区命令时,我们无法知道具体扩展的是哪一块磁盘,因此才需要磁盘的序列号。

磁盘序列号这一特性目前在公有云ECS上也已经上线了,用户通过DescribeDisks就可以返回磁盘序列号SerialNumber,之后通过云助手将磁盘序列号传递给GuestOS内部的脚本,而GuestOS内部的脚本则可以通过udevadm info这串命令获取任意一块磁盘已挂载设备的序列号,这个序列号与DescribeDisks返回的序列号是完全一致的,而且从磁盘诞生之后,序列号就不会再发生任何改变,因此可以作为磁盘在GuestOS内部的唯一标识,并且与OpenABI的接口实现唯一关联。

这样才能帮助我们准确无误地找到需要扩展的磁盘去执行相应的命令。同时,因为ECS具有快照极速可用特性,秒级地打出了一个数据备份,一旦发生任何意外,还可以通过快照实现秒级回滚,基本可以做到万无一失地实现自动扩容过程。

image.png

二、一致性快照组——崩溃一致性数据备份

介绍完快照极速可用特性,我们继续跟大家分享下一致性快照组。

一致性快照组的主要特点主要包括四点:即多云盘IO写入一致性、ESSD云盘增值特性、实例级别保护以及功能免费。

适用的场景主要有三种:

第一种场景,企业上云的时候可以实现实例级别整机的保护和备份;
第二种场景,自建数据库特别是跨多云盘自建数据的模式下,一定要使用一致性快照来备份;
第三种场景是SAP HANA的整机一致性保护,也需要用到一致性快照。

image.png

案例:使用多数据盘自建数据库

这里要介绍的案例是自建数据库时使用了多数据盘,这样的做法主要是为了将数据库常见的日志和数据拆分到独立的云盘上去,使得整个数据库的性能和稳定性都能够得到较大的提升,同时实现日志和数据的读写隔离。

在这种情况下,一旦需要拆分就会遇到两块磁盘上数据存在强关联关系的问题。熟悉数据库的同学都知道,任何一次写操作都会先进行日志操作,日志写完之后再去修改真正的数据,当数据写入完成之后再回来修改日志,比如像MySQL的Redo日志等。

可见,日志和数据存在强依赖逻辑关系,此时如果打普通快照,那么存在任何一点点时差都会导致写入数据在两块磁盘上存在不一致的问题,此时就必须要用到一致性快照,实现崩溃一致性的数据备份。

image.png

对于这样的案例场景,阿里云也提供了最佳实践,也就是使用ROS(资源编排,Resource Orchestration Service)。

该方案的基本过程就是将上述理念通过ROS实现模板化,通过ROS创建完全一样的数据库系统。方案关键点在于创建两块独立的数据盘,一块放数据,另外一块放日志,同时对于两块数据盘赋予系统的数据库快照策略Auto Snapshot Policy,并定期地对于两块盘进行数据备份,并且使用一致性快照进行备份,避免出现废弃数据的问题。

image.png

三、总结与思考

以上的案例都是基于自建数据库的,这两个案例的关键点在于多数据盘和自动扩容磁盘。

将上述两个案例进行串联才能够看到真实的使用场景,也就是先用ROS固化上述提到的最佳实践过程,也就是实现多数据盘,即日志盘和数据盘的隔离,并且使用自动快照的策略定期地打一致性快照。

与此同时,配上云监控就能够在磁盘空间不足的时候,及时报警,此时在通过OOS一键扩容实现磁盘的自动扩容。

当然,这个过程还可以更进一步优化,在OOS控制台配置相应的云监控项目,当收到监控项报警之后自动触发OOS运行和扩容的模板进行一键扩容,真正地实现自动扩容,也就是所谓“无人值守”。

image.png

对于本次介绍的新特性进行总结,本次主要介绍了极速可用和一致性快照两个新特性,这两个新特性很快就会上线供大家使用。

对于极速可用特性而言,建议结合OOS、云助手来磁盘或者其他场景的自动运维实践。如果要对云盘进行操作或者自动化运维则需要使用磁盘序列号在GuestOS内部唯一地标识一块磁盘,这样才能做到准确无误。一致性快照则是在MySQL这种多盘场景下才会使用,主要用来实现奔溃一致性备份。

image.png

本次分享到此结束,感兴趣的同学可持续关注和学习云上环境数据保护最佳实践。


关注百晓生,笑谈云计算

二维码-三分之一.gif

相关实践学习
ECS云服务器新手上路
本实验会自动创建一台ECS实例。首先,远程登陆ECS实例,并部署应用。然后,登陆管理控制台,并对这台ECS实例进行管理操作。
7天玩转云服务器
云服务器ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,可降低 IT 成本,提升运维效率。本课程手把手带你了解ECS、掌握基本操作、动手实操快照管理、镜像管理等。了解产品详情: https://www.aliyun.com/product/ecs
相关文章
|
10天前
|
缓存 监控 Java
Java Socket编程最佳实践:优化客户端-服务器通信性能
【6月更文挑战第21天】Java Socket编程优化涉及识别性能瓶颈,如网络延迟和CPU计算。使用非阻塞I/O(NIO)和多路复用技术提升并发处理能力,减少线程上下文切换。缓存利用可减少I/O操作,异步I/O(AIO)进一步提高效率。持续监控系统性能是关键。通过实践这些策略,开发者能构建高效稳定的通信系统。
|
2月前
|
云安全 弹性计算 运维
云服务器ECS特性
云服务器ECS(Elastic Compute Service)是一种产品丰富、安全可靠、便捷易用、弹性可伸缩的云计算服务,助您降低IT成本,提升运维效率,使您更专注于核心业务创新。
41 5
|
2月前
|
存储 弹性计算 运维
ECS特性与优势
云服务器ECS(Elastic Compute Service)是一种产品丰富、安全可靠、便捷易用、弹性可伸缩的云计算服务,助您降低IT成本,提升运维效率,使您更专注于核心业务创新。
38 4
|
2月前
|
弹性计算 运维 Java
最佳实践:阿里云倚天ECS在千寻位置时空智能服务的规模化应用
阿里云、平头哥及安谋科技联合举办的飞天技术沙龙探讨了倚天Arm架构在业务创新中的应用。活动中,千寻位置运维专家分享了将核心业务迁移到倚天处理器ECS实例的成功案例,强调了倚天处理器的高能效比和降本增效优势。迁移过程涉及操作系统、CICD系统和监控系统的适配,以及业务系统的性能测试。目前,千寻已迁移了上千台ECS实例到倚天处理器,实现了成本和效率的显著提升。未来计划继续扩展倚天处理器在核心业务和K8S中的应用。
|
2天前
|
弹性计算 安全 Shell
阿里云ECS安全加固:从访问控制到数据保护的全方位策略
【6月更文挑战第29天】阿里云ECS安全聚焦访问控制、系统加固及数据保护。安全组限定IP和端口访问,密钥对增强SSH登录安全;定期更新补丁,使用防病毒工具;数据备份与加密确保数据安全。多维度策略保障业务安全。
25 15
|
6天前
|
网络协议 安全 数据挖掘
F5《企业DNS建设白皮书》中的DNS解析服务器最佳实践
F5《企业DNS建设白皮书》中的DNS解析服务器最佳实践
9 0
F5《企业DNS建设白皮书》中的DNS解析服务器最佳实践
|
2月前
|
弹性计算 运维 安全
最佳实践分享,如何体系化提升ECS安全性
阿里云弹性计算团队十三位产品专家和技术专家共同分享云上运维深度实践,详细阐述如何利用CloudOps工具实现运维提效、弹性降本。
129040 88
最佳实践分享,如何体系化提升ECS安全性
|
2月前
|
弹性计算 Java 关系型数据库
最佳实践:阿里云倚天ECS在千寻位置时空智能服务的规模化应用
当前,千寻已有上千台倚天ECS实例在支撑线上核心业务。
|
2月前
|
弹性计算 安全 Shell
【阿里云弹性计算】阿里云ECS安全加固:从访问控制到数据保护的全方位策略
【5月更文挑战第22天】本文详述了阿里云ECS的安全加固策略,包括访问控制(如安全组设置和密钥对管理)、系统安全加固(如安全补丁更新和防病毒措施)以及数据保护(如数据备份、恢复和加密)。通过这些措施,用户可增强ECS安全性,保障业务安全稳定运行。
90 0
|
2月前
|
弹性计算 运维 安全
阿里云服务器的特性与优势
阿里云ECS是安全、灵活且高性价比的云计算服务,提供多样化产品如x86和ARM实例、裸金属服务器、专有宿主机。它支持全球多地域部署,具备纵向和横向弹性扩展能力,保证99.975%至99.995%的实例及数据可靠性。用户友好的界面和一键部署功能使得管理简便,同时集成多种安全服务和硬件加密。ECS提供包年包月、按量付费等计费模式,结合优惠机制帮助降低成本。
64 0

相关产品

  • 云服务器 ECS