玩转ECS第7讲 | ECS数据保护-数据备份新特性与最佳实践

简介: 本文中,阿里云智能弹性计算专家余初武(悟元)将结合阿里云近期推出的数据备份新特性(快照极速备份、一致性快照组)来介绍云上环境如何做数据备份的最佳实践;适合需要构建云上架构的工程师,架构师和云上实施从业人员收看。

关键词:极速备份、崩溃一致性、异地备份

演讲嘉宾简介:余初武(悟元),阿里云技术专家,2011年加入阿里巴巴,一直从事服务端研发工作;2015年加入阿里云ECS团队,在ECS管控、云盘、快照等多个管控领域有丰富的研发经验。

以下内容根据演讲视频以及PPT整理而成。观看回放
更多课程请进入“玩转ECS详情页”了解

本次分享主要围绕以下三个方面:

一、快照极速可用特性
二、一致性快照组
三、总结与思考

数据是企业重要资产,作为存储数据的介质,IT设施发生问题是不可避免的,人为误操作或者程序bug导致数据丢失的情况也偶有发生。因此,每一个企业都应该做好数据备份,保证数据的安全与业务的可用。

为了提升备份与同步的性能,阿里云推出了快照极速可用特性和一致性快照组,为了客户提供更高性能的数据备份功能。

本文将重点介绍如何利用这两个新特性,以及阿里云提供的各种运维部署工具,便捷地完成云上自建数据库的数据备份的两个最佳实践。

第一个是自建数据库的磁盘扩容场景,适用于大多数的企业;第二个则是使用了多磁盘自建数据库的场景,则更多见于大型复杂的业务。

一、极速可用特性——秒级,非一致性数据备份

阿里云ECS的极速可用特性主要包括四个方面,分别是快照秒级可用、云盘回滚性能0损失、ESSD增值特性以及全地域支持等。阿里云ECS极速可用特性的典型使用场景包括快速搭建研发测试环境;业务关键配置的变更保护,实现秒级备份相关磁盘数据;云盘极速回滚,并实现回滚的磁盘性能无损耗。

image.png

基于极速可用的特性,用户仅需要几秒钟的时间就可以复制出一个新磁盘。

这一过程也非常简单,首先创建一个带极速可用特性的快照,关键参数的设置如下图所示,主要包括InstantAccess和InstantAccessRetentionDays,前者设置为True就可以设置成为极速可用的快照,后者则是极速可用特性的保留天数,可以让这特性到期之后就会自动被关闭。当快照创建完成(极速可用特性开启的情况下,不需要等快照进度完成)之后,就能够快速创建磁盘并立即挂载使用。

image.png

案例:自建数据库,磁盘空间不够,怎么办?

在这样的情况下,最直接能想到的解决方案是纯人工方式。

首先,对于需要扩容的磁盘打好一个普通快照,这个过程一般都比较慢,往往需要几分钟、几小时以及几天不等的时间。

其次,需要人工登录到控制台对磁盘进行在线扩容。

再次,要登录到实例内部找到相应的磁盘进行扩展分区以及文件系统等各种命令的操作,而这些命令往往是非常复杂的,也是非常容易出错的。

这一方案的缺点十分明显,那就是耗时很久,平均需要1到2小时,而且很容易出错。

image.png

而目前阿里云推荐的最佳解决方案是将上述过程全部通过编码实现自动化,做成OOS(运维编排,Operation Orchestration Service)的模板,通过OOS模块实现一键扩容,完成上述方案的全部过程。

这种方案的使用方式就非常简单了,用户可以直接进入到OOS控制台,找到相应的模板并创建一个相应的执行即可,整个过程只需要几十秒就可以完成,而且可以进一步优化至十几秒。

image.png

接下来对于刚才提到的OOS一键扩容的关键技术内幕进行讲解。

其实在该方案背后主要包括三个关键技术:分别是快照的极速可用特性通过云助手执行扩展分区的命令以及磁盘的序列号

这里值得注意的是通过云助手执行扩展分区命令时,我们无法知道具体扩展的是哪一块磁盘,因此才需要磁盘的序列号。

磁盘序列号这一特性目前在公有云ECS上也已经上线了,用户通过DescribeDisks就可以返回磁盘序列号SerialNumber,之后通过云助手将磁盘序列号传递给GuestOS内部的脚本,而GuestOS内部的脚本则可以通过udevadm info这串命令获取任意一块磁盘已挂载设备的序列号,这个序列号与DescribeDisks返回的序列号是完全一致的,而且从磁盘诞生之后,序列号就不会再发生任何改变,因此可以作为磁盘在GuestOS内部的唯一标识,并且与OpenABI的接口实现唯一关联。

这样才能帮助我们准确无误地找到需要扩展的磁盘去执行相应的命令。同时,因为ECS具有快照极速可用特性,秒级地打出了一个数据备份,一旦发生任何意外,还可以通过快照实现秒级回滚,基本可以做到万无一失地实现自动扩容过程。

image.png

二、一致性快照组——崩溃一致性数据备份

介绍完快照极速可用特性,我们继续跟大家分享下一致性快照组。

一致性快照组的主要特点主要包括四点:即多云盘IO写入一致性、ESSD云盘增值特性、实例级别保护以及功能免费。

适用的场景主要有三种:

第一种场景,企业上云的时候可以实现实例级别整机的保护和备份;
第二种场景,自建数据库特别是跨多云盘自建数据的模式下,一定要使用一致性快照来备份;
第三种场景是SAP HANA的整机一致性保护,也需要用到一致性快照。

image.png

案例:使用多数据盘自建数据库

这里要介绍的案例是自建数据库时使用了多数据盘,这样的做法主要是为了将数据库常见的日志和数据拆分到独立的云盘上去,使得整个数据库的性能和稳定性都能够得到较大的提升,同时实现日志和数据的读写隔离。

在这种情况下,一旦需要拆分就会遇到两块磁盘上数据存在强关联关系的问题。熟悉数据库的同学都知道,任何一次写操作都会先进行日志操作,日志写完之后再去修改真正的数据,当数据写入完成之后再回来修改日志,比如像MySQL的Redo日志等。

可见,日志和数据存在强依赖逻辑关系,此时如果打普通快照,那么存在任何一点点时差都会导致写入数据在两块磁盘上存在不一致的问题,此时就必须要用到一致性快照,实现崩溃一致性的数据备份。

image.png

对于这样的案例场景,阿里云也提供了最佳实践,也就是使用ROS(资源编排,Resource Orchestration Service)。

该方案的基本过程就是将上述理念通过ROS实现模板化,通过ROS创建完全一样的数据库系统。方案关键点在于创建两块独立的数据盘,一块放数据,另外一块放日志,同时对于两块数据盘赋予系统的数据库快照策略Auto Snapshot Policy,并定期地对于两块盘进行数据备份,并且使用一致性快照进行备份,避免出现废弃数据的问题。

image.png

三、总结与思考

以上的案例都是基于自建数据库的,这两个案例的关键点在于多数据盘和自动扩容磁盘。

将上述两个案例进行串联才能够看到真实的使用场景,也就是先用ROS固化上述提到的最佳实践过程,也就是实现多数据盘,即日志盘和数据盘的隔离,并且使用自动快照的策略定期地打一致性快照。

与此同时,配上云监控就能够在磁盘空间不足的时候,及时报警,此时在通过OOS一键扩容实现磁盘的自动扩容。

当然,这个过程还可以更进一步优化,在OOS控制台配置相应的云监控项目,当收到监控项报警之后自动触发OOS运行和扩容的模板进行一键扩容,真正地实现自动扩容,也就是所谓“无人值守”。

image.png

对于本次介绍的新特性进行总结,本次主要介绍了极速可用和一致性快照两个新特性,这两个新特性很快就会上线供大家使用。

对于极速可用特性而言,建议结合OOS、云助手来磁盘或者其他场景的自动运维实践。如果要对云盘进行操作或者自动化运维则需要使用磁盘序列号在GuestOS内部唯一地标识一块磁盘,这样才能做到准确无误。一致性快照则是在MySQL这种多盘场景下才会使用,主要用来实现奔溃一致性备份。

image.png

本次分享到此结束,感兴趣的同学可持续关注和学习云上环境数据保护最佳实践。


关注百晓生,笑谈云计算

二维码-三分之一.gif

相关实践学习
2分钟自动化部署人生模拟器
本场景将带你借助云效流水线Flow实现人生模拟器小游戏的自动化部署
7天玩转云服务器
云服务器ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,可降低 IT 成本,提升运维效率。本课程手把手带你了解ECS、掌握基本操作、动手实操快照管理、镜像管理等。了解产品详情: https://www.aliyun.com/product/ecs
相关文章
|
3月前
|
安全 Ubuntu 应用服务中间件
Web服务器安全最佳实践
【8月更文第28天】随着互联网的发展,Web服务器成为了企业和组织的重要组成部分。然而,这也使得它们成为黑客和恶意软件的目标。为了确保数据的安全性和系统的稳定性,采取适当的安全措施至关重要。本文将探讨一系列保护Web服务器的最佳策略和技术,并提供一些实用的代码示例。
249 1
|
4天前
|
缓存 负载均衡 监控
性能优化:Node.js高效服务器开发技巧与最佳实践
【10月更文挑战第29天】在Node.js服务器开发中,性能优化至关重要。本文介绍了几种高效开发的最佳实践,包括使用缓存策略、采用异步编程、实施负载均衡和性能监控。通过示例代码展示了如何实现这些技术,帮助开发者构建更快、更稳定的Node.js应用。
18 2
|
29天前
|
存储 数据库 虚拟化
无缝过渡:企业级服务器迁移的策略与最佳实践
【10月更文挑战第4天】随着企业数字化转型的加速,服务器迁移成为企业IT基础设施升级的重要环节。本文从架构与规划的视角,探讨了企业级服务器迁移的策略与最佳实践,旨在帮助企业实现无缝过渡,降低迁移风险,提高迁移效率。
112 4
|
29天前
|
弹性计算 Linux 对象存储
阿里云国际版如何将ECS云服务器中的数据备份到本地
阿里云国际版如何将ECS云服务器中的数据备份到本地
|
3月前
|
存储 运维 监控
数据库服务器运维最佳实践
【8月更文挑战第22天】
61 2
数据库服务器运维最佳实践
|
2月前
|
存储 数据库 数据安全/隐私保护
服务器数据备份是保障数据安全、防止数据丢失和灾难恢复的重要措施
服务器数据备份是保障数据安全、防止数据丢失和灾难恢复的重要措施
45 1
|
3月前
|
Shell 网络安全 数据安全/隐私保护
使用 Python 远程登陆服务器的最佳实践
使用 Python 远程登陆服务器的最佳实践
|
3月前
|
缓存 NoSQL 数据库
Web服务器与数据库优化:提升系统性能的最佳实践
【8月更文第28天】在现代的Web应用中,Web服务器与后端数据库之间的交互是至关重要的部分。优化这些组件及其相互作用可以显著提高系统的响应速度、吞吐量和可扩展性。本文将探讨几种常见的优化策略,并提供一些具体的代码示例。
157 1
|
3月前
|
缓存 运维 监控
打造稳定高效的数据引擎:数据库服务器运维最佳实践全解析
打造稳定高效的数据引擎:数据库服务器运维最佳实践全解析
|
5月前
|
弹性计算 安全 Shell
阿里云ECS安全加固:从访问控制到数据保护的全方位策略
【6月更文挑战第29天】阿里云ECS安全聚焦访问控制、系统加固及数据保护。安全组限定IP和端口访问,密钥对增强SSH登录安全;定期更新补丁,使用防病毒工具;数据备份与加密确保数据安全。多维度策略保障业务安全。
160 15

热门文章

最新文章

相关产品

  • 云服务器 ECS