云环境中的灾备规划与分析

简介: 【10月更文挑战第24天】企业在数据备份和灾备中,依据数据用途和管理方式,将数据分为系统、基础、应用和临时数据,以及数据库和非数据库数据。关键业务系统对业务连续性要求最高,其次是重要业务系统,然后是一般业务系统。

1、数据分析

对于企业来说,最重要的IT信息资产就是数据。从数据用途的角度来分析,可将需要备份的数据分为系统数据、基础数据、应用数据和临时数据;同时根据数据存储和管理的方式可分为数据库数据、非数据库数据、孤立数据和遗失数据。

1)按数据用途划分,需要备份的数据可分为:

系统数据:主要是指操作系统、应用系统安装的各类软件包和应用系统执行程序。系统数据在系统安装后基本上不再变动,只有在操作系统、应用系统版本升级或应用程序调整时才发生变化。

基础数据:主要是指保证业务系统正常运行所使用的系统目录、用户目录、系统配置文件、网络配置文件、应用配置文件、存取权限控制等。基础数据随业务系统运行环境的变化而变化,一般作为系统档案进行保存。

应用数据:主要是指业务系统的所有业务数据,对数据的安全性、准确性、完整性要求很高,而且变化频繁。

临时数据:主要是指操作系统、应用系统、数据库产生的系统运行记录、数据库逻辑日志,以及应用程序在执行过程中产生的各种打印、传输临时文件,随系统运行和业务的发生而变化。临时数据对业务数据的完整性影响不大,增大后需要定期进行清理。

2)按数据存储和管理的方式划分,需要备份的数据又可以分为:

数据库数据是指通过数据库软件或数据库管理系统来进行存取和管理的数据。

非数据库数据是指通过文件等非数据库管理系统来进行存取和管理的数据。

孤立数据是指从最后一次业务数据备份后到灾难发生、系统运行停止前未进行灾难备份的数据。这部分数据通常需要通过人工等方法重新录入系统。一般情况下,孤立数据越多,系统恢复的时间就越长,业务的停顿时间也就越长。孤立数据的多少与数据备份的周期有很大关系。

遗失数据是指无法恢复或重建的数据。在灾难备份系统的设计与实施中,要重点考虑的就是防止遗失数据的产生或减少遗失数据的数量,以及如何快速查找遗失数据等。

通过数据分析,我们可以对将要备份的数据有一个比较清楚的认识,保护好关键的应用数据和数据库数据,同时减少孤立数据和遗失数据。

2、业务分析

在企业里有不同的业务场景,我们可以根据各种业务系统处理的业务类型、数据存储方式、处理方式、实时性要求、每天处理的业务量、单位时间内处理的业务量等条件,将业务系统划分为关键业务系统、重要业务系统和一般业务系统等。

关键业务系统:业务数据比较集中和核心,所连服务器节点较多,对保证整个企业的正常运转至关重要;一旦业务中断,则企业提供的服务及正常业务运作将受到相当严重的影响。并且在特殊时期如月末、年末、业务量高峰期中断造成的影响更大,不仅经济损失大,企业信誉降低,而且有可能要承担潜在的法律责任。

重要业务系统:业务中断将对整个企业的正常、有效运转产生较严重的影响。一旦业务发生中断,企业提供的部分服务及部分业务会受到影响和中断,但无关大局。比如:内部企业网系统、邮件传输系统、报表业务处理系统等。

一般业务系统:业务中断将不会立刻对整个企业的正常运转产生严重影响,一旦中断可以容忍在数天或数周内恢复。比如:人事档案系统、考勤系统、工程预决算系统等。

业务中断持续时间愈长,损失愈大。不同的时期如月末、年末、业务高峰期中断也是造成灾难损失的一个重要时间因素,且业务种类不同,造成的损失也不同。我们尽可能全力保护关键和重要业务系统的高可用,并降低业务恢复所需的时间来减少企业的损失。

3、灾备中的技术分析

目前有很多种容灾技术,分类也比较复杂,但总体上可以区分为离线式容灾(冷容灾)和在线容灾(热容灾)两种类型。

1)离线式容灾

所谓的离线式容灾主要依靠备份技术来实现。其重要步骤是将数据通过备份系统备份到磁带,而后将磁带运送到异地保存管理(还可使用虚拟带库技术,可提升备份恢复的性能和速度)。离线式容灾具有实时性低、可备份多个副本、备份范围广、长期保存、投资较少等特点,由于备份基于压缩后存放到磁带的方式,所以数据恢复较慢,而且备份窗口内的数据都会丢失,因此一般用于对数据恢复的RTO(目标恢复时间)和RPO(目标恢复点)要求较低的容灾。也有很多客户将离线式容灾和在线容灾结合起来以增加系统容灾的完整性和安全性。

目前主流的备份软件主要有:Symantec Veritas NetBackup、EMC Legato NetWorker、IBM Tivoli Storage Manager和Quest BakBone NetVault。

2)在线容灾

在线容灾要求生产中心和灾备中心同时工作,生产中心和灾备中心之间由传输链路连接。数据自生产中心实时复制传送到灾备中心。在此基础上,可以在应用层进行集群管理,当生产中心遭受灾难、出现故障时可由灾备中心接管并继续提供服务。因此实现在线容灾的关键是数据的复制。与数据备份相比,数据复制技术具有实时性高、数据丢失少和容灾恢复快、投资较高等特点。根据数据复制的层次,数据复制技术的实现可以分为三种:基于存储的数据复制技术、基于主机的数据复制技术和基于数据库的数据复制技术。

基于存储的数据复制技术:国内常见的容灾解决方案,由存储厂家提供技术实现生产中心存储设备与灾备中心存储设备的直接远程镜像,将数据以同步或异步的方式复制到远端。其优点是将数据与应用分开,对主机系统的运行资源影响比较小,缺点是必须在本地端和灾备端分别配置两套相同的存储系统。

基于主机的数据复制技术:通过安装在服务器上的数据复制软件,实现异地数据复制。该技术的优点在于成本相对较低且能兼容不同厂家的存储设备,缺点是会占用主机的系统资源。

基于数据库的数据复制技术:基于数据库的容灾技术传输的是数据库指令或者重做日志文件。该技术与存储类型和服务器平台无关,具有较好的使用灵活性。比如Oracle中的DG技术,DB2中的HADR技术,MySQL中的主从复制。

相关文章
|
存储 运维 监控
数据中心运维的工作面临永远的痛
数据中心运维的工作面临永远的痛
475 0
数据中心运维的工作面临永远的痛
|
6月前
|
存储 弹性计算 运维
数据灾备中心:创新性企业灾备管理服务
阿里云数据灾备中心旨在提供创新的灾备解决方案,确保企业业务连续性和数据安全。面对数据风险,如误删、勒索软件等,即使在公共云上,企业仍需灾备措施。数据灾备中心提供统一管理,通过3-2-1法则实现全面保护,特色包括统一覆盖多种资源、直观的星级评分和3D展示、简化运维流程。未来将推出更多功能,如资源分组评分、一体化策略中心、定制报表和消息中心,以支持不同行业的高要求,如金融、医疗等。
24592 8
数据灾备中心:创新性企业灾备管理服务
|
6月前
|
存储 安全 数据安全/隐私保护
使用云存储进行灾难恢复与业务连续性规划
【6月更文挑战第1天】云存储成为数据安全的超级英雄,提供灾备和业务连续性。通过选择可信的云服务商,定期备份数据,即使本地故障也能迅速恢复。简单示例展示了Python上传数据至S3,但实际需考虑安全性、速度和备份策略。定期检查云存储状态并制定详细恢复计划,确保灾难应对有序。为保护数字资产,投入云存储是值得的挑战。
58 1
|
7月前
|
存储 容灾 关系型数据库
企业上云的灾备规划与分析
【4月更文挑战第21天】在数据分析方面,数据被分为系统、基础、应用和临时数据四类,以及数据库和非数据库、孤立和遗失数据四种存储管理方式。业务分析中,业务系统被划分为关键、重要和一般三类,强调了不同类型业务中断的影响程度。在灾备技术分析中,介绍了离线式(冷容灾)和在线式(热容灾)容灾技术,包括备份软件和数据复制的三种层次:基于存储、主机和数据库。
|
算法 BI
《云上业务稳定性保障实践白皮书》——三.故障管理体系——3.故障管理全流程——3.2故障分体系
《云上业务稳定性保障实践白皮书》——三.故障管理体系——3.故障管理全流程——3.2故障分体系
384 0
|
运维
《云上业务稳定性保障实践白皮书》——二. 理论概念——2.2 故障
《云上业务稳定性保障实践白皮书》——二. 理论概念——2.2 故障
187 0
|
运维 监控 中间件
《云上业务稳定性保障实践白皮书》——三.故障管理体系——3.故障管理全流程——3.3.1故障发现
《云上业务稳定性保障实践白皮书》——三.故障管理体系——3.故障管理全流程——3.3.1故障发现
206 0
《云上业务稳定性保障实践白皮书》——三.故障管理体系——3.故障管理全流程——3.3故障管理全流程
《云上业务稳定性保障实践白皮书》——三.故障管理体系——3.故障管理全流程——3.3故障管理全流程
144 0
《云上业务稳定性保障实践白皮书》——三.故障管理体系——3.故障管理全流程——3.3.5 改进追踪
《云上业务稳定性保障实践白皮书》——三.故障管理体系——3.故障管理全流程——3.3.5 改进追踪
156 0
|
运维 监控
《云上业务稳定性保障实践白皮书》——三.故障管理体系——3.故障管理全流程——3.3.2故障应急
《云上业务稳定性保障实践白皮书》——三.故障管理体系——3.故障管理全流程——3.3.2故障应急
359 0