河北银行:用CDP保障业务系统的故障快速恢复

简介: 河北银行作为银监会批准的全国首批五家城市合作银行试点之一,是河北省成立最早的城市商业银行。也是河北省金融市场上一支重要的金融力量。为了确保资金满足的通畅,提供更高标准的服务水平,河北银行投资开发了高起点、功能完善、技术先进、安全可靠的综合业务系统。

河北银行作为银监会批准的全国首批五家城市合作银行试点之一,是河北省成立最早的城市商业银行。也是河北省金融市场上一支重要的金融力量。为了确保资金满足的通畅,提供更高标准的服务水平,河北银行投资开发了高起点、功能完善、技术先进、安全可靠的综合业务系统。而随着全新的业务系统即将上线运行,核心系统的安全保障和稳定运行则成为河北银行最为至关重要的问题。建立良好的具备“保驾护航”能力的保障系统对于河北银行的IT系统而言, 无疑是系统安全运行的“定心丸”,其作用和意义将会长期持续。

为了确保新业务系统顺利上线,并在上线过程中及上线后保证业务系统的稳定运行,河北银行的IT部门对新业务系统上线的整个过程进行了仔细的风险分析,最终,他们认为在新业务系统上线过程中及上线后,主要会面临以下几方面的风险:

1. 系统上线中:突发故障无法即时恢复,无法保证业务稳定运行。

a. 新系统割接和运行时,新核心程序在稳定运行之前的运行风险。
b. 原系统在割接前需要完整的备份以备出现意外的回退,而这种完整备份如果采用原有的磁带备份需要耗费很长的备份窗口,并且一旦真出现意外需要恢复,则恢复是一个复杂、耗时(可能达到7-8小时)和有可能恢复失败风险。


2. 系统上线后:不具备本地故障快速恢复能力,无法保证业务连续性

c. 一旦业务系统因各种原因运行出现故障或出现数据丢失,将直接导致关联业务的中止运行,进而可能造成灾难 的后果
d. 一旦生产的磁盘设备出现故障(Raid受到破坏),将直接导致关联业务的中止运行。存储设备故障具有“杀手”的特征,对于信息系统的破坏力是十分致命的。


可见,核心系统的突发故障风险时刻都在威胁着业务系统的安全运行能力,业务体系没有有效的快速保障体系是一件十分危险的事情。河北银行需要一套有效的快速保障系统,既需要保障新核心系统的上线安全,又要保障今后核心系统的稳定和可靠运行。经过严格的评估,飞康CDP快速恢复解决方案成为实现这一目标的最佳选择。

实时备份,快速简单

在核心上线之前,由飞康CDP对于原有核心系统进行实时备份(产生多个快照备份和当前备份),一旦上线成功,则立即启动对于新核心系统的实时备份(启用录像备份形成更为精细的IO颗粒度)。

录像级精细恢复颗粒,确保即时恢复到需要的任意时间点毕竟,业务系统的变动是有风险的。如果核心上线时出现故障(例如运行异常、系统异常、存储异常等),可以立即回退到原有核心系统,或者利用飞康的快照技术(在CDP设备只需要拖动
鼠标)回退到上线之前的最后一个时间点。飞康CDP数据保护体系是业界第一个提出“瞬间恢复和精细点恢复”的厂家,在业界树立了标准:

核心系统数据库出现表级别的丢失或损坏:利用飞康CDP进行恢复则可实现RPO=0,RTO=0,而且整个恢复过程生产数据库不用停止。

核心系统主机文件丢失或损坏(包括数据库文件和应用程序文件):使用飞康CDP恢复只需要3个步骤大约10分钟的恢复时间。

核心系统主机由于系统升级或打补丁或者其他原因引起数据库无法启动或者数据库瘫痪:可以直接利用飞康CDP设备的录像技术进行精细点验证后,一旦确认了可恢复性,只需要进行录像向CDP主磁盘的Rollback回滚就可以精细恢复到可启动的任意时间点。用这种方法进行恢复非常迅速,因为备份的数据和生产系统数据格式相同,数据立即可用,与数据量无关,一般来说常规恢复的时间不会超过10分钟。

核心系统磁盘组故障:使用飞康CDP设备中的镜像磁盘可接替其运行,保证用户的业务不中断。目前,河北银行的IT系统建设暂时要求的是对于新业务系统的快速恢复保障,而随着业务的不断发展,以及国家对于金融单位在灾难恢复方面提出的高标准、严要求,未来建立全系统的容灾体系是必然的趋势。飞康CDP不仅在当前可以完全满足用户的数据保护需求,在未来的容灾体系建设中,也可以帮助用户实现‘无死角’的全面防灾。用户即可以对现有的保障体系进行进一步延伸和扩展,以更好的保护现有IT投资,也可以凭借飞康CDP所具备的完全开放的特点,完全采用新的容灾设备和技术。





目录
相关文章
|
11月前
|
运维 NoSQL 容器
《云上业务稳定性保障实践白皮书》——三.故障管理体系——3.故障管理全流程——3.3.3 故障快恢
《云上业务稳定性保障实践白皮书》——三.故障管理体系——3.故障管理全流程——3.3.3 故障快恢
140 0
|
11月前
|
UED
《云上业务稳定性保障实践白皮书》——三.故障管理体系——3.故障管理全流程——3.1 故障等级定义
《云上业务稳定性保障实践白皮书》——三.故障管理体系——3.故障管理全流程——3.1 故障等级定义
853 0
|
11月前
|
运维 监控
《云上业务稳定性保障实践白皮书》——三.故障管理体系——3.故障管理全流程——3.3.2故障应急
《云上业务稳定性保障实践白皮书》——三.故障管理体系——3.故障管理全流程——3.3.2故障应急
198 0
|
11月前
|
算法 BI
《云上业务稳定性保障实践白皮书》——三.故障管理体系——3.故障管理全流程——3.2故障分体系
《云上业务稳定性保障实践白皮书》——三.故障管理体系——3.故障管理全流程——3.2故障分体系
234 0
|
11月前
|
运维 监控 中间件
《云上业务稳定性保障实践白皮书》——三.故障管理体系——3.故障管理全流程——3.3.1故障发现
《云上业务稳定性保障实践白皮书》——三.故障管理体系——3.故障管理全流程——3.3.1故障发现
130 0
|
11月前
《云上业务稳定性保障实践白皮书》——三.故障管理体系——3.故障管理全流程——3.3故障管理全流程
《云上业务稳定性保障实践白皮书》——三.故障管理体系——3.故障管理全流程——3.3故障管理全流程
103 0
|
11月前
《云上业务稳定性保障实践白皮书》——三.故障管理体系——3.故障管理全流程——3.3.4 故障复盘
《云上业务稳定性保障实践白皮书》——三.故障管理体系——3.故障管理全流程——3.3.4 故障复盘
220 0
|
11月前
《云上业务稳定性保障实践白皮书》——三.故障管理体系——3.故障管理全流程——3.3.5 改进追踪
《云上业务稳定性保障实践白皮书》——三.故障管理体系——3.故障管理全流程——3.3.5 改进追踪
102 0
|
11月前
《云上业务稳定性保障实践白皮书》——五.行业客户稳定性保障实践——5.3 平台网站业务稳定性保障——5.3.4故障演练与紧急预案设计
《云上业务稳定性保障实践白皮书》——五.行业客户稳定性保障实践——5.3 平台网站业务稳定性保障——5.3.4故障演练与紧急预案设计
143 0
|
11月前
|
容灾
《医保行业容灾演练云上技术白皮书》——第四章 医保云容灾演练方案——4.4 容灾演练方案——4.4.6 A机房公共区云平台故障演练(入口断网)
《医保行业容灾演练云上技术白皮书》——第四章 医保云容灾演练方案——4.4 容灾演练方案——4.4.6 A机房公共区云平台故障演练(入口断网)