容灾的架构分析和容灾选择策略

简介: 容灾的架构分析和容灾选择策略

1.传统容灾中心的架构

容灾半径是衡量容灾方案所能承受的灾难影响范围的指标。不同灾难的影响范围是不同的,而距离也会影响到容灾技术的选择。容灾中心的架构按照源备端之间的距离,可分为本地容灾、同城双活、两地三中心。

1.1本地容灾

本地容灾一般指主机集群,当某台主机出现故障,不能正常工作时,其他的主机可以替代该主机,继续正常对外提供服务。通常可通过共享存储或双机双柜的方式实现本地容灾,其中多以共享存储为主。

共享存储由三部分组成:活动主节点,不活动备节点,共享存储。

其中两台计算资源节点提供主备角色服务,通过SAN网络附加型存储作为数据存储的介质。 主备节点共享一份存储,一旦主节点宕机,备节点可基于共享存储实现业务的接管。但共享存储的同构成本和远距离高可用接管成本过高,存在较大存储故障风险,且只支持一对一架构。

双机双柜是一种不依赖共享存储而实现的高可用保护架构,采用主备的高可用保护模式。在双机架构中,生产主机和备机具有物理层的完全独立性,应用、系统、网络和数据都是一式两份,生产主机和备机可通过存储网络或局域网进行连接。其中,本地的存储网络连接的主备高可用适用于近距离的容灾建设,受距离限制较大;异地远距离的主备高可用,则会存在极小的数据延时。

本地容灾的数据中心与灾备中心的距离比较近,通信线路质量较好,比较容易实现数据的同步复制 ,保证高度的数据完整性和数据零丢失。本地容灾一般用于防范火灾、建筑物破坏、供电故障、计算机系统及人为破坏引起的灾难。

1.2同城双活

同城双活属于本地容灾,但根据运营模式可以分为主备和双活两种形式:

主备模式即生产中心正常对外提供服务时,同步将数据单项复制到备端数据中心,且备端不对外提供服务。一旦生产中心故障,备端生产中心接管服务。这种模式资源投入较低且技术实施和后期维护相对简单,但是灾后业务恢复速度慢。

传统主备模式的弊端在于,备端长时间处于待机状态,存在资源浪费情况。且多种潜在因素如心跳线中断、网络短时间中断、应用服务器响应不及时等,容易导致在生产中心实际运行正常情况下进行误切换,即存在“脑裂”现象。

双活模式下的两个数据中心分别对外提供服务,且彼此之间保持双向复制。一旦一端故障,另一端立即接管其业务,保障业务的连续性。这种方式相较于主备模式,其业务恢复速度更快,但整体资源投入更高,实施及运维难度更复杂,且存在业务冲突风险。

业界更多采用的是两地三中心的做法。远端的备份机房能更大的提供灾备能力,能更好的抵抗地震,恐袭等情况。双活的机器必须部署到同城,距离更远的城市作为灾备机房。灾备机房是不对外提供服务的,只作为备份使用,发生故障了才切流量到灾备机房,原因主要在于:距离太远,网络延迟太大。

1.3两地三中心

两地三中心属于异地容灾,要求数据中心间距离须保证在三百公里以上,同时还必须做到“三不”,即不 在同一地震带,不在同一电网,不在同一江河流域。

最为稳固的、保护等级最高,也是成本最高的容灾方案,即“两地三中心”:本地的生产中心和灾备中心相距100km以上,进行应用级或业务级容灾保护,且在 300km 以外的异地建立灾备中心,进行数据级或应用级容灾保护。

1.png

随着IT应用的快速发展,金融,银行,政府等越来越多的用户要求核心业务7*24不断网,不断电持续运行,一些大型企业为了尽最大可能减小大自然灾害对业务连续性的影响,而选择两地三中心的容灾方案,这样的方案具备高可用和灾难备份能力。

2.容灾级别与能力

容灾系统按保护级别可分为:数据级容灾、应用级容灾、业务级容灾。

2.1数据级容灾

数据级容灾是指通过建立异地灾备中心,做数据的远程备份,在灾难发生之后要确保原有的数据不会丢失或者遭到破坏,但在数据级容灾这个级别,发生灾难时应用是会中断的。在数据级容灾方式下,所建立的异地灾备中心可以简单地把它理解成一个远程的数据备份中心。数据级容灾的恢复时间比较长,但是相比其他容灾级别来讲它的费用比较低,而且构建实施也相对简单。

2.2应用级容灾

应用级容灾是在数据级容灾的基础之上,在备份站点同样构建一套相同的应用系统,通过同步或异步复制技术,这样可以保证关键应用在允许的时间范围内恢复运行,尽可能减少灾难带来的损失,让用户基本感受不到灾难的发生,这样就使系统所提供的服务是完整的、可靠的和安全的。应用级容灾生产中心和异地灾备中心之间的数据传输是采用异类的广域网传输方式;同时应用级容灾系统需要通过更多的软件来实现,可以使多种应用在灾难发生时可以进行快速切换,确保业务的连续性。

2.3业务级容灾

业务级容灾是全业务的容灾,除了必要的IT相关技术,还要求具备全部的基础设施。其大部分内容是非IT系统(如电话、办公地点等),当大灾难发生后,原有的办公场所都会受到破坏,除了数据和应用的恢复,更需要一个备份的工作场所能够正常的开展业务。

3.云容灾优势

云容灾是一种基于云平台发展起来的服务模式。云容灾是指以云计算的服务模式为企业提供业务容灾、数据备份、数据副本利用等多种数据应用场景的服务,即容灾即服务(DRaaS, DR as a Service)。

云容灾结合云平台的计算、存储和带宽等诸多优势,相比传统容灾具备了多方面的优势:

  • 基础设施减少

摒弃采购传统的灾备服务器,借助云平台供应商提供的计算和存储平台,或直接采用云容灾DRaaS应用服务。云容灾技术方案则可有效降低维护需求和成本消耗。客户在节省更多的物理空间的同时,也可以节省更多的IT资源,将相关的维护人员解放出来,参与到其它工作中去。

  • 降低 IT 成本

根据具体需要采用更为经济、更具弹性的云存储进行备份,免去自建数据中心所带来的硬件购买及维护成本,免去维护各种硬件所带来的烦恼,实现了对资源的精细化管理,进而减少大部分的灾备支出。

  • 按需付费

云容灾可以采用云基础设施或者DRaaS模式,允许用户自由选定重要的系统和数据进行容灾。所以无论是业务接管还是演练,客户只需为实际所使用的资源付费,大大减少了资源的浪费,且提升了效率。

  • 高度灵活性

云容灾使得业务需求更容易评估,用户可以更准确地预估哪个系统、甚至哪个子系统需要维护,也可以更细粒度地选择关键的数据来优化自身的备份计划,而不是整个地完全备份,更精确地设置RPO ,即能容忍的最大数据丢失量。云中建立的高可用、高容错架构可以提升RTO和RPO,基于公有云平台或者开源的私有云技术,也可以简便快速灵活地构建容灾节点并将数据迁移或者复制到云端,提升灾难恢复的速度。

  • 快速恢复

为即使有传统定制的远程备份,仍然需要时间去做数据的恢复和业务重启,且取决于远程备份的地点远近和远程服务器的性能。而云容灾是可以充分利用云的能力,突破物理限制,在云端做到业务启动。

云容灾独有的高性能、高可靠性、高扩展性、易维护性、责任风险低以及高性价比的服务特色,帮助用户低成本建设高可用、灵活、按需付费的专业云容灾平台。

对于许多IT资源有限的用户来说,基于云的容灾不失为一个好的选择,因为云服务是一种随用随付费的模式,而企业如果自建容灾设施的话,在大多数时间又处于闲置和备用状态,所以云非常适合那些中小企业。在利用云服务设立容灾站点之后,企业对数据中心空间、IT基础设施和IT资源的依赖程度会大幅下降,进而带来运营成本的大幅下降。借助云,小型企业也能实施容灾系统,而在此之前,只有大型企业才能做到这一点。

4.云容灾级别和能力

参考传统容灾的级别划分,由于云容灾的基础设施采用了云平台,在云容灾的级别划分上,应用级和业务级的区别已经不大了,因此在这里将云容灾的容灾级别分为:数据级容灾、业务级容灾。

数据级云容灾:数据级云容灾是指通过云平台做数据的远程备份,在灾难发生之后要确保原有的数据不会丢失或者遭到破坏。

业务级云容灾:业务级云容灾是指通过云平台做数据的远程备份和恢复,保证关键应用在允许的时间范围内恢复运行,尽可能减少灾难带来的损失,保证一定的RPO和RTO。

随着IT基础架构逐渐云化,容灾也面临着云化转型,不断涌现出更多的云容灾产品和方案。

在这里列举几家代表性厂商:

  • 数据级云容灾工具:Veeam Backup & Replication

Veeam是云数据管理备份解决方案的领导者。无论是从AWS、Azure和Google Cloud中获得非常灵活的混合云功能,还是获得强大的勒索软件防护和恢复选项,Veeam都可以轻易满足。Veeam将强化的不可变存储选项、可靠的云原生备份选项、连续数据保护以及其他更多功能整合到了一个平台上。

  • 业务级云容灾工具:ZertoVirtual Replication

Zerto是一家专注于虚拟化容灾/业务连续性的软件公司。Zerto公司的旗舰产品ZertoVirtual Replication (ZVR)是一个基于虚拟机复制的软件解决方案,支持云容灾到AWS和Azure公有云,通过帮助组织机构达到恢复时间目标和恢复点目标而使运作灾难恢复和业务连续性成为可能,而同时只需要较低的成本费用。用户使用Zerto,用户可以得到可靠的,接近实时的服务器复制,而花费仅仅是SAN阵列式复制成本的一小部分。

  • 业务级云容灾工具:CloudEndure Disaster Recovery

CloudEndure是国外的一家做云灾备和负载迁移的初创公司,目前已经被AWS收购。CloudEndure Disaster Recovery 可以通过快速而可靠地将物理机、虚拟机和基于云的主机恢复到Amazon云区域,能最大限度地帮助客户缩短停机时间并减少业务中断损失,同时显著降低灾难恢复基础设施的成本。

  • 业务级云容灾工具:HyperBDR

HyperBDR是一家中国企业万博智云自主研发的业务级云原生备份与容灾工具。

HyperBDR深度对接20+以上云平台API接口,在国内的云服务厂商多样的环境下,适配多云多场景的容灾。实现支持高度自动化的异构平台容灾方案,可以自由选择目标云平台进行备份,方案灵活性更高,安全性更强。它利用云原生服务,帮助用户实现基于云平台的备份与容灾,利用底层不同的数据技术,及云原生编排能力,实现一键式容灾演练。

相关文章
大型多模态推理模型技术演进综述:从模块化架构到原生推理能力的综合分析
该研究系统梳理了大型多模态推理模型(LMRMs)的技术发展,从早期模块化架构到统一的语言中心框架,提出原生LMRMs(N-LMRMs)的前沿概念。论文划分三个技术演进阶段及一个前瞻性范式,深入探讨关键挑战与评估基准,为构建复杂动态环境中的稳健AI系统提供理论框架。未来方向聚焦全模态泛化、深度推理与智能体行为,推动跨模态融合与自主交互能力的发展。
166 13
大型多模态推理模型技术演进综述:从模块化架构到原生推理能力的综合分析
微服务架构下的电商API接口设计:策略、方法与实战案例
本文探讨了微服务架构下的电商API接口设计,旨在打造高效、灵活与可扩展的电商系统。通过服务拆分(如商品、订单、支付等模块)和标准化设计(RESTful或GraphQL风格),确保接口一致性与易用性。同时,采用缓存策略、负载均衡及限流技术优化性能,并借助Prometheus等工具实现监控与日志管理。微服务架构的优势在于支持敏捷开发、高并发处理和独立部署,满足电商业务快速迭代需求。未来,电商API设计将向智能化与安全化方向发展。
RT-DETR改进策略【模型轻量化】| 替换骨干网络 CVPR-2024 RepViT 轻量级的Vision Transformers架构
RT-DETR改进策略【模型轻量化】| 替换骨干网络 CVPR-2024 RepViT 轻量级的Vision Transformers架构
258 0
RT-DETR改进策略【模型轻量化】| 替换骨干网络 CVPR-2024 RepViT 轻量级的Vision Transformers架构
301重定向:技术原理、架构级策略与搜索引擎的隐秘对话
本文深入解析HTTP状态码301“永久重定向”的技术细节与实践应用,探讨其在浏览器、爬虫及服务器端的行为特性。内容涵盖Nginx与CDN边缘计算实现高效重定向的方案,权重传递衰减机制,以及大规模网站迁移的技术框架。同时,文章还介绍了HTTP/3时代的创新优化,如0-RTT跳转和服务端推送,并提供诊断工具和实践清单,助力精准实施与监控重定向策略。301重定向不仅是技术手段,更是流量与信任关系的重塑桥梁。
33 6
十大主流联邦学习框架:技术特性、架构分析与对比研究
联邦学习(FL)是保障数据隐私的分布式模型训练关键技术。业界开发了多种开源和商业框架,如TensorFlow Federated、PySyft、NVFlare、FATE、Flower等,支持模型训练、数据安全、通信协议等功能。这些框架在灵活性、易用性、安全性和扩展性方面各有特色,适用于不同应用场景。选择合适的框架需综合考虑开源与商业、数据分区支持、安全性、易用性和技术生态集成等因素。联邦学习已在医疗、金融等领域广泛应用,选择适配具体需求的框架对实现最优模型性能至关重要。
1328 79
十大主流联邦学习框架:技术特性、架构分析与对比研究
一文详解:工业软件“低代码开发平台”技术架构研究与分析
本文围绕工业软件低代码开发平台的机遇与挑战,提出基于自动化引擎的技术架构,由工具链、引擎库、模型库、组件库、工业数据网关和应用门户组成。文章分析了其在快速开发、传统系统升级中的应用模式及价值,如缩短创新周期、降低试错成本、解决资源缺乏和提升创新可复制性,为我国工业软件产业发展提供参考和支持。
基于 Spring Cloud 的微服务架构分析
Spring Cloud 是一个基于 Spring Boot 的微服务框架,提供全套分布式系统解决方案。它整合了 Netflix、Zookeeper 等成熟技术,通过简化配置和开发流程,支持服务发现(Eureka)、负载均衡(Ribbon)、断路器(Hystrix)、API网关(Zuul)、配置管理(Config)等功能。此外,Spring Cloud 还兼容 Nacos、Consul、Etcd 等注册中心,满足不同场景需求。其核心组件如 Feign 和 Stream,进一步增强了服务调用与消息处理能力,为开发者提供了一站式微服务开发工具包。
144 0
阿里云X86/ARM/GPU/裸金属/超算等五大服务器架构技术特点、场景适配与选型策略
在我们选购阿里云服务器的时候,云服务器架构有X86计算、ARM计算、GPU/FPGA/ASIC、弹性裸金属服务器、高性能计算可选,有的用户并不清楚他们之间有何区别。本文将深入解析这些架构的特点、优势及适用场景,帮助用户更好地根据实际需求做出选择。
湖仓分析|浙江霖梓基于 Doris + Paimon 打造实时/离线一体化湖仓架构
浙江霖梓早期基于 Apache Doris 进行整体架构与表结构的重构,并基于湖仓一体和查询加速展开深度探索与实践,打造了 Doris + Paimon 的实时/离线一体化湖仓架构,实现查询提速 30 倍、资源成本节省 67% 等显著成效。
湖仓分析|浙江霖梓基于 Doris + Paimon 打造实时/离线一体化湖仓架构

热门文章

最新文章

AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等

登录插画

登录以查看您的控制台资源

管理云资源
状态一览
快捷访问