数据中心四大灾备技术解析

本文涉及的产品
云解析 DNS,旗舰版 1个月
全局流量管理 GTM,标准版 1个月
公共DNS(含HTTPDNS解析),每月1000万次HTTP解析
简介:

灾备技术是指在一个数据中心发生故障或灾难的情况下,其他数据中心可以正常运行并对关键业务或全部业务实现接管,达到互为备份的效果,好的灾备技术可以实现用户的“故障无感知”。灾备是一项综合系统工程,涉及到备份、复制、镜像等多种不同技术,系统建设复杂程度高。因此,一般只有在大型企业和金融行业应用较多。我国在2007年时颁布了首个关于灾备的国家标准《信息系统灾难恢复规范》(GB/T 20988-2007),是我们在灾备建设时重要的参考性文件。现在的数据中心承载的业务越来越重要,引入有效的灾备技术,能减少数据中心发生故障时带来的损失。数据中心整体灾备技术可以分为四种:冷备、暖备、热备和双活。

数据中心四大灾备技术解析

冷备

冷备技术是中小型数据中心或者承载业务不重要的局点经常使用的灾备技术。冷备技术的用站点通常是空站点,一般用于紧急情况;或者仅仅是布线、通电后的设备。在整个数据中心故障时无法提供服务时,数据中心会临时找到空闲设备或者租用外界企业的数据中心临时恢复,当自己数据中心恢复时,再将业务切回。这种方式数据中心业务恢复的时间难以保证,有时临时搭建的平台也可能因为不稳定而再次出现中断。当然这种方式不必准备大量的空闲设备,维护成本可以忽略不计。冷备技术从启用到真正可以开始工作需要较高的成本和时间,通常需要几天甚至一周或者更长的时间。冷备技术算不上是一种真正意义上的灾备技术,因为冷备基本上就是数据中心从未考虑数据中心出现故障的情况,一旦出现故障,则是“姑娘上轿才扎耳朵眼”的做法,对于故障毫无预知和提前投入。当然冷备技术的缺点是显而易见的,其已经越来越无法适应数据中心高要求的发展,逐渐成为一种淘汰的技术方式。

暖备

暖备技术是在主备数据中心的基础上实现的,前提是拥有两个一主一备的数据中心。备用数据中心为暖备部署,应用业务由主用数据中心响应,当主用数据中心出现故障造成该业务不可用时,需要在规定的RTO(Recover Time Objective,即灾难发生后,信息系统从停顿到恢复正常的时间要求)时间以内,实现数据中心的整体切换。在具体实现上,主备数据中心的两套业务系统网络配置完全一样,备用数据中心路由平时不对外发布。当实现主备数据中心切换时,需要断开主用数据中心路由链路,并连接备用数据中心路由链路,保证同一时间只有一个数据中心在线。暖备技术还是手工方式,从知道主用数据中心故障到备用数据中心工作需要有人24小时值守才能完成,工作效果较低。

热备

相比暖备,热备最重要的特点是实现了整体自动切换,其它和暖备实现基本一致,实现热备的数据中心仅比暖备的数据中心要多部署一项软件,软件可以自动感知数据中心故障并且保证应用业务实现自动切换。业务由主用数据中心响应,当出现数据中心故障造成该业务不可用时,需要在规定的RTO时间内,自动将该业务切换至备用数据中心。在具体实现上,在主备数据中心均部署GTM(广域流量管理器),GTM之间同步信息,GTM各自探测本中心的应用业务,根据GTM的服务器状态判断应用业务的可用性。当GTM或数据中心链路出现DOWN时,将该业务自动切换至灾备数据中心。热备数据中心通过GTM技术实现自动主备数据中心切换。

双活

通过双活技术可以实现主备数据中心均对外提供服务,正常工作时两个数据中心的业务可根据权重做负载分担,没有主备之分,分别响应一部分用户,权重可以是按地域划分,或数据中心服务能力或对外带宽。当其中一个数据中心出现故障时,另一数据中心将承担所有业务。具体实现上,多活技术部署了很多种检测故障的方式,比如:ICMP Monitor、TCP Monitor、HTTP Monitor,FTP Monitor。还可以实时检测服务器的运行状态、服务器负载均衡的情况,即使在没有故障的时候也可以根据应用业务量在多活数据中心之间调整。多活的最大特点是不会造成数据中心的资源存在浪费,数据中心都承载应用业务运行。不至于出现像热备、暖备主用数据中心几乎满载运行,而备用数据中心却很空闲的情况。除了双活技术还有多活技术,多活就是业务在多个数据中心上同时运行,当有一个或多个数据中心故障时,其它数据中心将自动接管所有应用业务。显然多活比双活可靠性更高,但投入成本也会高,实现技术也更为复杂。现在在金融行业、互联网行业的数据中心都乐于采用多活技术,虽然投入大,但稳定性是这些数据中心优先考虑的事。

下面的表1列出了四种灾备技术的特点比对。

冷备

暖备

热备

双活/多活

RTO

恢复时间长,不可预知

恢复时间较短

恢复时间较短

恢复时间短

硬件成本

几乎可以忽略

一般

一般

一般

软件成本

几乎可以忽略

几乎可以忽略

较低

较高

实现复杂度

简单

简单

较易

复杂

运行稳定性

较低

较高

自动化

人工

人工

软件自动

软件自动

运维成本

较高

较高

表1:四种灾备技术特点比对表

无论采用哪种灾备技术,应该根据自身数据中心应用业务的重要性、建设经费、人员技能水平等综合考虑采用哪种灾备技术。不见得一定要采用双活/多活灾备技术,虽然这种技术可靠性最高,但实现复杂,进行扩容、业务变更等都需要大量专业的技术知识,所以除了建设成本高,后期投入的维护成本也很高,这将给数据中心带来沉重的运营包袱。应该深入研究这四种灾备技术,结合自身的实际情况,综合选择。灾备技术在数据中心中越来越重要,已经逐渐成为数据中心必备的重要技术之一。


作者:何妍 

来源:51CTO

相关文章
|
9天前
|
Web App开发 数据采集 开发者
某查”平台请求头反爬技术解析与应对
某查”平台请求头反爬技术解析与应对
|
3月前
|
机器学习/深度学习 人工智能 自然语言处理
AI技术深度解析:从基础到应用的全面介绍
人工智能(AI)技术的迅猛发展,正在深刻改变着我们的生活和工作方式。从自然语言处理(NLP)到机器学习,从神经网络到大型语言模型(LLM),AI技术的每一次进步都带来了前所未有的机遇和挑战。本文将从背景、历史、业务场景、Python代码示例、流程图以及如何上手等多个方面,对AI技术中的关键组件进行深度解析,为读者呈现一个全面而深入的AI技术世界。
309 10
|
2天前
|
机器学习/深度学习 缓存 自然语言处理
深入解析Tiktokenizer:大语言模型中核心分词技术的原理与架构
Tiktokenizer 是一款现代分词工具,旨在高效、智能地将文本转换为机器可处理的离散单元(token)。它不仅超越了传统的空格分割和正则表达式匹配方法,还结合了上下文感知能力,适应复杂语言结构。Tiktokenizer 的核心特性包括自适应 token 分割、高效编码能力和出色的可扩展性,使其适用于从聊天机器人到大规模文本分析等多种应用场景。通过模块化设计,Tiktokenizer 确保了代码的可重用性和维护性,并在分词精度、处理效率和灵活性方面表现出色。此外,它支持多语言处理、表情符号识别和领域特定文本处理,能够应对各种复杂的文本输入需求。
29 6
深入解析Tiktokenizer:大语言模型中核心分词技术的原理与架构
|
1月前
|
机器学习/深度学习 人工智能 算法
DeepSeek技术报告解析:为什么DeepSeek-R1 可以用低成本训练出高效的模型
DeepSeek-R1 通过创新的训练策略实现了显著的成本降低,同时保持了卓越的模型性能。本文将详细分析其核心训练方法。
538 11
DeepSeek技术报告解析:为什么DeepSeek-R1 可以用低成本训练出高效的模型
|
2天前
|
移动开发 前端开发 JavaScript
从入门到精通:H5游戏源码开发技术全解析与未来趋势洞察
H5游戏凭借其跨平台、易传播和开发成本低的优势,近年来发展迅猛。接下来,让我们深入了解 H5 游戏源码开发的技术教程以及未来的发展趋势。
|
5天前
|
机器学习/深度学习 人工智能 监控
鸿蒙赋能智慧物流:AI类目标签技术深度解析与实践
在数字化浪潮下,物流行业面临变革,传统模式的局限性凸显。AI技术为物流转型升级注入动力。本文聚焦HarmonyOS NEXT API 12及以上版本,探讨如何利用AI类目标签技术提升智慧物流效率、准确性和成本控制。通过高效数据处理、实时监控和动态调整,AI技术显著优于传统方式。鸿蒙系统的分布式软总线技术和隐私保护机制为智慧物流提供了坚实基础。从仓储管理到运输监控再到配送优化,AI类目标签技术助力物流全流程智能化,提高客户满意度并降低成本。开发者可借助深度学习框架和鸿蒙系统特性,开发创新应用,推动物流行业智能化升级。
|
13天前
|
人工智能 文字识别 自然语言处理
保单AI识别技术及代码示例解析
车险保单包含基础信息、车辆信息、人员信息、保险条款及特别约定等关键内容。AI识别技术通过OCR、文档结构化解析和数据校验,实现对保单信息的精准提取。然而,版式多样性、信息复杂性、图像质量和法律术语解析是主要挑战。Python代码示例展示了如何使用PaddleOCR进行保单信息抽取,并提出了定制化训练、版式分析等优化方向。典型应用场景包括智能录入、快速核保、理赔自动化等。未来将向多模态融合、自适应学习和跨区域兼容性发展。
|
22天前
|
人工智能 自然语言处理 算法
DeepSeek模型的突破:性能超越R1满血版的关键技术解析
上海AI实验室周伯文团队的最新研究显示,7B版本的DeepSeek模型在性能上超越了R1满血版。该成果强调了计算最优Test-Time Scaling的重要性,并提出了一种创新的“弱到强”优化监督机制的研究思路,区别于传统的“从强到弱”策略。这一方法不仅提升了模型性能,还为未来AI研究提供了新方向。
468 5
|
2月前
|
缓存 算法 Oracle
深度干货 如何兼顾性能与可靠性?一文解析YashanDB主备高可用技术
数据库高可用(High Availability,HA)是指在系统遇到故障或异常情况时,能够自动快速地恢复并保持服务可用性的能力。如果数据库只有一个实例,该实例所在的服务器一旦发生故障,那就很难在短时间内恢复服务。长时间的服务中断会造成很大的损失,因此数据库高可用一般通过多实例副本冗余实现,如果一个实例发生故障,则可以将业务转移到另一个实例,快速恢复服务。
深度干货  如何兼顾性能与可靠性?一文解析YashanDB主备高可用技术
|
2天前
|
存储 自然语言处理 监控
深度解析淘宝商品评论API接口:技术实现与应用实践
淘宝商品评论API接口是电商数据驱动的核心工具,帮助开发者高效获取用户评价、画像及市场趋势。其核心功能包括多维度信息采集、筛选排序、动态更新、OAuth 2.0认证和兼容多种请求方式。通过该接口,开发者可进行商品优化、竞品分析、舆情监控等。本文详细解析其技术原理、实战应用及挑战应对策略,助力开启数据驱动的电商运营新篇章。

热门文章

最新文章

推荐镜像

更多