云上技术 | 混合云多活容灾

简介: 近年来随着中国科技水平进步和数字化程度加深,企业开展工作高度依赖业务信息的传递和管理,数据中心所承载的业务复杂度大幅提高,与之对应面临的风险和威胁也越来越大,一旦数据中心因为突发故障中断了服务,造成的关键业务数据(客户信息、知识资产等)丢失将会严重影响企业正常运营。

画板 10 副本@2x-100.jpg

业务容灾现今发展趋势

近年来随着中国科技水平进步和数字化程度加深,企业开展工作高度依赖业务信息的传递和管理,数据中心所承载的业务复杂度大幅提高,与之对应面临的风险和威胁也越来越大,一旦数据中心因为突发故障中断了服务,造成的关键业务数据(客户信息、知识资产等)丢失将会严重影响企业正常运营。比较典型的例子有2014年,美国空军国防企业记账管理系统由于人为误操作,删除了数据库中的重要文件,因无异地容灾系统,导致直接损失22亿美元。2010年玉树地震中,某档案馆13万卷数字档案被毁,因缺少异地容灾手段,导致数据无法恢复。据Gartner Group统计,三分之一的企业在业务中断后的 4 个月之内倒闭。
特别是金融证券、国家安全等领域,关系到国家经济建设、社会发展和国防的战略性核心信息资源,保障其数据安全可靠,避免计算机网络系统灾难导致的数据损失是非常必要的。

然而包含有大量电子设备的数据中心出现突发故障又是不可避免的,日常随时可能出现像硬件自然老化、人工操作不当、软件功能缺陷或黑客对系统蓄意攻击等,都会导致系统运行的非正常中断,影响系统中数据的正确性或破坏系统数据库,致使部分甚至全部数据丢失。更不必说遭遇影响面广泛的火灾、地震、洪水等灾难,将对数据中心产生毁灭性打击,业务恢复会难上加难。

传统业务容灾面临的问题

既然故障的出现是必然事件,有没有一个完善的灾备方案来保证业务运转,将企业损失降到最低呢?
传统灾备给出了“主备双数据中心”方案。主数据中心提供日常数据读写服务,灾难备份中心并不提供线上服务,但会实时同步主数据中心的数据。一旦主数据中心出现故障,通过人工的方式,手动的将主数据中心切换为灾难备份中心来继续提供服务。
随着企业接入使用,就会发现其明显的缺点:一方面因为故障后人工切换,需要24小时值守的运维人力,而人的反应速度有限仍会处理不及时。另一方面备数据中心不对外本身就是资源浪费,且备数据中心长时间不对外服务,关键时刻切换,是否可以保证仍然可用也要画一个问号。

此外,对业务量庞大的中大型企业来说,提供服务的主数据中心停留在单地域,备数据中心完全不服务这种模式,会遇到单地域资源瓶颈问题。

多活容灾解决方案的架构与特性

针对传统方案的种种问题,阿里云经由阿里巴巴电商业务环境逐步演进,在混合云场景可提供多活容灾架构解决方案(Multi-Site High Availability),阿里云混合云能够帮助业务系统快速实现异地双活。其主要原理是两个数据中心同时对外服务,运行相同的应用,具备同样的数据,出现故障时数据中心自动切换,用户无感知,实现持续的应用可用性和灾难备份能力。并且通过资源整合还可以使“双活”数据中心的服务能力翻倍,最大化利用IT资源。
阿里云混合云多活容灾架构解决方案由架构加管控组合而成,架构上将业务分为接入层、应用层、数据层三层,应用层又可以细分为微服务调用、消息等多个功能域,每一层都会有相应的多活组件,管控在各层组件的基础上具备全栈的多活管控能力,将业务恢复和故障恢复解耦,并基于灵活的规则调度、跨域跨云管控、数据保护等能力,保障故障场景下的业务快速恢复。

1.png

异地双活架构主要有如下4个核心特性:

1、自上而下的流量管理:应用层和接入层进行流量路由,错误流量纠错和阻断,流量在单元封闭,当故障发生时将爆炸半径控制在单元内
2、低门槛接入:提供无代码侵入的MSHA-Agent,自动识别流量路由标并进行流量染色,支持众多开源RPC、MQ框架
3、数据双向同步:数据增量异步实时双向复制(如服务、消息、数据库等),同时解决了环形复制问题
4、数据防脏写:错误流量禁写保护避免脏写,切流期间禁写、禁更新保护避免脏写

2.jpg

业务的典型应用场景

落地到具体应用可以按业务数据维度分成三种类型,分别为读多写少型业务、流水单据型业务、状态依赖型业务。其中读多写少型业务、流水单据型业务在混合云场景较为常用。
典型的读多写少型业务有资讯、导购类的服务,例如商品浏览、新闻资讯等。其数据特点是读多写少,用户关注的是导购页中的商品信息,通常不关注商品的上架过程,因此读链路是核心,而写链路是可以被接受短暂的不可用,这种业务特性非常适合采用异地多读架构。读链路异地多活而写链路保持单点(单地域写),建设成本低、改造内容少、投入产出比高。
而流水单据型业务较读多写少型业务是更复杂的读写业务,主要电商交易、账单流水类服务,例如订单下单、通话记录等。更适用于异地双活架构来进行建设。

目前,阿里混合云多活容灾解决方案已服务多家客户。中国联通总部智慧客服联合阿里云,打造了智能化、集约化的云化双活客服系统,实现联通客服从接入、外呼到智能IVR、知识中心等7大业务域的双活容灾。历次大规模双活容灾演练,业务系统秒级切换,为联通智慧客服提供了有力的容量及容灾保障。

结语

云平台承载的在线业务系统直接关系到国计民生,影响重大,一旦出现数据篡改丢失和系统长期无法访问,后果难以承受。阿里云混合云多活容灾持续为客户的核心业务保驾护航,为了切实确保数据安全做到万无一失。


多活容灾混合云解决方案演示


阿里云混合云为政企提供量身打造的混合云解决方案
从建好云、管好云、用好云三大维度提供客户视角的一体化云平台服务
更多混合云资讯,前往混合云官网

相关文章
|
Java
有关Java发送邮件信息(支持附件、html文件模板发送)
有关Java发送邮件信息(支持附件、html文件模板发送)
728 1
|
6月前
|
关系型数据库 MySQL Java
【YashanDB知识库】原生mysql驱动配置连接崖山数据库
【YashanDB知识库】原生mysql驱动配置连接崖山数据库
【YashanDB知识库】原生mysql驱动配置连接崖山数据库
|
5月前
|
Cloud Native 关系型数据库 MySQL
华鼎冷链科技 × 阿里云瑶池数据库,打造全链路协同的智慧冷链新标杆
从 PolarDB 的高性能数据库服务到 AnalyticDB 的强大数据分析,阿里云提供的丰富产品矩阵为华鼎冷链科技构建了全面的解决方案,推动华鼎冷链科技从成本中心向效率中心转型。
|
SQL Java 数据库连接
Mybatis多表关联查询与动态SQL(上)
Mybatis多表关联查询与动态SQL
378 0
|
前端开发 UED 开发者
React组件优化全攻略:深度解析让你的前端应用飞速运行的秘诀——从PureComponent到React.memo的彻底性能比较
【8月更文挑战第31天】在构建现代Web应用时,性能是提升用户体验的关键因素。React作为主流前端库,其组件优化尤为重要。本文深入探讨了React组件优化策略,包括使用`PureComponent`、`React.memo`及避免不必要的渲染等方法,帮助开发者显著提升应用性能。通过实践案例对比优化前后效果,不仅提高了页面渲染速度,还增强了用户体验。优化React组件是每个开发者必须关注的重点。
185 0
|
SQL 关系型数据库 MySQL
mysql too many connections 解决
mysql too many connections 解决
419 4
|
11月前
|
关系型数据库 MySQL Java
MySQL数据锁:Record Lock,Gap Lock 和 Next-Key Lock
本文基于 MySQL 8.0.30 版本及 InnoDB 引擎,深入解析三种行锁机制:记录锁(Record Lock)、间隙锁(Gap Lock)和临键锁(Next-key Lock)。记录锁锁定索引记录,确保事务唯一修改;间隙锁锁定索引间的间隙,防止新记录插入;临键锁结合两者,锁定范围并记录自身,有效避免幻读现象。通过具体示例展示了不同锁的作用机制及其在并发控制中的应用。
1071 2
|
存储 SpringCloudAlibaba NoSQL
九.SpringCloudAlibaba极简入门-持久化Sentinel限流规则
在前两章节我们学习了通过[Sentinel的限流和熔断机制](https://blog.csdn.net/u014494148/article/details/105484410)来保护微服务,提高系统的可用性,但是有一个问题,我们在Sentinel配置了限流,熔断策略,默认情况下Sentinel的数据是基于内存存储,当客户端断开,或者Sentinel重启数据就会丢失,这不是我们愿意看到的。所有我们需要的Sentinel做数据持久。 Sentinel 中支持5种持久化的方式:file、redis、nacos、zk和apollo,本片文章针对于Nacos进行持久化配置。
|
机器学习/深度学习 人工智能 大数据
阿里云大数据&AI 2022案例合集
阿里云2022大数据&AI精选产品案例合集,了解产品最新及最佳实践,助力企业实现降本增效。
阿里云大数据&AI 2022案例合集
|
关系型数据库 MySQL 测试技术
压测工具sysbench的使用
压测工具sysbench的使用
883 0