mPaaS云平台运维系列之—高可用架构介绍

本文涉及的产品
传统型负载均衡 CLB,每月750个小时 15LCU
网络型负载均衡 NLB,每月750个小时 15LCU
应用型负载均衡 ALB,每月750个小时 15LCU
简介: mPaaS云平台运维系列之—高可用架构介绍

1 高可用架构介绍

高可用性(HighAvailability)指的是通过尽量缩短因日常维护操作(计划)和突发的系统崩溃(非计划)所导致的停机时间,以提高系统和应用的可用性。
mPaas的专有云体系在通过集群技术、双机热备、健康检查等高可用技术,实现在部分节点故障的情况下,仍能提供继续访问应用的能力。

1.1 硬件层面高可用

由于AntStack是纯软件输出,对于部署所需的服务器资源,基于推荐的款型,可实现硬件层面的高可用,能够抵御磁盘、硬件级别的故障对于交换机、防火墙、存储等其他数据中心硬件设备的冗余如图1-1所示由用户自己保证。

image.png

图1-1 硬件设备高可用示意图

1.2 应用APP集群高可用

应用App集群高可用,主要体现在:
(1)采用负载均衡集群模式,将访问分担至多个实服务,当单个容器损坏时,不影响业务正常运行;
(2)核心应用的容器,强制互斥部署在不同的物理服务器上,保证当单个物理服务器宕机时,业务无影响;
(3)故障隔离,容器本身发生故障时,负载均衡的健康检查功能将故障容器隔离;
(4)故障的快速恢复,当一台物理服务器宕机时,之上的容器能够手动地在资源空闲的服务器上重启,容器恢复后,业务流量重新分配;
(5)对于磁盘、物理服务器的宕机,或者小规模的故障,不会影响业务的正常运行。

1.3 关键数据高可用

在AntStack中,提供数据存储能力的组件配置了数据备份策略或完整性保证;当单台容器或者单台物理机发生故障后,能够保证业务数据、关键管理数据不丢失如表1-1所示。

表1-1 关键组件高可用说明

序号

应用名称

类型

用途

数据完整性实现

1

OceanBase

分布式关系型数据库

管理数据、业务数据

OB集群保证

2

HBase

表格存储

监控数据

集群多副本保证

3

HDFS

分布式文件系统

HBASE、Spark

集群多副本保证

4

etcd

分布式数据库

AKE集群元数据

集群多副本保证

5

zookeeper

集群管理

ALB元数据

集群多副本保证

1.4 业务可监控、可恢复

1. 业务可监控

从核心态到业务应用监控全覆盖包括一下4个方面:
(1)以日志、REST接口等作为数据采集来源;
(2)提供应用、业务等各种视角的监控能力;
(3)快速发现问题、定位问题、分析问题、解决问题;
(4)为线上系统可用率提供有效保障

2. 应用可恢复
(1)在机房掉电的场景下,应用依赖满足后,可快速恢复;
(2)关键业务数据完整性保证;
(3)核心态中枢组件,通过容器宕机迁移实现恢复

1.5 发布灰度、可回滚

云游支持多种发布方式,可实现版本变更过程中先发一台,发布后进行灰度引流,确认功能无误后再进行下一组发布。发布过程满足变更三板斧:可灰度、可回滚、可监控,新版本如果不符合预期可快速回滚至升级前状态。

1.6 核心应用实现高可用

1. 云游高可用实现

如图1-2所示,云游的高可用主要体现下以下3个方面:
(1)云游应用采用负载均衡集群部署;通过VIP对外提供统一服务;
(2)数据库采用MySQL,主备方式进行数据同步;
(3)当主数据库宕机时,切换至备数据库,保证业务继续; 

image.png 

图1-2 云游高可用示意图

2. AKE管控高可用实现

如图1-3所示,AKE的高可用主要体现下以下2个方面:
(1) 管控容器集群部署;
(2) 管理元数据通过etcd三副本保存

image.png

图1-3 AKE高可用示意图

3. OceanBase高可用实现

如图1-4所示,OceanBase的高可用主要体现下以下3个方面:
(1) 所有应用数据库数据都存放于ob数据库;
(2) OB通过三副本保证数据高可用;
(3) 当一台机器损坏时,数据0丢失,业务无感知

image.png

图1-4 OceanBase高可用示意图

4.ALB高可用实现

如图1-5所示,ALB的高可用主要体现下以下4个方面:
(1) 四层负载均衡(F5)高可用由客户F5自身保证;
(2) 所有的ALB应用集群部署;
(3) ALBAPI / Manager等管理数据分别存在zookeeper和OB中;
(4) Spanner作为7层负载均衡冗余部署;当一个Spanner宕机时,流量自动切换到另一个Spanner上

image.png 

图1-5ALB高可用示意图

4.mPaa业务组件高可用实现

如图1-6所示,mPaaS业务组件的高可用主要体现下以下6个方面:
(1)负载均衡采用集群模式,将访问分担至多个实服务,当单个容器损坏时,不影响业务正常运行;
(2)核心应用的容器,强制互斥部署在不同的物理服务器上,保证当单个物理服务器宕机时,业务无影响;
(3)故障隔离,容器本身发生故障时,负载均衡的健康检查功能将故障容器隔离;
(4)故障的快速恢复,当一台物理服务器宕机时,之上的容器能够手动地在资源空闲的服务器上重启,容器恢复后,业务流量重新分配;
(5)关键数据存储于OB、HDFS、HBASE等存储组件,确保业务数据、关键管理数据不丢失;
(6)对于磁盘、容器、单台物理服务器的宕机,不会影响业务的正常运行。

image.png

图1-6 业务高可用示意图

目录
相关文章
|
14天前
|
存储 SQL 关系型数据库
Mysql高可用架构方案
本文阐述了Mysql高可用架构方案,介绍了 主从模式,MHA模式,MMM模式,MGR模式 方案的实现方式,没有哪个方案是完美的,开发人员在选择何种方案应用到项目中也没有标准答案,合适的才是最好的。
75 3
Mysql高可用架构方案
|
3月前
|
运维 监控 Cloud Native
自动化运维的魔法书云原生之旅:从容器化到微服务架构的演变
【8月更文挑战第29天】本文将带你领略自动化运维的魅力,从脚本编写到工具应用,我们将一起探索如何通过技术提升效率和稳定性。你将学会如何让服务器自主完成更新、监控和故障修复,仿佛拥有了一本能够自动翻页的魔法书。
|
3月前
|
存储 Cloud Native 关系型数据库
PolarDB 高可用架构设计与实践
【8月更文第27天】 在现代互联网应用中,数据库作为核心的数据存储层,其稳定性和可靠性尤为重要。阿里云的 PolarDB 作为一款云原生的关系型数据库服务,提供了高可用、高性能和自动化的特性,适用于各种规模的应用。本文将详细介绍 PolarDB 的高可用架构设计,并探讨其实现数据安全性和业务连续性的关键技术。
99 0
|
20天前
|
Kubernetes 关系型数据库 MySQL
Kubernetes入门:搭建高可用微服务架构
【10月更文挑战第25天】在快速发展的云计算时代,微服务架构因其灵活性和可扩展性备受青睐。本文通过一个案例分析,展示了如何使用Kubernetes将传统Java Web应用迁移到Kubernetes平台并改造成微服务架构。通过定义Kubernetes服务、创建MySQL的Deployment/RC、改造Web应用以及部署Web应用,最终实现了高可用的微服务架构。Kubernetes不仅提供了服务发现和负载均衡的能力,还通过各种资源管理工具,提升了系统的可扩展性和容错性。
57 3
|
10天前
|
机器学习/深度学习 运维 监控
智能运维在现代IT架构中的转型之路####
【10月更文挑战第29天】 本文旨在探讨智能运维(AIOps)如何成为现代IT架构不可或缺的一部分,通过分析其核心价值、关键技术及实践案例,揭示AIOps在提升系统稳定性、优化资源配置及加速故障响应中的关键作用。不同于传统运维模式的被动响应,智能运维强调预测性维护与自动化处理,为企业数字化转型提供强有力的技术支撑。 ####
44 0
|
1月前
|
存储 运维 监控
高效运维:从基础架构到自动化管理的全面指南
【10月更文挑战第11天】 本文将深入探讨如何通过优化基础架构和引入自动化管理来提升企业IT运维效率。我们将从服务器的选择与配置、存储解决方案的评估,到网络的设计与监控,逐一解析每个环节的关键技术点。同时,重点讨论自动化工具在现代运维中的应用,包括配置管理、持续集成与部署(CI/CD)、自动化测试及故障排除等方面。通过实际案例分析,展示这些技术如何协同工作,实现高效的运维管理。无论是IT初学者还是经验丰富的专业人员,都能从中获得有价值的见解和实操经验。
66 1
|
1月前
|
存储 运维 监控
高效运维管理:从基础架构优化到自动化实践
在当今数字化时代,高效运维管理已成为企业IT部门的重要任务。本文将探讨如何通过基础架构优化和自动化实践来提升运维效率,确保系统的稳定性和可靠性。我们将从服务器选型、存储优化、网络配置等方面入手,逐步引导读者了解运维管理的核心内容。同时,我们还将介绍自动化工具的使用,帮助运维人员提高工作效率,降低人为错误的发生。通过本文的学习,您将掌握高效运维管理的关键技巧,为企业的发展提供有力支持。
|
2月前
|
敏捷开发 运维 Prometheus
构建高效运维体系:从基础架构到自动化管理
本文探讨了如何通过优化基础架构、引入自动化工具和流程,以及加强团队协作,构建高效的运维体系。通过案例分析和实践建议,帮助运维人员实现系统的稳定性、可靠性和可维护性。
|
3月前
|
运维 监控 关系型数据库
【一文搞懂PGSQL】7. PostgreSQL + repmgr + witness 高可用架构
该文档介绍了如何构建基于PostgreSQL的高可用架构,利用repmgr进行集群管理和故障转移,并引入witness节点增强网络故障检测能力。repmgr是一款轻量级的开源工具,支持一键部署、自动故障转移及分布式节点管理。文档详细描述了环境搭建步骤,包括配置postgresql参数、安装与配置repmgr、注册集群节点以及配置witness节点等。此外,还提供了故障手动与自动切换的方法及常用命令,确保集群稳定运行。
|
3月前
|
数据挖掘 关系型数据库 MySQL
Serverless高可用架构的解决方案体验
Serverless高可用架构的解决方案体验
161 6