金融机构架构面临的挑战

本文涉及的产品
对象存储 OSS,标准 - 本地冗余存储 20GB 3个月
对象存储 OSS,标准 - 同城冗余存储 20GB 3个月
对象存储 OSS,内容安全 1000 次 1年
简介: 新一代信息技术推动金融行业数字化转型,银行通过微服务、云计算等构建高可用、高性能的技术体系。容灾作为关键环节,涵盖数据、应用与业务三级,强调RTO/RPO指标及“两地三中心”向“多活中心”演进,提升业务连续性与抗灾能力。

以云计算、大数据、人工智能、区块链等为代表的新一代技术已经崛起,不断向金融领域渗透、银行也通过信息科技转型、数字化来应对挑战,保持传统金融行业“高可用、高标准、低风险”特性的同时,也增加了互联网金融对“高性能、高弹性、低成本”方面的要求。

经过多年的发展和演进,走出了一条解决海量数据存储、计算以及应对高并发交易的道路,通过微服务分布式架构、云计算和大数据等技术构建了一套能满足业务发展要求的技术体系。

1.1 容灾

在系统高可用架构设计中,容灾能力的建设不可或缺,容灾设计强调的是系统对灾难时间具备快速响应能力,保障系统持续高可用,系统面对异常情况,如软硬件自身故障,外界环境影响(自然灾害)需具备快速恢复能力,保障系统的持续高可用。

衡量灾难恢复能力的级别有两个技术指标,RPO(Recovery Point Objective,恢复点目标)和RTO(Recovery Time Objective,恢复时间目标)。RPO用于表示灾难发生后,系统和数据必须恢复到的时间点要求。RTO用于表示灾难发生后,信息系统或业务功能从停顿到必须恢复的时间要求。RPO和RTO与灾难恢复能力登记的关系与时间有着密切的联系。

容灾方案须满足3个要素:①应用和数据都具有冗余性②冗余备份位于距离较远的物理位置③数据备份系统具备全方位的数据复制能力。

容灾从保护等级上划分可以分为3个级别,分别是数据级别、应用级别及业务级别,三者的关系可以用3个嵌套的同心圆表述,业务恢复等级逐步提高,需要投资的费用也会相应增加。

1.1.1 数据容灾

可靠的容灾能力除了应用、数据都具有冗余性外,还需要确保备份在物理上具有长距离性(上百千米以上)。可以的容灾能力需要具备全方位的数据复制能力。

1.1.2 应用容灾

应用容灾在数据容灾纸上,建立一套与生产系统相当的备份应用系统,在灾难发生后,将应用迅速切换到备用系统,备份系统承担生产系统的业务运行,其核心关注点是连续的应用服务,是在数据容灾的基础上,把应用系统也备份到容灾站点。应用容灾和数据容灾最大的区别是在生产中心发生灾难时,灾备中心是否具备接管中心的业务的能力,能否保障业务的连续性。应用容灾确保系统能提供可持续的服务,当灾难发生时,让用户的服务请求能够透明地持续正常处理,保证信息系统提供完整、可靠、安全的服务。

银行核心应用系统(如账务)一般部署在主机平台上,使用小型机(一种介于PC服务器和大型机之间的高性能计算机,主要支持UNIX操作系统)构建,可用性高,运行稳定,但也存在风险集中、处理能力触达瓶颈后伸缩性不够、价格昂贵等问题。

1.1.3 业务容灾

业务容灾是最高级别的容灾方案,数据容灾和应用容灾都是在IT范畴之内,而业务容灾除了做到数据和应用的容灾外,还需要确保非IT系统的连续性,比如电话、办公地点等。

1.1.4 部署结构

以“同城双中心”(生产中心、同城灾备中心)和异地灾备中心组成“两地三中心”的部署结构可以支撑较高的业务连续性保障水平。该结构可解决单机房在电力、面积等方面的限制,规避数据中心所在楼宇发生的灾难、地域性自然灾害和人为破坏(如网络光纤被挖断)等导致的数据中心故障风险。

传统的“两地三中心”部署结构并不能很好地应对“同城双中心”同时发生故障的情况,当进行异地灾备中心切换时,数据同步到异地灾备中心的过程存在延迟,即RPO不等于0。

在实践过程中,当发生城市级别故障时,在同城两个数据中心都不可用的情况下,企业往往不敢切换到异地灾备中心,而是等待“同城双中心”故障恢复,忍受一段服务不可用时间。

有别于“两地三中心”,“多活中心”的部署结构在少数数据中心发生故障或灾难时,其余每个数据中心都可以正常处理业务并对关键业务或全部业务实现接管,实现用户的“故障无感知”,多数据中心之间地位是均等的,已无“主备”之分,在正常模式下协同工作,并行为业务访问提供服务,实现对资源的充分利用,避免了个别数据处于限制状态,造成资源浪费。但要实现“多活”数据中心的架构需要解决流量调配、数据拆分、时延等方面的问题,挑战巨大。



目录
相关文章
|
9天前
|
人工智能 开发框架 缓存
2025 SECon × AgentX 大会:AI 原生应用架构专场精彩回顾 & PPT 下载
近日,2025 SECon × AgentX大会——AI 原生应用架构专场圆满落幕,本次专场阿里云联合信通院共同出品,现场吸引了 80+ 名技术从业者深度参与。活动聚焦 AI 时代软件架构的核心命题,深度分享了 AI 原生应用架构趋势与实践、AgentScope 开发框架、AI 开放平台、大模型可观测 & AIOps 等热门技术议题,探讨从基础设施到应用层的协同演进策略与工程实践。
112 19
|
9天前
|
监控 应用服务中间件 nginx
Agentic 时代必备技能:手把手为 Dify 应用构建全链路可观测系统
本文讲述 Dify 平台在 Agentic 应用开发中面临的可观测性挑战,从开发者与运维方双重视角出发,系统分析了当前 Dify 可观测能力的现状、局限与改进方向。
251 44
|
2月前
|
负载均衡 Java API
《服务治理》RPC详解与实践
RPC是微服务架构的核心技术,实现高效远程调用,具备位置透明、协议统一、高性能及完善的服务治理能力。本文深入讲解Dubbo实践,涵盖架构原理、高级特性、服务治理与生产最佳实践,助力构建稳定可扩展的分布式系统。(238字)
|
1月前
|
存储 网络协议 数据挖掘
阿里云通用算力型u2i实例与u1性能与适用场景对比,以及2核4G、4核8G活动价格参考
通用算力型实例是阿里云推出主打性价比的云服务器实例规格,这类实例首先有企业级实例,采用固定CPU调度模式。通用算力型u1实例推出时间比较久了,u2i实例刚推出不久,算力性能超u1实例40%,开发测试成本直降75%。目前u1实例2核4G5M带宽199元一年,且续费价格不变。而通用算力型实例u2i目前也已经正式开启首次优惠,指定配置2.5折1年。有的用户不清楚他们之间的区别,本文为大家介绍这二个通用算力型实例的性能、适用场景和活动价格的对比,以供选择参考。
503 3
阿里云通用算力型u2i实例与u1性能与适用场景对比,以及2核4G、4核8G活动价格参考
|
2月前
|
人工智能 安全 架构师
2025云栖大会 | 阿里云网络技术Session主题资料和视频回放归档
2025年9月24日-26日,杭州,一年一度的云栖大会如期而至;阿里云飞天洛神云网络作为阿里云计算的连接底座,是飞天云操作系统的核心组件,致力于为上云企业提供高可靠、高性能、高弹性、智能的连接服务。本次云栖,云网络产品线也带来全系列产品升级,以及创新技术重磅解读,围绕增强确定性、提效自动化、深耕智能化和敏捷全球化带来技术、产品和服务升级,以及全新的云网络产品生态合作计划发布。
449 2
|
2月前
|
存储 前端开发 Java
基于Spring AI Alibaba 的 DeepResearch 架构与实践
基于SpringAI Alibaba Graph构建的Java版DeepResearch系统,实现信息搜集、分析到结构化报告生成的全自动流程。支持多轮推理、RAG检索、MCP扩展、可观测性及可溯源输出,集成主流搜索工具与多种数据源,具备高可扩展性与企业级应用能力。
基于Spring AI Alibaba 的 DeepResearch 架构与实践
|
监控 Java Spring
AOP 是什么?一文带你彻底搞懂面向切面编程
本文带你深入理解AOP(面向切面编程),通过Spring Boot实战实现日志、异常、性能监控等通用功能的统一处理。无需修改业务代码,5步完成方法日志切面,解耦横切关注点,提升代码可维护性,真正实现无侵入式增强。
445 5