金融级云原生基础架构
金融级云原生基础设施需要满足 5 大总体要求和 13 项管理要求。
(一) 5 大总体要求为:
◆ 一是采用成熟云平台产品,打造 IaaS、PaaS 一体化云计算平台,实现租户端和运维端的 完整服务目录,与软件开发体系和生产运维体系无缝对接;
◆ 二是实现全公司级基础资源弹性供给,按照分布式技术框架,支撑全公司业务系统实现高 可用容灾架构,满足安全生产要求;
◆ 三是全面满足信息技术应用创新要求,从云平台底座到软件服务具有全链路信息技术应用 创新运行的能力,同时保障分布式应用高性能稳定运行;
◆ 四是具备提供大规模应用上云的基础, 提供完善的应用框架, 对应用系统提供稳定、持续、 高性能的支撑;
◆ 五是云平台产品有成熟生态圈,与业界公有云技术发展保持基本同步,适配最新开源技术 演进。
(二) 13 项管理能力要求为:
统一资源管理:采用统一的物理资源类型和架构实现基础硬件资源的统一管理, 如服务器、 交换机、操作系统等;云管平台通过统一管理方式(控制台、API 等)实现两地三中心的计算、 存储、网络等云资源进行管理,降低开发和运维使用复杂度。
统一数据管理:对同城双活、异地多活架构通过数据存储、迁移、同步等方式,保障分布 式云节点数据一致性,提供一体化容灾及联动切换能力,最大限度满足业务连续性要求。如提 供统一的镜像方案、对象存储的容灾、数据库跨地域备份和同步等。
统一服务管理:支持两地三中心节点通过统一的 API、SDK、控制台等管理云服务,如统 一控制面进行服务的部署、更新等,大幅降低云服务管理复杂度,提升用云效率。
统一运维管理:通过云管实现对两地三中心不同节点采用相同的运维体系进行管理,提供 一致的运营、监控、可靠性 SLA 等服务, 减少运维管理人员工作量, 提升运维效率, 大幅降低 系统故障,缩短故障时间。
统一安全管理:一方面通过物理基础设施、网络安全、数据面 / 控制面隔离等实现平台侧安全, 另一方面通过主机安全、访问控制、防火墙、态势感知等实现安全服务,保障一体化安全。
统一资源调度:通过云管实现对两地三中心算力资源的统一调度, 提供多种调度策略支持。 基于位置调度满足对时延和带宽敏感的业务(如手机银行音视频应用) ;基于算力需求调度满 足对 AI、大数据等大计算量的业务(如潮汐调度、混部等场景) ;基于工作负载调度满足多维 异构的场景(如理财抢购、积分兑换、双 11 等应用场景)。
统一监控管理:完成云上和云下各类型监控指标的接入和统一展现;完成云上和云下分布 式链路追踪能力,实现从业务监控、到应用服务监控、到资源监控的逐层下钻和多维分析,完 善故障定位分析能力;通过统一告警中心的对接和优化完成动态阈值,提升业务整体事件感知 能力、快速定位能力和智能化分析决策能力。
支撑多元算力:云资源池兼容 CPU、GPU 等多种算力,为人工智能、深度学习、科学计 算等多领域场景的金融科技类新应用产品提供高效的云算力服务。
支撑全栈信息技术应用创新:通过一套体系兼容多产品服务能力,支撑一云多芯、全栈 XC 云平台服务能力,推动信息技术应用创新战略落地。
支撑精细化管理:通过平台的计量计费能力以及与行内各系统打通, 实现计算、存储、网络、 安全等多类资源的计量计费能力。逐步实现 IT 成本精细化管理,实现业务 IT 投入与业务产出 可度量、可评价,实现成本与效率的兼顾,实现 IT 资源的高效利用。
支撑裸机管理:满足裸金属交付从服务器上架、自动化装机、系统设置和软件编排的流程 自动化和批量化,提升交付效率,降低人工工作量;满足裸金属统一纳管要求,实现裸机的统 一监控和告警。
支撑服务质量:通过自服务能力提升,基础设施管理平台的建设将能够提供高效稳定运行 精细化管理提供更好的服务, 根据平台对于数据的收集及分析, 将有效的改进管理方向和内容, 能有效增强服务品质。
支撑架构发展:采用行业领先的专有云架构,搭建与公有云同源、满足金融行业容灾要求 的云平台,通过一套体系支撑所有产品,支撑全行线上线下一体化运维体系建设,通过有机统 一的体系结构设计,满足未来全栈云平台能力建设。