《生来创新-金融级云原生》——2 金融级云原生的“新标准和新蓝图”——2.2 定义金融云原生的10大新要素——要素10:业务连续性和数智化运维

简介: 《生来创新-金融级云原生》——2 金融级云原生的“新标准和新蓝图”——2.2 定义金融云原生的10大新要素——要素10:业务连续性和数智化运维

image.png

在云原生环境下要对多个容器、多个虚拟机、多个主机、多个可用区、甚至多个地域上 的信息进行关联,才可能回答清楚服务为什么宕机、为什么没有实现定义的 SLO、故障影响了 哪些用户和业务等这一系列问题,才可能基于运维数据和 AI 智能实现高效的“监控、变更、应 急、容量、容灾、演练”数智化运维管理。



云原数智化运维主要包括七方面能力:


监控发现能力:指标、日志、链路全方位可观测性,全面覆盖业务、中间件和基础设施, 并且可层层下钻。


障应急处置能力:  异常全面发现,快速定位和恢复的能力,确保业务 SLA。


更风险防控能力:  业务全方位变更管控,严守“可灰度、可观测,可回滚”三板斧。


容量管理能力:务到基础设施提供全链路容量精准评估和风险提前识别能力,达到稳 定与成本的平衡。


容灾管理能力平台化可编排容灾,支撑机房容灾,单元化容灾等场景,覆盖演练,切换 和大屏等能力


演练评测能力:  通过混沌工程、红蓝攻防等方式,对业务风险保障能力进行探测和检验

资金安全障能力:基于资金安全核对规则,通过离线、实时、文件等方式对业务系统的 资金流进行监测


云原数智化运维主要具备三方面特征:


①   高效 : 通过运维工作的平台化来提高运维效率。如系统监控平台、变更管控平台、动态资 源管控平台、调度中心、注册中心等。


②   安全:基于自动业务验证平台和大数据运算规则,保障系统运行的稳定性与正确性。如数 据核对中心、依赖管控平台、容量检测管控平台等。


③   智能:基于大数据的分析和规则计算, 进行智能化的运维管控。如自动故障分析处理系统、 容量自动探测扩容系统等

相关文章
|
10月前
|
消息中间件 运维 监控
智能运维,由你定义:SAE自定义日志与监控解决方案
通过引入 Sidecar 容器的技术,SAE 为用户提供了更强大的自定义日志与监控解决方案,帮助用户轻松实现日志采集、监控指标收集等功能。未来,SAE 将会支持 istio 多租场景,帮助用户更高效地部署和管理服务网格。
615 52
|
运维 Linux Apache
Puppet 作为一款强大的自动化运维工具,被广泛应用于配置管理领域。通过定义资源的状态和关系,Puppet 能够确保系统始终处于期望的配置状态。
Puppet 作为一款强大的自动化运维工具,被广泛应用于配置管理领域。通过定义资源的状态和关系,Puppet 能够确保系统始终处于期望的配置状态。
674 3
|
10月前
|
人工智能 运维 监控
阿里云携手神州灵云打造云内网络性能监测标杆 斩获中国信通院高质量数字化转型十大案例——金保信“云内网络可观测”方案树立云原生运维新范式
2025年,金保信社保卡有限公司联合阿里云与神州灵云申报的《云内网络性能可观测解决方案》入选高质量数字化转型典型案例。该方案基于阿里云飞天企业版,融合云原生引流技术和流量“染色”专利,解决云内运维难题,实现主动预警和精准观测,将故障排查时间从数小时缩短至15分钟,助力企业降本增效,形成可跨行业复制的数字化转型方法论。
531 6
|
人工智能 Cloud Native 安全
从云原生到 AI 原生,谈谈我经历的网关发展历程和趋势
本文整理自阿里云智能集团资深技术专家,云原生产品线中间件负责人谢吉宝(唐三)在云栖大会的精彩分享。讲师深入浅出的分享了软件架构演进过程中,网关所扮演的各类角色,AI 应用的流量新特征对软件架构和网关所提出的新诉求,以及基于阿里自身实践所带来的开源贡献和商业能力。
692 111
|
人工智能 Cloud Native 安全
从云原生到 AI 原生,网关的发展趋势和最佳实践
本文整理自阿里云智能集团资深技术专家,云原生产品线中间件负责人谢吉宝(唐三)在云栖大会的精彩分享。讲师深入浅出的分享了软件架构演进过程中,网关所扮演的各类角色,AI 应用的流量新特征对软件架构和网关所提出的新诉求,以及基于阿里自身实践所带来的开源贡献和商业能力。
1011 105
|
11月前
|
消息中间件 运维 监控
智能运维,由你定义:SAE自定义日志与监控解决方案
SAE(Serverless应用引擎)是阿里云推出的全托管PaaS平台,致力于简化微服务应用开发与管理。为满足用户对可观测性和运维能力的更高需求,SAE引入Sidecar容器技术,实现日志采集、监控指标收集等功能扩展,且无需修改主应用代码。通过共享资源模式和独立资源模式,SAE平衡了资源灵活性与隔离性。同时,提供全链路运维能力,确保应用稳定性。未来,SAE将持续优化,支持更多场景,助力用户高效用云。
|
运维 Cloud Native 开发工具
智能运维:云原生大规模集群GitOps实践
智能运维:云原生大规模集群GitOps实践,由阿里云运维专家钟炯恩分享。内容涵盖云原生运维挑战、管理实践、GitOps实践及智能运维体系。通过OAM模型和GitOps优化方案,解决大规模集群的发布效率与稳定性问题,推动智能运维工程演进。适用于云原生环境下的高效运维管理。
512 8
|
11月前
|
人工智能 Cloud Native 安全
从云原生到 AI 原生,谈谈我经历的网关发展历程和趋势
从云原生到 AI 原生,谈谈我经历的网关发展历程和趋势
189 0
|
边缘计算 运维 Cloud Native
云原生技术的崛起:重新定义软件开发与运维
云原生技术的崛起:重新定义软件开发与运维