阿里云金融级分布式架构助力南京银行打造国内首家云上新金融

简介: 2018飞天技术汇,阿里云金融业务事业部高级专家石大伟带来题为阿里云金融级分布式架构的演讲。首先介绍了银行行业的发展背景,然后详细讲解了阿里云金融级核心系统分布式架构的核心优势、适用场景以及成功案例,最后分享了如何利用互联网优势,助力银行快速创新发展,让用户更好的享受金融服务。

2018飞天技术汇,阿里云金融业务事业部高级专家石大伟带来题为阿里云金融级分布式架构的演讲。首先介绍了银行行业的发展背景,然后详细讲解了阿里云金融级核心系统分布式架构的核心优势、适用场景以及成功案例,最后分享了如何利用互联网优势,助力银行快速创新发展,让用户更好的享受金融服务。
数十款阿里云产品限时折扣中,赶快点击这里,领券开始云上实践吧!
直播视频回顾
PPT下载请点击
以下是精彩视频内容整理:

南京银行数字化转型

随着全球银行行业已进入4.0数字化时代,客户要求以客户体验为中心的全渠道、无缝式、定制化服务的体验需求也越来越高。南京银行数字化转型主要有三大观点,首先以客户为中心,全面提升客户体验;其次是基于移动端和互联网平台打造创新业务模式;最后布局金融科技打造共赢生态圈。
南京银行是国内首家成立分布式核心业务系统的银行,核心系统是银行中最重要的系统,用来管理客户账户的基本金融交易,例如存款、取款、支付等等。在整个“鑫云+”互金平台应用架构的底层IAAS层使用的是阿里云的飞天云系统,PAAS层则全面使用了蚂蚁金服的分布式中间件以及关键技术分布式数据库,最上层南京银行构建了账户服务、产品管理、投资、理财、客户中心等三十几个应用。

1

“鑫云+”构建了一种1+2+3N的新模式,1代表南京银行,2代表阿里云和蚂蚁金融云,第一个N代表成员行,第二个N代表互联网平台,第三个N代表各种不同的场景。鑫云+是打通数据和金融的一座桥梁,为互联网端的用户提供更好的服务。

银行的行业背景

现如今银行处于机遇与挑战并存的状态:
经济潜在增值率下降、资产回报率下降以及全球范围内的资产荒等情况是当今经济发展的新常态。2015年10月利率市场化基本完成,商业银行核心业务受到巨大冲击,导致利差减小,主营业务收入缩水,生存压力逐渐增大。商业银行的资金定价能力也面临严峻的考验,加大了商业银行的利率风险,现如今互联网金融用户人数超过5亿,在理财、贷款、支付三类主要金融功能上,各类金融科技公司对国内传统银行业务造成了巨大冲击,导致存款理财化进一步普及。同时中国银监会办公厅相继开展关于银行业“违法、违规、违章、监管套利、空转套利、关联套利、不当创新、不当交易、不当激励、不当收费”等专项治理工作的通知,这都是银行哟啊面临的挑战。
有挑战就会有机遇,2016年,中国银行业总资产、总负债规模持续稳步增长,多数上市银行呈现了不良贷款余额上升、不良率下降的情况,这为银行转型带来了基础和时间窗口。中国零售银行业经历了三十多年的发展,并取得了丰硕的成果,自2009年起,零售银行收入以每年23的速度递增,预计到2020年,整体规模将达到 3.2 万亿人民币,贷款资产规模也将达到 32 万亿元人民币,成为仅次于美国的全球第二大零售银行市场。随着互联网的发展和智能移动终端的普及把客户行为从线下转变为线上与线下并重,在平台和场景中获取的金融服务已经成为主流,未来的零售业务必须与各类社会生产、生活场景整合,通过线上平台与各大电商平台、社会资源平台对接,实现批量获取并经营客户,达到超常规发展的目标。单从动力层面来看大数据,移动互联网,人工智能,生物识别,区块链,物联网等金融科技能力正在助力银行的业务架构转型。单从银行的业务形态来看会受到转型的影响,将从单一固化模式向更加综合化与灵活化的模式发展,业务模式也从以银行为中心转变为以客户为中心以获得更多的客户,并且业务核心也将会更加注重零售业务。
另一方面,传统架构也面临着挑战,随着业务的快速增长,需要系统水平扩容就会遇到瓶颈,传统架构的开发周期较长,导致需求响应较慢,无法适应互联网业务的快速发展,并且系统升级需要停机,无法进行7*24运行,且不支持灰度发布,导致试错的成本过高。传统IOE架构成本、应用耦合度、系统研发成本都过高,生产问题的频发导致数据治理难以落地,影响了数据的应用发展。

南京银行鑫云+互金平台

在高速发展的互金业务过程中,无论是创新还是传统业务,银行对于稳定性的要求永远是第一位,所以科技部门也面临着巨大的挑战。首先是传统架构无法适应业务发展的需要,其次是在使用新的技术时,科技团队无法在短时间内掌握新的技术,也无法保障新的业务能够稳定运行。针对这些问题与挑战,阿里云给出了一套完整的解决方案。

2

整个方案的底层是阿里云的飞天平台,除了弹性的基础设施以外,还支持了全新的互联网架构的业务模式,包括分布式架构与大数据支撑来帮助银行快速转型,并且节省了银行运营成本。绿色部分是中间件模块,是分布式架构的核心能力,基于IT架构的分布式规划可以帮助银行呈现出核心的共享服务能力。分布式物联网核心业务主要是账户体系和线上贷款系统,由于分布式核心平台在做业务扩展以及业务创新时比较容易,并且成本较低,所以该平台也在逐步扩展理财销售、聚合支付以及互联网生态等业务。

互联网架构带来的优势

互联网架构带来的优势主要有几个方面:

  • 技术的先进性:22台普通X86应用服务器与X86普通的数据库服务器支撑了1000万客户、5000万账户、4000+TPS的业务处理能力,并且支持线性扩展。此外批量处理能力也可达到2000万借据计提只需40分钟。
  • 自主可控:可以完全依赖国内软件厂商生产的X86服务器,以及阿里云自主开发的金融级分布式数据库Oceanbase。
  • 成本低廉:分布式的单账户成本可以降一个数量级,运营成本实际上是创新成本的奖励,推动了银行创新业务的加速发展。
  • 研发效能:实现了按周交付到按天交付以及分钟级的部署,打破了传统端的4个运维工具无法达到鑫云+平台的能力瓶颈。

金融级数据OCEANBASE

3

Oceanbase具有强一致和高性能的特性,Oceanbasec采用了多副本模式,解决了金融场景对高可靠的要求。其可扩展性支持分区和+tablegroup,并且不同业务系统,可以用不同的租户,做到cpu线程级别的隔离和平滑扩容,所以可以直接分百。高性能的特性可以实现准内存数据库,并且读写性能是超过Mysql的,同时也做到了Mysql全兼容,成本也比较低。
微服务框架包含几块核心的能力,服务注册发现是去中心化的服务治理,提供服务发布与订阅、服务调用、服务路由等能力。RPC框架为应用提供高性能、透明化、点对点的远程服务调用方案,具有高可伸缩性、高容错性的特点。服务管控提供了服务限流、服务管控等能力。动态配置提供应用运行时动态修改配置的服务。链路跟踪实现分布式链路跟踪服务,可视化运维监控,全链路故障分析。定时任务则是提供统一通用的任务调度服务,提供定时任务的管理监控平台。

限流降级

4

系统上线后,为保证核心业务不受到突发流量的影响,提供了限流的能力。在服务提供者部署了限流模块,当消费者A的流量过大影响了核心服务质量时,可以把A的调用作为限流,避免影响核心服务。服务降级部署在服务箱,当服务提供者A提供的处理能力下降时,可以做降级处理,这样即使A的服务失败了,也不影响服务消费者正常的全流程的业务处理。弹性伸缩是根据每个服务的CPU、LOAD、RT三个指标做应用的自动扩容或缩容,以及应用扩容规则和缩容规则一站式设置。

容灾解决方案

5

保证线上业务的稳定运行离不开业务连接性机制,除分布式框架能力之外,还包括前端流量控制以及数据层数据的切换技术。大部分银行都要求有比较高的业务连续性,所以阿里云在底层平台提供了一键切换的工具,主要针对网络层、持久化层进行一键切换,保证当故障发生后能够快速切换,节省RTO时间。对于大型银行考虑采用异地多活技术,每个独立单元都能够运行一部分客户的业务,当一个单元发生故障时能够进行快速的切换。

相关文章
|
23天前
|
弹性计算 运维 监控
阿里云云服务诊断工具:合作伙伴架构师的深度洞察与优化建议
作为阿里云的合作伙伴架构师,我深入体验了其云服务诊断工具,该工具通过实时监控与历史趋势分析,自动化检查并提供详细的诊断报告,极大提升了运维效率和系统稳定性,特别在处理ECS实例资源不可用等问题时表现突出。此外,它支持预防性维护,帮助识别潜在问题,减少业务中断。尽管如此,仍建议增强诊断效能、扩大云产品覆盖范围、提供自定义诊断选项、加强教育与培训资源、集成第三方工具,以进一步提升用户体验。
665 243
|
3天前
|
存储 Prometheus Cloud Native
分布式系统架构6:链路追踪
本文深入探讨了分布式系统中的链路追踪理论,涵盖追踪与跨度的概念、追踪系统的模块划分及数据收集的三种方式。链路追踪旨在解决复杂分布式系统中请求流转路径不清晰的问题,帮助快速定位故障和性能瓶颈。文中介绍了基于日志、服务探针和边车代理的数据收集方法,并简述了OpenTracing、OpenCensus和OpenTelemetry等链路追踪协议的发展历程及其特点。通过理解这些概念,可以更好地掌握开源链路追踪框架的使用。
56 41
|
13天前
|
设计模式 存储 算法
分布式系统架构5:限流设计模式
本文是小卷关于分布式系统架构学习的第5篇,重点介绍限流器及4种常见的限流设计模式:流量计数器、滑动窗口、漏桶和令牌桶。限流旨在保护系统免受超额流量冲击,确保资源合理分配。流量计数器简单但存在边界问题;滑动窗口更精细地控制流量;漏桶平滑流量但配置复杂;令牌桶允许突发流量。此外,还简要介绍了分布式限流的概念及实现方式,强调了限流的代价与收益权衡。
57 11
|
8天前
|
机器学习/深度学习 分布式计算 数据挖掘
MaxFrame 性能评测:阿里云MaxCompute上的分布式Pandas引擎
MaxFrame是一款兼容Pandas API的分布式数据分析工具,基于MaxCompute平台,极大提升了大规模数据处理效率。其核心优势在于结合了Pandas的易用性和MaxCompute的分布式计算能力,无需学习新编程模型即可处理海量数据。性能测试显示,在涉及`groupby`和`merge`等复杂操作时,MaxFrame相比本地Pandas有显著性能提升,最高可达9倍。适用于大规模数据分析、数据清洗、预处理及机器学习特征工程等场景。尽管存在网络延迟和资源消耗等问题,MaxFrame仍是处理TB级甚至PB级数据的理想选择。
35 4
|
16天前
|
设计模式 监控 Java
分布式系统架构4:容错设计模式
这是小卷对分布式系统架构学习的第4篇文章,重点介绍了三种常见的容错设计模式:断路器模式、舱壁隔离模式和重试模式。断路器模式防止服务故障蔓延,舱壁隔离模式通过资源隔离避免全局影响,重试模式提升短期故障下的调用成功率。文章还对比了这些模式的优缺点及适用场景,并解释了服务熔断与服务降级的区别。尽管技术文章阅读量不高,但小卷坚持每日更新以促进个人成长。
43 11
|
17天前
|
消息中间件 存储 安全
分布式系统架构3:服务容错
分布式系统因其复杂性,故障几乎是必然的。那么如何让系统在不可避免的故障中依然保持稳定?本文详细介绍了分布式架构中7种核心的服务容错策略,包括故障转移、快速失败、安全失败等,以及它们在实际业务场景中的应用。无论是支付场景的快速失败,还是日志采集的安全失败,每种策略都有自己的适用领域和优缺点。此外,文章还为技术面试提供了解题思路,助你在关键时刻脱颖而出。掌握这些策略,不仅能提升系统健壮性,还能让你的技术栈更上一层楼!快来深入学习,走向架构师之路吧!
53 11
|
16天前
|
分布式计算 大数据 数据处理
技术评测:MaxCompute MaxFrame——阿里云自研分布式计算框架的Python编程接口
随着大数据和人工智能技术的发展,数据处理的需求日益增长。阿里云推出的MaxCompute MaxFrame(简称“MaxFrame”)是一个专为Python开发者设计的分布式计算框架,它不仅支持Python编程接口,还能直接利用MaxCompute的云原生大数据计算资源和服务。本文将通过一系列最佳实践测评,探讨MaxFrame在分布式Pandas处理以及大语言模型数据处理场景中的表现,并分析其在实际工作中的应用潜力。
53 2
|
24天前
|
运维 Kubernetes 调度
阿里云容器服务 ACK One 分布式云容器企业落地实践
阿里云容器服务ACK提供强大的产品能力,支持弹性、调度、可观测、成本治理和安全合规。针对拥有IDC或三方资源的企业,ACK One分布式云容器平台能够有效解决资源管理、多云多集群管理及边缘计算等挑战,实现云上云下统一管理,提升业务效率与稳定性。
|
27天前
|
存储 算法 安全
分布式系统架构1:共识算法Paxos
本文介绍了分布式系统中实现数据一致性的重要算法——Paxos及其改进版Multi Paxos。Paxos算法由Leslie Lamport提出,旨在解决分布式环境下的共识问题,通过提案节点、决策节点和记录节点的协作,确保数据在多台机器间的一致性和可用性。Multi Paxos通过引入主节点选举机制,优化了基本Paxos的效率,减少了网络通信次数,提高了系统的性能和可靠性。文中还简要讨论了数据复制的安全性和一致性保障措施。
36 1
|
2月前
|
NoSQL Java 数据处理
基于Redis海量数据场景分布式ID架构实践
【11月更文挑战第30天】在现代分布式系统中,生成全局唯一的ID是一个常见且重要的需求。在微服务架构中,各个服务可能需要生成唯一标识符,如用户ID、订单ID等。传统的自增ID已经无法满足在集群环境下保持唯一性的要求,而分布式ID解决方案能够确保即使在多个实例间也能生成全局唯一的标识符。本文将深入探讨如何利用Redis实现分布式ID生成,并通过Java语言展示多个示例,同时分析每个实践方案的优缺点。
70 8

热门文章

最新文章